Page 76 - ABB Review 4-18
P. 76
76
ABB REVIEW
76 ABB REVIEW BUZZWORD DEMYSTIFIER
—
LE MOT DU MOMENT
Text mining
Non structurée et stockée dans des formats
de documents variés, l’information reste
souvent inaccessible. L’exploration de
données textuelles, ou text mining, permet
d’extraire ce filon pour lui donner du sens
et de la valeur.
01
Dans les entreprises, jusqu’à 80 % des L’exploration des données textuelles fait appel
données seraient stockés au format texte, non à diverses disciplines : extraction d’informations,
structuré. Cahiers des charges, dossiers de data mining, apprentissage automatique,
vente, spécifications techniques, rapports de statistique et linguistique informatique.
maintenance, avis et réponses des utilisateurs Ces techniques permettent d’extraire des
sont ainsi sous-exploités. À la différence des connaissances (faits, règles et relations) et de
méthodes traditionnelles d’analyse de données, traiter automatiquement des informations sinon
Raoul Jetley le text mining parvient à tirer des connaissances inexploitables sous leur forme textuelle d’origine.
ABB Corporate Research
Bangalore (Inde) de ces informations disparates →1.
raoul.jetley@in.abb.com
Pour simplifier, le text mining est un ensemble de
traitements visant à transformer les documents
—
01 La documentation et ressources textuels non structurés en données
d’une entreprise recèle structurées et signifiantes ; celles-ci sont
nombre d’informations
précieuses mais peu ensuite exploitables automatiquement, à l’aide
accessibles ; le data de techniques issues de la statistique, de la
mining exploite ce filon.
linguistique et de la reconnaissance de formes,
— à des fins de modélisation et de prédiction.
02 En donnant du sens
à des données a priori
inexploitables, le text
mining soutient la
vente, le marketing,
l’informatique 02
décisionnelle, les
décisions d’achat ou
d’investissement, la
connaissance client, etc.