Page 76 - ABB Review 4-18
P. 76

76
                           ABB REVIEW
          76               ABB REVIEW                                  BUZZWORD DEMYSTIFIER

         —



         LE MOT DU MOMENT
         Text mining







         Non structurée et stockée dans des formats

         de documents variés, l’information reste
         souvent inaccessible. L’exploration de
         données textuelles, ou text mining, permet

         d’extraire ce filon pour lui donner du sens
         et de la valeur.




                                                                       01










                           Dans les entreprises, jusqu’à 80 % des      L’exploration des données textuelles fait appel
                           données seraient stockés au format texte, non   à diverses disciplines : extraction d’informations,
                           structuré. Cahiers des charges, dossiers de   data mining, apprentissage automatique,
                           vente, spécifications techniques, rapports de   statistique et linguistique informatique.
                           maintenance, avis et réponses des utilisateurs   Ces techniques permettent d’extraire des
                           sont ainsi sous-exploités. À la différence des   connaissances (faits, règles et relations) et de
                           méthodes traditionnelles d’analyse de données,    traiter automatiquement des informations sinon
         Raoul Jetley      le text mining parvient à tirer des connaissances   inexploitables sous leur forme textuelle d’origine.
         ABB Corporate Research
         Bangalore (Inde)  de ces informations disparates →1.
         raoul.jetley@in.abb.com
                           Pour simplifier, le text mining est un ensemble de
                           traitements visant à transformer les documents
         —
         01 La documentation   et ressources textuels non structurés en données
         d’une entreprise recèle   structurées et signifiantes ; celles-ci sont
         nombre d’informations
         précieuses mais peu   ensuite exploitables automatiquement, à l’aide
         accessibles ; le data   de techniques issues de la statistique, de la
         mining exploite ce filon.
                           linguistique et de la reconnaissance de formes,
         —                 à des fins de modélisation et de prédiction.
         02 En donnant du sens
         à des données a priori
         inexploitables, le text
         mining soutient la
         vente, le marketing,
         l’informatique             02
         décisionnelle, les
         décisions d’achat ou
         d’investissement, la
         connaissance client, etc.
   71   72   73   74   75   76   77   78   79   80