Page 77 - ABB Review 4-18
P. 77
04|2018 ARTICLE TITLETEXT MINING 77
04|2018
77
l’algorithme parcourt les unités textuelles
à la recherche d’informations, organise et stocke
les résultats, facilitant les analyses futures ;
• Choix des briques conceptuelles et des
catégories à modéliser : les données non
structurées fourmillent généralement de
concepts différents. Il s’agit donc d’identifier
les catégories de données et les relations les
plus pertinentes, qui permettent de construire
des modèles ;
• Analyse des données structurées pour identifier
des relations entre concepts : le text mining
rejoint ici le traditionnel data mining, avec son
cortège de techniques telles que catégorisation
(clustering), prédiction et classification.
—
Le text mining est un ensemble
de traitements visant à
transformer les documents
et ressources non structurés
Une opération de text mining classique comporte en données structurées.
les étapes suivantes :
• Identification et traitement préliminaire du L'exploration textuelle se prête particulièrement
texte à analyser : élimination des informations à la reconnaissance de noms propres, aux résumés
inutiles, découpage en unités textuelles et automatiques, à la catégorisation sur la base de
identification des structures grammaticales critères pertinents et à l’analyse des sentiments
de la langue utilisée ; et avis exprimés dans les demandes ou retours
• Extraction des informations pertinentes et
transformation en données structurées : clients →2. l
—
Publication ABB
— — — —
Rédaction Édition Impression Avertissement Les entreprises du
ABB Review est publiée Pour vous abonner, Vorarlberger Les avis exprimés dans Groupe ABB n’apportent
Bazmi Husain par ABB Group R&D contactez votre Verlagsanstalt GmbH la présente publication aucune caution ou
Chief Technology Officer and Technology. correspondant ABB 6850 Dornbirn (Autriche) n’engagent que leurs garantie, ni ne prennent
Group R&D and Technology ou souscrivez en ligne auteurs et sont donnés aucun engagement,
ABB Switzerland Ltd. sur www.abb.com/ — uniquement pour formel ou implicite,
Adrienne Williams ABB Review abbreview. Maquette information. Le lecteur concernant le contenu ou
Senior Sustainability Segelhofstrasse 1K DAVILLA AG ne devra en aucun cas l’exactitude des opinions
Advisor CH-5405 Baden-Daettwil L’impression ou Zurich (Suisse) agir sur la base de ces exprimées dans la
Suisse la reproduction partielle écrits sans consulter présente publication.
Christoph Sieder abb.review@ch.abb.com d’articles est autorisée — un professionnel. Il
Head of Corporate sous réserve d’en PAO est entendu que les ISSN: 1013-3119
Communications ABB Review paraît indiquer l’origine. Konica Minolta auteurs ne fournissent
quatre fois par an La reproduction d’articles Marketing Services aucun conseil ou point abb.com/abbreview
Reiner Schoenrock en anglais, français, complets requiert WC1V 7PB Londres de vue technique ou
Technology and Innovation allemand et espagnol. l’autorisation écrite (Royaume-Uni) professionnel sur aucun
Communications La revue est diffusée de l’éditeur. fait ni sujet spécifique,
gratuitement à tous ceux — et déclinent toute
Roland Weiss et celles qui s’intéressent Édition et droits d’auteur Traduction française responsabilité sur
R&D Strategy Manager à la technologie et à ©2018 Cléa Blanchard leur utilisation.
Group R&D and Technology la stratégie d’ABB. ABB Switzerland Ltd. clea.blanchard@
Baden (Suisse) gmail.com
Andreas Moglestue
Chief Editor, ABB Review
andreas.moglestue@
ch.abb.com
Fin de la version mobile Gardez le contact
La publication d’ABB Review sur tablette (iOS et Android) Pour ne pas manquer un numéro, abonnez-vous
s’arrêtera fin 2018. Nos lecteurs sont invités à consulter les à la liste de diffusion sur www.abb.com/abbreview.
versions PDF ou en ligne disponibles sur abb.com/abbreview.
Dès votre demande enregistrée, vous recevrez un
e-mail vous invitant à confirmer votre abonnement.