Text Mining - Mehrwert durch Mehrsprachigkeit
Im Zeitalter der digitalen Datenexplosion wird es für Analysten und Entscheider immer wichtiger, den Überblick zu behalten. Was kauft der Kunde? Wie verhält sich der Wettbewerb? Welche Veränderungen durchlaufen die Märkte? Und das natürlich weltweit. Gerade die Kundensicht ist für Entscheider heutzutage von größter Bedeutung. Laut einer 2012 von IBM durchgeführten Umfrage gaben 73 Prozent an, im Jahr 2013 massiv in „Customer Insights“ zu investieren.
Das Web 2.0 hat dazu geführt, dass Kunden und Interessenten weitaus größere Möglichkeiten haben, sich tagtäglich online auszudrücken und wie hier zu sehen ist, machen sie davon Gebrauch.
Im Bereich der Competitive Intelligence erleichtert die Digitalisierung von Daten das Aufspüren von Umsatzpotential oder Marktrisiken ebenfalls ungemein. Geschäftsberichte, Analystenmeldungen, Pressemitteilungen oder Interviews stehen in Form von unstrukturierten Texten im Internet zur Auswertung mit Text-Mining-Werkzeugen bereit.
Was kann Text Mining leisten?
Dr. Hajo Hippner und Dipl.-Kfm. René Rentzmann haben sich für die Gesellschaft für Informatik (GI) dem Thema Text Mining angenommen.
„Aufgrund von zwei Faktoren lässt sich dem Text Mining ein großes Potenzial unterstellen: Auf der einen Seite liegt ein Großteil der Informationen in Form von Textdokumenten vor. Schätzungen zufolge sogar über 80% (Gentsch/Hänlein 1999, S. 1646). Auf der anderen Seite wird Wissen über Kunden, Märkte und Wettbewerber ein immer bedeutenderer Erfolgsfaktor für Unternehmen, um im Wettbewerb bestehen zu können. Vor diesem Hintergrund kann eine Erweiterung der Analysebasis um Textdokumente von großem Nutzen sein.“
Dabei setzen die beiden Dozenten der Wirtschaftswissenschaftlichen Fakultät der Katholischen Universität Eichstätt-Ingolstadt auf diesen Prozess: Aufgabendefinition, Dokumentenselektion, Dokumentenaufbereitung, Text-Mining-Methoden, Interpretation und Evaluation sowie Anwendung.
Mehrsprachigkeit in die Dokumentenselektion und -aufbereitung integrieren
Soll das Text Mining globale Ergebnisse für alle Märkte bringen, in denen ein Unternehmen aktiv ist, werden zusätzliche Schritte in den Text-Mining-Prozess eingebaut. Bei der Dokumentenselektion muss sichergestellt werden, dass die zu analysierenden Dokumententypen (z. B. E-Mails, Formulare, Berichte) nicht nur aus einem Sprachraum ausgewählt werden, sondern alle relevanten Sprachregionen abdecken.
Das führt zum nächsten Schritt, der Datenaufbereitung. Bevor die eigentlichen Text-Mining-Methoden zum Einsatz kommen, müssen alle Dokumente in eine Arbeitssprache gebracht werden. Zur Unterstützung bieten sich zwei Werkzeuge aus dem Bereich der Sprachtechnologie an: Terminologiemanagement-Software und maschinelle Übersetzung.
Terminologie und maschinelle Übersetzung
Mit Terminologiearbeit ist die Planung, Erarbeitung, Bearbeitung, Verarbeitung und Verbreitung eines Fachwortschatzes in einer oder mehreren Sprachen gemeint. Für das Text Mining ist Terminologie dahingehend von Bedeutung, dass bestimmte unternehmens- oder branchenspezifische Benennungen oder Eigennamen erfasst und immer korrekt wiedergegeben werden. Der Faktor Terminologie spielt im Hinblick auf Text Mining im internationalen Umfeld eine entscheidende Rolle.
Anders als Humanübersetzung liefert maschinelle Übersetzung keine vollständig sprachlich korrekte Übersetzung, sondern dient dazu, den Inhalt eines Textes sofort grundsätzlich verstehen zu können. Im Fall von Text Mining reicht diese Qualitätsstufe vollkommen aus, um die Vorteile der Analysemethoden nutzen zu können. Damit gewährleistet ist, dass maschinelle Übersetzung für den Anwendungsfall Text Mining genügend präzise Ergebnisse erzeugt, kann die Basis-Technologie um Terminologielisten erweitert werden. So wird erreicht, dass der Maschine keine Irrtümer unterlaufen, wie beispielsweise die Übersetzung des Namens des Softwareherstellers Apple.
Auswirkungen auf Geschäftsentscheidungen
Nach Angaben der Analysten-Gruppe Gartner unterstützen nur 34 Prozent der Werkzeuge im Bereich Text Mining mehrere Sprachen. Innerhalb dieser evaluierten Gruppe bieten die meisten lediglich wenige Fremdsprachen an. Grund genug für Unternehmen, eigene Lösungen zu entwickeln, denn liegen Informationen erst einmal in einer Analysesprache vor, können Text-Mining-Werkzeuge ihr volles Potential entfalten und ermöglichen einen umfassenden Überblick auf die Kunden-, Markt- und Wettbewerbssituation eines Unternehmens.
Das Web 2.0 hat dazu geführt, dass Kunden und Interessenten weitaus größere Möglichkeiten haben, sich tagtäglich online auszudrücken und wie hier zu sehen ist, machen sie davon Gebrauch.
Im Bereich der Competitive Intelligence erleichtert die Digitalisierung von Daten das Aufspüren von Umsatzpotential oder Marktrisiken ebenfalls ungemein. Geschäftsberichte, Analystenmeldungen, Pressemitteilungen oder Interviews stehen in Form von unstrukturierten Texten im Internet zur Auswertung mit Text-Mining-Werkzeugen bereit.
Was kann Text Mining leisten?
Dr. Hajo Hippner und Dipl.-Kfm. René Rentzmann haben sich für die Gesellschaft für Informatik (GI) dem Thema Text Mining angenommen.
„Aufgrund von zwei Faktoren lässt sich dem Text Mining ein großes Potenzial unterstellen: Auf der einen Seite liegt ein Großteil der Informationen in Form von Textdokumenten vor. Schätzungen zufolge sogar über 80% (Gentsch/Hänlein 1999, S. 1646). Auf der anderen Seite wird Wissen über Kunden, Märkte und Wettbewerber ein immer bedeutenderer Erfolgsfaktor für Unternehmen, um im Wettbewerb bestehen zu können. Vor diesem Hintergrund kann eine Erweiterung der Analysebasis um Textdokumente von großem Nutzen sein.“
Dabei setzen die beiden Dozenten der Wirtschaftswissenschaftlichen Fakultät der Katholischen Universität Eichstätt-Ingolstadt auf diesen Prozess: Aufgabendefinition, Dokumentenselektion, Dokumentenaufbereitung, Text-Mining-Methoden, Interpretation und Evaluation sowie Anwendung.
Mehrsprachigkeit in die Dokumentenselektion und -aufbereitung integrieren
Soll das Text Mining globale Ergebnisse für alle Märkte bringen, in denen ein Unternehmen aktiv ist, werden zusätzliche Schritte in den Text-Mining-Prozess eingebaut. Bei der Dokumentenselektion muss sichergestellt werden, dass die zu analysierenden Dokumententypen (z. B. E-Mails, Formulare, Berichte) nicht nur aus einem Sprachraum ausgewählt werden, sondern alle relevanten Sprachregionen abdecken.
Das führt zum nächsten Schritt, der Datenaufbereitung. Bevor die eigentlichen Text-Mining-Methoden zum Einsatz kommen, müssen alle Dokumente in eine Arbeitssprache gebracht werden. Zur Unterstützung bieten sich zwei Werkzeuge aus dem Bereich der Sprachtechnologie an: Terminologiemanagement-Software und maschinelle Übersetzung.
Terminologie und maschinelle Übersetzung
Mit Terminologiearbeit ist die Planung, Erarbeitung, Bearbeitung, Verarbeitung und Verbreitung eines Fachwortschatzes in einer oder mehreren Sprachen gemeint. Für das Text Mining ist Terminologie dahingehend von Bedeutung, dass bestimmte unternehmens- oder branchenspezifische Benennungen oder Eigennamen erfasst und immer korrekt wiedergegeben werden. Der Faktor Terminologie spielt im Hinblick auf Text Mining im internationalen Umfeld eine entscheidende Rolle.
Anders als Humanübersetzung liefert maschinelle Übersetzung keine vollständig sprachlich korrekte Übersetzung, sondern dient dazu, den Inhalt eines Textes sofort grundsätzlich verstehen zu können. Im Fall von Text Mining reicht diese Qualitätsstufe vollkommen aus, um die Vorteile der Analysemethoden nutzen zu können. Damit gewährleistet ist, dass maschinelle Übersetzung für den Anwendungsfall Text Mining genügend präzise Ergebnisse erzeugt, kann die Basis-Technologie um Terminologielisten erweitert werden. So wird erreicht, dass der Maschine keine Irrtümer unterlaufen, wie beispielsweise die Übersetzung des Namens des Softwareherstellers Apple.
Auswirkungen auf Geschäftsentscheidungen
Nach Angaben der Analysten-Gruppe Gartner unterstützen nur 34 Prozent der Werkzeuge im Bereich Text Mining mehrere Sprachen. Innerhalb dieser evaluierten Gruppe bieten die meisten lediglich wenige Fremdsprachen an. Grund genug für Unternehmen, eigene Lösungen zu entwickeln, denn liegen Informationen erst einmal in einer Analysesprache vor, können Text-Mining-Werkzeuge ihr volles Potential entfalten und ermöglichen einen umfassenden Überblick auf die Kunden-, Markt- und Wettbewerbssituation eines Unternehmens.