print logo

Bessere Daten dank intelligenter Algorithmen

Uniserv arbeitet mit Startups an Deep-Learning-Lösungen, um Geschäftspartnerdaten zu optimieren.
UNISERV GmbH | 07.02.2019
Jedes vierte Unternehmen in Deutschland ist aktuell an Künstlicher Intelligenz (KI) interessiert. Gleichzeitig entwickeln sich Unternehmen zunehmend zu einer datengesteuerten Organisation. So stellt sich die Frage: Wie können Unternehmen aus geschäftlichen Daten und mithilfe von KI, also intelligenten Algorithmen, einen Mehrwert ziehen? Genau diese Aufgabe stellte Uniserv, spezialisierter Anbieter von Lösungen für das Kundendatenmanagement, verschiedenen europäischen Startups im Rahmen der Data-Pitch-Initiative. Nun liegen die Ergebnisse der Initiative vor.

Deep-Learning-Lösung erlaubt bessere Verarbeitung von Daten


Die Startups recogn.ai und frosha.io entwickelten im Auftrag von Uniserveine lernfähige maschinelle Lösung. Diese kann unstrukturierte und semistrukturierte Geschäftspartnerdaten aus verschiedenen unternehmensinternen und externen Quellen zusammenführen – und einen Mehrwert aus den Daten generieren. Bisher ist dies Unternehmen nicht oder nur sehr aufwendig möglich. Oft erfolgen die Datenaufbereitung und Zusammenführung noch manuell. Um Organisationen diese Aufgabe zu erleichtern, setzen beide Startups verschiedene Technologien der Künstlichen Intelligenz ein und ihrem Teilgebiet, dem maschinellen Lernen.

Anwender müssen keine Datenexperten sein


Die Lösung von recogn.ai setzt auf eine Kombination aus verschiedenen neuronalen Netzwerken. Diese sind darauf spezialisiert, Text und semistrukturierte Daten zu verarbeiten. Hinzukommen Cloud- und Such-Technologien für maschinelles Lernen sowie Datenerfassung (Data Ingestion) und Datenexploration. Unter Verwendung der neuronalen Netze des Deep Learnings versetzt sich eine Maschine selbst in die Lage, Strukturen zu erkennen, zu evaluieren und sich in mehreren Durchläufen selbständig zu verbessern. Auf diese Weise gelingt es der Technologie, selbst unstrukturierte Geschäftspartnerdatensätze unter anderem für Marketingmaßnahmen nutzbar zu machen. Der gefundene Ansatz von recogn.ai bietet genügend Flexibilität, um neuronale Netze für das Datenmanagement auf Basis von Unternehmensdaten zu trainieren. Die Lösung kann auch durch das Feedback von Mitarbeitern lernen, die keine Datenexperten sind. Dies bietet vor allem den Vorteil, dass Unternehmen nicht erst ein Team von Data Scientists mit einbeziehen müssen.

Geschäftliche Daten liegen oft unstrukturiert und verteilt im Unternehmen vor


Daniel Vila Suero, CEO und Mitbegründer von recogn.ai, kommentiert die Zusammenarbeit mit Uniserv: „Die Datenerfassung und Vorverarbeitung ist normalerweise eine der kostspieligsten Aufgaben in jedem maschinellen Lernprojekt. In diesem Fall konnten wir uns jedoch mit der Hilfe von Uniserv darauf konzentrieren, mit vielen verschiedenen Ansätzen und Modellen des maschinellen Lernens zu experimentieren. Somit war es eine großartige Erfahrung, mit Uniserv zusammenzuarbeiten.“

Das Startup will seine Lösung auch nach offizieller Beendigung des Data-Pitch-Projekts gemeinsam mit Uniserv erweitern. Konkret soll die Lösung künftig auch unstrukturiertere Unternehmensinformationen verarbeiten, wie Berichte und Verträge. So können auch Informationen, die über verschiedene Datensilos verteilt sind, verbunden und sich wiederholende Aufgaben automatisiert werden.

KI-Lösungen müssen erst angelernt werden


Das Startup frosha.io entwickelte und trainierte ein KI-System, um unterschiedlichste Daten aus den vielzähligen Systemen von Unternehmen einfacher und automatisiert zusammenzuführen. So gewinnen Organisationen einen besseren Einblick in ihre Kunden, Prozesse, potenzielle Geschäftsmodelle und mögliche Zukunftstrends. Bisher mussten Unternehmen Daten sehr häufig manuell umformatieren und zusammenfassen.

froshas Ziel war es, solche Prozesse zu automatisieren und maschinenbasiert abzubilden. Dazu setzte das Startup unter anderem auf ein sogenanntes Long/Short Term Memory (LSTM) Neuronales Netz, das zeichenbasiert trainiert wird. LSTM, alsodas lange Kurzzeitgedächtnis, wird sehr oft eingesetzt, wenn es um das Verarbeiten menschlicher Sprache geht. Es hilft dabei, der KI Kontext beizubringen. Geht es etwa um Geschäftspartneradressen tragen Straßen oft den Namen von berühmten Personen. Die KI weiß somit nicht, ob der Name zu einer Person gehört oder zu einer Straße. Um hier den Kontext herzustellen, braucht es LSTM. Darüber hinaus wurde die KI mit Open Data gefüttert, um diese anzulernen und Referenzpunkte herzustellen.

Roemer Claasen, CEO und Gründer von frosha.io, erklärt: „Wir haben der KI beigebracht, welche Daten-Arten und -Strukturen in Eingabefeldern auftauchen können. Konkret sollte die KI lernen, wie sie damit umgehen soll, wenn zum Beispiel bei der Bestellungsaufgabe in einem E-Commerce-Shop Daten falsch eingegeben werden. Klingt für uns Menschen vielleicht erstmal simpel, stellt aber eine große Herausforderung an die KI dar.“

Dr. Simone Braun, Business Development bei Uniserv, ist erfreut über das Projekt: „Die Zusammenarbeit mit frosha.io und recogn.ai gestaltete sich von Anfang an sehr positiv und hochprofessionell. Innerhalb des Data-Pitch-Netzwerkes waren wir bestens verankert. Besonders spannend war die Tatsache, dass uns beide Startups auch immer wieder herausgefordert haben mit ihren Ideen, Ansätzen und Innovationen. Wechselseitig haben wir viel gelernt und setzen die Erkenntnisse gemeinsam in konkret nutzbare Mehrwerte für Anwender um.“

Über das Data-Pitch-Projekt


Data Pitch ist ein von der Europäischen Union gefördertes Inkubatoren-Programm, das Unternehmen und öffentliche Einrichtungen mit Startups aus ganz Europa vernetzt. Im Rahmen der Initiative wurde im Sommer und Herbst 2017 ein Wettbewerb veranstaltet. Bei diesem konnten Unternehmen, die sich mit der Analyse von Daten befassen, Aufgabenstellungen an Startups und KMUs vergeben. Die Initiative fördert Startups durch finanzielle Unterstützung, teilnehmende Unternehmen wiederum profitieren von neuen Ideen. Die Startups recogn.ai und frosha.io überzeugten Uniserv aus 142 Bewerbern. Die Unternehmen hatten 2018 rund sechs Monate Zeit, um eine Lösung zu entwickeln, die darauf trainiert ist, (Kunden-)Daten aus verschiedenen internen sowie externen Quellen zusammenzufügen, wie zum Beispiel Internetseiten, Open Data, Social-Media-Profilen oder E-Mails. Uniserv unterstützte die Startups als Kooperationspartner mittels Expertise sowie mit Datensätzen aus synthetischen Namens- und Adressinformationen in unstrukturierter und semistrukturierter Form. Anhand dieser konnte das Machine-Learning-System lernen.