print logo

Voice Search Conference: Text und Sprache verschmelzen bei Internet-Suchfunktionen

Mobile Geräte als intelligente Ratgeber
Gunnar Sohn | 13.03.2008
San Diego/Berlin, 12. März 2008, www.ne-na.de – Spracherkennungssysteme werden nach Ansicht von William S. Meisel, Herausgeber der Speech Strategy News http://www.tmaa.com/sru/index.htm für die Suche im Internet immer wichtiger. „Brancheninformationen, Nachrichten, Aktienkurse, Straßenverkehr, Routenpläne, Wetter oder aktuelle Kinofilme können über ein mehrstufiges Voice Menü navigiert und abgefragt werden. Ein Alleinstellungsmerkmal dieser zentralen Anwendungen ist der schnelle Zugang zu den gesuchten Informationen. Die Navigation ist wesentlich einfacher“, so Meisel auf der Voice Search Conference http://www.voicesearchconference.com in San Diego. Eine weitere Variante der Anwendungen, die als Teil der Voice Search betrachtet werden könne, ist das Wählen durch Ansage eines Namens, das sogenannte Voice Dialing. „Zum Einsatz kommt das beispielsweise bei der Suche nach einer Kontaktadresse im Telefonverzeichnis. Das System rubriziert nach Namen, bei der zuerst der Eintrag bestätigt werden muss, bevor der Anruf durchgestellt werden kann. Directory Assistance greift auf eine sehr lange Namensliste zurück, während das Voice Dialing auf den Mobiltelefonen normalerweise eine weitaus kürzere Liste nutzt, in der Regel ein persönliches Directory“, erklärte Meisel.



SemanticEdge-Geschäftsführer Lupo Pape http://www.semanticedge.de betonte in seiner Rede in San Diego, wie man Sprachautomatisierung für mobile Anwendungen einsetzen könne. „Wer kennt das nicht: Unterwegs im Auto wäre es eigentlich an der Zeit, einen wichtigen Anruf zu tätigen. Die Nummer ist allerdings gerade nicht verfügbar oder ein Zugriff auf das Adressbuch des Handys nicht gefahrlos möglich - der Anruf wird daher verschoben. Unter dem Strich nicht nur ärgerlich, sondern für Firmen auch teuer. Denn zusammengerechnet entstehen für mobile Mitarbeiter durch vergleichbare Versäumnisse jährlich beträchtliche Zeitverluste. Durch moderne Sprachdialogsysteme soll sich das ändern“, sagte Pape. Der Berliner Sprachdialogexperte prognostiziert, dass innovative Sprachanwendungen sich zu einem ständigen virtuellen Begleiter für mobile Menschen entwickeln. Sein Unternehmen arbeitet an entsprechenden Software-Lösungen. Virtuelle persönliche Assistenten sollen dabei nicht nur per Spracherkennung Telefonverbindungen herstellen und das SMS-Diktat auf dem Handy ermöglichen, sondern in Verbindung mit einem Service wie Wikipedia oder Google auf anspruchsvollere Fragen wie „Wer war Simone de Beauvoir?“ oder „Wo ist das nächste Starbucks-Cafe?“ Antwort geben.



Eine andere Möglichkeit beginne mit einer Textanfrage. „Auch unter dem Namen ‚Audio Search’ bekannt, durchsucht diese Variante Audios nach Sprachmodulen oder Audiotracks und transformiert sie in einen durchsuchbaren Content. Man kann damit feststellen, an welcher Stelle in einem Video oder Podcast ein spezielles Themengebiet erwähnt wird. Firmen können so archivierte Audio- oder Videoinhalte in nutzbarere Informationen umwandeln, während die Medienunternehmer von der vereinfachten Nutzung ihrer Archive profitieren“, führte Meisel weiter aus. Voice Search ist nach seiner Ansicht bei all jenen Kategorien anwendbar, die Spracherkennungssysteme nutzen, um einen schnellen Zugang zu Informationen und Transaktionen zu bekommen. Durch den Reifegrad der Sprachtechnologie seien die System mittlerweile für den Markt verfügbar.



„Vorteilhaft ist, dass durch Einsatz der Voice Search die Unterschiede zwischen den Text-basierten Anwendungen und den Voice-Anwendungen immer geringer werden. In der Vergangenheit wurden beide Anwendungen zumeist als komplett voneinander abgekoppelte Einheiten betrachtet. So verdanken Web-basierte Anwendungen wie beispielsweise die E-mail einen großen Teil ihres Erfolgs der Leichtigkeit beim scannen und durchsuchen von Texten, um bestimmte Contents und Files zu finden“, resümierte Meisel. Dabei gehe das Textscannen mittlerweile viel schneller als das Abhören eines Voice-File. Spracherkennungssysteme könnten Voice Files in scannbare Texte umwandeln oder Voice Files mit bestimmten Inhalten schnell und unkompliziert abrufen. In Anwendungen, bei denen der Voice Input sofort in Text umgewandelt werde, wie beispielsweise beim Diktat einer E-Mail auf einem kleinen Gerät, sei der Synergieeffekt zwischen den beiden Formen evident.



Redaktion
medienbüro.sohn
Ettighoffer Straße 26 A
53123 Bonn
Tel: 0228 – 620 44 74
Fax: 0228 – 620 44 75
Mobil: 0177 620 44 74
medienbuero@sohn.de;
http://www.ne-na.de



Img of Gunnar Sohn
Über Gunnar Sohn

Gunnar Sohn ist Freiberufler und u.a. Wirtschaftspublizist, Buchautor, Blogger, Medienberater, Moderator und Kolumnist.