print logo

Sprachsteuerung: Google macht das iPhone zum Super-Handy

Gunnar Sohn | 20.11.2008
Mountain View/Berlin, November 2008, www.ne-na.de – Anfang des Jahres wurde auf der Call Center World http://www.callcenterworld.de in Berlin noch darüber spekuliert, wie die Sprachdialogszene am Super-Handy bastelt: Fortschrittliche Mensch-Maschine-Schnittstellen wie Spracherkennung oder Gestensteuerung könnten aus dem Handy eine Steuerzentrale für Online-Inhalte machen und neue Geschäftsmodelle eröffnen: Sprachdialogsysteme sind nach Auffassung von Lupo Pape, Geschäftsführer des Berliner Unternehmens SemanticEdge http://www.semanticedge.de, ein wichtiger Baustein für das Super-Handy der Zukunft: „Wie häufig hätten wir gerne im Alltag genaue Informationen zu Sportergebnissen, Telefonnummern oder Adressen. Unendlich viele Dinge, die wir, wenn wir gerade im Internet wären, sofort über Google abrufen würden. Da das aber in der Freizeit und von unterwegs selten der Fall ist und der Zugriff über das Handy mit Tastatur oder Touchscreen zu mühselig ist, verzichten wir meistens darauf, unseren Wissenshunger sofort zu stillen. Anders wäre es, wenn wir mit einfachen gesprochenen Suchbefehlen unsere Anfrage starten und die Suche dann bei Bedarf eingrenzen könnten, genauso, wie wir es derzeitig mit der PC-Tastatur und Maus tun und das ganze jederzeit und von jedem Ort aus”, erklärte Pape in Berlin.



Am Wochenende wurde bekannt, dass das keine Zukunftsvisionen mehr sind: Google bringt die Sprachsteuerungstechnik auf das iPhone http://de.youtube.com/watch?v=GQ3Glr5Ff28. Nutzer der frei abrufbaren Anwendung müssen nur das Telefon an ihr Ohr halten und können dann praktisch jegliche Art von Fragen stellen, wie beispielsweise „Wo finde ich den nächst gelegenen Starbucks?“ oder „Wie hoch ist der Mount Everest?” Der Sprachlaut wird in eine digitale Datei konvertiert und anschließend an die Server von Google weitergeleitet. Die Suchergebnisse schließen zum Teil lokale Informationen mit ein. Dabei nutzt man die iPhone-Funktionen für die Bestimmung des konkreten Standorts. Die Fähigkeit, fast jeden gesprochenen Satz von einer x-beliebigen Person identifizieren zu können, war lange Zeit das höchste Ziel der Forscher für Künstlichen Intelligenz. Das Management von Google hat noch nicht kommuniziert, wann der Service ausgereift sein soll. Die Verantwortlichen sagten nur, dass der Service zumindest akkurat genug ist, um den Nutzern den großen Vorteil zu bieten, nicht mehr wie bisher ihre Anfragen auf der Bildschirm-Tastatur ihres iPhones eintippen zu müssen.



Der Service kann genutzt werden, um Restaurant-Empfehlungen und Anfahrtsbeschreibungen zu erhalten, oder aber um Kontaktadressen aus dem Adressverzeichnis abzurufen. Auf die Frage “Welches ist das beste Pizza-Restaurant in Noe Valley?” würde das Google-System beispielsweise mit einer Liste von drei Restaurants in der Nachbarschaft von San Francisco reagieren, jede einzelne mit Sterne-Kategorie-Beurteilungen der Google-Nutzer und weiterführenden Links, durch die man Telefonnummern und Wegbeschreibungen anklicken kann.



Für Google ist die Technologie von entscheidender Bedeutung, um den nächsten Ansturm auf die Werbewelt vorzubereiten. Das Management kommentierte dies mit der Aussage, dass man durch lokale Anfragen beispielsweise höhere Werbekostensätze von Unternehmen aus der Region verlangen könne, obgleich der Verkauf einer solchen Werbeform bisher nicht Bestandteil ihres Portfolios sei. Wie auch bei den übrigen Produkten von Google ist dieser Service für die Nutzer frei verfügbar. Außerdem plant das Unternehmen, den Service später auch anderen Telefonsystemen zur Verfügung zu stellen. „Durch die Aspekte ‘Standort’ und ‘Sprache’ erhöhen wir gegenüber den Werbeträgern den Service-Nutzen auf dramatische Weise,” erklärte Vic Gundotra, Ex-Manager von Microsoft und nunmehr verantwortlich für das Mobile Business bei Google. Gundotra wies darauf hin, dass Google es geschafft hätte, das doppelte Problem der Informationseingabe und der Informationsabfrage für mobile Endgeräte erfolgreich zu lösen. „Diese zwei zusammenhängenden Probleme auf Weltklasse-Niveau zu lösen, ist unser oberstes Ziel“, erklärte Gundotra. Die neue iPhone-Suchmöglichkeit ist nicht das erste Sprachdialog-System von Google. Schon im März hatte das Unternehmen verlauten lassen, dass der Auskunftsdienst GOOG-411 bereits zu einem reellen Produkt herangereift sei. Die Erfahrungswerte und Dateninformationen, die es durch das GOOG-411 gewinnen konnte, wurden für die Entwicklung für das iPhone herangezogen. Die neue Dienstleistung ist nach Expertenmeinung ein gutes Beispiel dafür, wie Google es schafft, elementare Informatik-Forschung mit Produkttechnik zu verbinden. Um dies zu erreichen, wurden einige der besten Spracherkennungs-Forscher der Welt engagiert. Die Teams in New York, London und Mountain View bearbeiten die Problematik aus unterschiedlichen Blickwinkeln.



Wer von den Suchanbietern das Rennen um die Hoheit beim mobilen Internet gewinnen wird, hängt nach Auffassung von Voice Days-Sprecher Bernhard Steimel http://www.voicedays.de davon ab, wer den „Kampf um die besten Köpfe“ mit der größten Marktmacht verbinden kann. „Den Kampf um die Köpfe hat Google bereits gewonnen – besonders durch die Art von Google, immer alles neu zu entwickeln und die geniale Strategie, mit GOOG411 im weltgrößten ‚Freiland-Versuch’ das eigene Sprachmodell zu validieren und mit einer exzellenten Qualität aufzuwarten“.









Redaktion

NeueNachricht

Gunnar Sohn

Ettighoffer Straße 26a

53123 Bonn

Tel: 0228 – 6204474

Mobil: 0177 – 620 44 74

E-Mail: medienbuero@sohn.de; www.ne-na.de



Img of Gunnar Sohn
Über Gunnar Sohn

Gunnar Sohn ist Freiberufler und u.a. Wirtschaftspublizist, Buchautor, Blogger, Medienberater, Moderator und Kolumnist.