Der Computer als Zuhörer: Sprachdialogsysteme mausern sich zum Massenprodukt
Bonn, www.ne-na.de, 24. Mai 2007 - Diktieren statt tippen, befehlen, statt mit der Maus zu klicken: Spracherkennung soll nach einem Bericht der Schweizer Zeitung „Tagesanzeiger“ http://www.tagesanzeiger.ch den Umgang mit Computern erleichtern. „Computer!“ Wenn Captain Kirk vom Raumschiff Enterprise etwas wissen wollte, dann fragte er mit lauter Stimme seinen Bordrechner. Für die Autoren der Fernsehserie stand in den Sechzigerjahren bereits fest, dass wir schon bald mit unseren Maschinen sprechen würden. Zwanzig Jahre später machten sie sich im Kinofilm „Star Trek IV – Zurück in die Gegenwart“ über mangelnde Fortschritte lustig: Nach einer Zeitreise ins San Francisco des Jahres 1986, bellt Bordtechniker Scotty in einem Airforce-Büro laut „Computer!“ – und erntet nur verständnislose Blicke seiner zeitgenössischen Helfer. Als sie ihn schliesslich zu einem Apple Macintosh führen, ergreift er zögernd die Maus wie ein Mikrofon und sagt: „Computer?“. „Heute, weitere zwanzig Jahre später, wäre ihm die Blamage vielleicht erspart geblieben. Denn soeben hat Microsoft mit Vista das erste Betriebssystem mit eingebauter Spracherkennung auf den Markt gebracht. Und mit etwas Übung gehorcht es gar aufs Wort. Seit fünfzig Jahren suchen Ingenieure Möglichkeiten, den Maschinen das Sprechen, vor allem aber das Zuhören beizubringen“, so der Tagesanzeiger.
Mittlerweile würde sich die Technik vom Nischen- zum Massenprodukt wandeln. Viele automatisierte Call Center wie die Auskunftsnummer der Swisscom werden durch gesprochene Sprache gesteuert oder reagieren auf die Frage des Anrufers mit künstlicher Stimme. „Ärzte diktieren ihre Rapporte in Computer; Satelliten-Navigationssysteme sprechen Anweisungen, Internet-Browser lesen Webseiten vor und Handys wählen auf Zuruf Mamas Festnetznummer. Aber all dies ist mit der neusten Generation von Spracherkennungssoftware kaum vergleichbar. In den letzten zwei Jahren nämlich hat die Technologie einen Quantensprung gemacht“, schreibt der Tagesanzeiger.
Heute könne schon jedes bessere Smartphone zum Diktat gebeten werden. Microsofts Gratis-Spracherkennung in Vista sei nach Einschätzung von Branchenexperten ein weiterer Katalysator für den Einsatz im Alltag. Die Potenziale für Spracheingabe bei Computern und Smart Phone sind gigantisch, weil Spracheingabe Zeit spart und gerade im PKW für mehr Sicherheit sorgt. Schon heute nutzen einige Hunderttausend Nutzer weltweit Diktiersysteme. Die Big Player tragen eine große Verantwortung bei der weiteren Verbreitung im Massenmarkt, denn die Qualität ihrer Software wird die Einstellungen und Akzeptanz neuer Eingabemedien bei Millionen von Computer- und Handy-Nutzern maßgeblich bestimmen“, so Bernhard Steimel, Sprecher der Initiative Voice Business, die im Oktober den Fachkongress „Voice Days“ http://www.voicedays.de in Bonn organisiert. „Lust oder Frust hängen davon ab, ob Microsoft, Apple, Google und Co. ihre Hausausgaben machen und alltagstaugliche Services für Spracherkennung in ihre Produkte integrieren. Erste Präsentationen von Microsoft Vista weisen noch Defizite auf. Ohne den Zukauf von Spezialisten könnten diese Defizite nicht beseitigt werden“, warnt Steimel. Um die Spreu vom Weizen zu trennen, starte die Brancheninitiative eine Qualitätsoffensive.
„Das Ganze findet in Zusammenarbeit statt mit dem Fraunhofer Institut für Arbeitswirtschaft und Organisation http://www.iao.fraunhofer.de, mit den Anbietern von Sprachdialogsystemen SemanticEdge, Sikom, Sympalog und Telenet sowie mit der International Association for Enhanced Voice Services (VMA) http://www.thevma.com. Am Ende wird ein Leitfaden über Qualitätskriterien für Sprachdialogsysteme mit Richtliniencharakter publiziert, der im Anbietermarkt ebenso wie in den Standardisierungsgremien Akzeptanz findet. Mittelfristig soll darauf basierend ein ‚Prüfsiegel’ für testierte Qualität entstehen“, erklärt Steimel. Um eine breite Akzeptanz des offenen Standards zu fördern, werden die wichtigsten Fachexperten aus verschiedenen Unternehmen bei Expertenworkshops in die Entwicklung des offenen Qualitätsstandards einbezogen.
Matthias Peissner vom Fraunhofer IAO will mit den so entstehenden „Richtlinien“ einen Rahmen schaffen, um Entscheidungen für die richtige Technologie und das richtige User Interface Design zu erleichtern und das laufende Testen von Anwendungen möglich zu machen. Auch solle eine anschließende Bewertung der vereinbarten Leistungsindikatoren erfolgen, um eine Kontrollmöglichkeit der vom Anbieter gemachten Prognosen zu gewährleisten. Jörn Kreutel vom Berliner Unternehmen SemanticEdge http://www.semanticedge.de will bei den Anwendern das Bewusstsein um die Bedeutung von Entwicklungswerkzeugen und anderen Technologiekomponenten schärfen: „Wir versprechen uns von unserem Engagement die Definition von Qualitätskriterien für die Technologie, die die Erstellung und der Betrieb natürlichsprachlicher Dialogsysteme erfordern."
Sikom-Chef http://www.sikom.de Jürgen Hoffmeister will den Anstoß geben zu einem „Kochbuch für die Allgemeinheit. Es soll ein Regelwerk entstehen, dass auch Laien darüber informiert, was bei einem Sprachprojekt wichtig und für den Erfolg nötig ist.“ Martin Schröder, Geschäftsführer von Sympalog, erwartet ein höheres Bewusstsein für qualitativ hochwertige Sprachsysteme bei Unternehmen. Klaus Dieter Liedtke, Head of Voice Enhanced ServiceCenter bei T-Mobile http://www.t-mobile.de und Vorsitzender der VMA, treibt die Internationalisierung voran: „Über die Workshops und Tagungen des VMA wollen wir möglichst viele weitere Beteiligte und Unternehmen für die Schaffung gemeinsamer Standards gewinnen“, so der Ausblick von Liedtke.
Redaktion
medienbüro.sohn
Ettighoffer Straße 26 A
53123 Bonn
Tel: 0228 – 620 44 74
Fax: 0228 – 620 44 75
Mobil: 0177 620 44 74
medienbuero@sohn.de;
www.ne-na.de
Mittlerweile würde sich die Technik vom Nischen- zum Massenprodukt wandeln. Viele automatisierte Call Center wie die Auskunftsnummer der Swisscom werden durch gesprochene Sprache gesteuert oder reagieren auf die Frage des Anrufers mit künstlicher Stimme. „Ärzte diktieren ihre Rapporte in Computer; Satelliten-Navigationssysteme sprechen Anweisungen, Internet-Browser lesen Webseiten vor und Handys wählen auf Zuruf Mamas Festnetznummer. Aber all dies ist mit der neusten Generation von Spracherkennungssoftware kaum vergleichbar. In den letzten zwei Jahren nämlich hat die Technologie einen Quantensprung gemacht“, schreibt der Tagesanzeiger.
Heute könne schon jedes bessere Smartphone zum Diktat gebeten werden. Microsofts Gratis-Spracherkennung in Vista sei nach Einschätzung von Branchenexperten ein weiterer Katalysator für den Einsatz im Alltag. Die Potenziale für Spracheingabe bei Computern und Smart Phone sind gigantisch, weil Spracheingabe Zeit spart und gerade im PKW für mehr Sicherheit sorgt. Schon heute nutzen einige Hunderttausend Nutzer weltweit Diktiersysteme. Die Big Player tragen eine große Verantwortung bei der weiteren Verbreitung im Massenmarkt, denn die Qualität ihrer Software wird die Einstellungen und Akzeptanz neuer Eingabemedien bei Millionen von Computer- und Handy-Nutzern maßgeblich bestimmen“, so Bernhard Steimel, Sprecher der Initiative Voice Business, die im Oktober den Fachkongress „Voice Days“ http://www.voicedays.de in Bonn organisiert. „Lust oder Frust hängen davon ab, ob Microsoft, Apple, Google und Co. ihre Hausausgaben machen und alltagstaugliche Services für Spracherkennung in ihre Produkte integrieren. Erste Präsentationen von Microsoft Vista weisen noch Defizite auf. Ohne den Zukauf von Spezialisten könnten diese Defizite nicht beseitigt werden“, warnt Steimel. Um die Spreu vom Weizen zu trennen, starte die Brancheninitiative eine Qualitätsoffensive.
„Das Ganze findet in Zusammenarbeit statt mit dem Fraunhofer Institut für Arbeitswirtschaft und Organisation http://www.iao.fraunhofer.de, mit den Anbietern von Sprachdialogsystemen SemanticEdge, Sikom, Sympalog und Telenet sowie mit der International Association for Enhanced Voice Services (VMA) http://www.thevma.com. Am Ende wird ein Leitfaden über Qualitätskriterien für Sprachdialogsysteme mit Richtliniencharakter publiziert, der im Anbietermarkt ebenso wie in den Standardisierungsgremien Akzeptanz findet. Mittelfristig soll darauf basierend ein ‚Prüfsiegel’ für testierte Qualität entstehen“, erklärt Steimel. Um eine breite Akzeptanz des offenen Standards zu fördern, werden die wichtigsten Fachexperten aus verschiedenen Unternehmen bei Expertenworkshops in die Entwicklung des offenen Qualitätsstandards einbezogen.
Matthias Peissner vom Fraunhofer IAO will mit den so entstehenden „Richtlinien“ einen Rahmen schaffen, um Entscheidungen für die richtige Technologie und das richtige User Interface Design zu erleichtern und das laufende Testen von Anwendungen möglich zu machen. Auch solle eine anschließende Bewertung der vereinbarten Leistungsindikatoren erfolgen, um eine Kontrollmöglichkeit der vom Anbieter gemachten Prognosen zu gewährleisten. Jörn Kreutel vom Berliner Unternehmen SemanticEdge http://www.semanticedge.de will bei den Anwendern das Bewusstsein um die Bedeutung von Entwicklungswerkzeugen und anderen Technologiekomponenten schärfen: „Wir versprechen uns von unserem Engagement die Definition von Qualitätskriterien für die Technologie, die die Erstellung und der Betrieb natürlichsprachlicher Dialogsysteme erfordern."
Sikom-Chef http://www.sikom.de Jürgen Hoffmeister will den Anstoß geben zu einem „Kochbuch für die Allgemeinheit. Es soll ein Regelwerk entstehen, dass auch Laien darüber informiert, was bei einem Sprachprojekt wichtig und für den Erfolg nötig ist.“ Martin Schröder, Geschäftsführer von Sympalog, erwartet ein höheres Bewusstsein für qualitativ hochwertige Sprachsysteme bei Unternehmen. Klaus Dieter Liedtke, Head of Voice Enhanced ServiceCenter bei T-Mobile http://www.t-mobile.de und Vorsitzender der VMA, treibt die Internationalisierung voran: „Über die Workshops und Tagungen des VMA wollen wir möglichst viele weitere Beteiligte und Unternehmen für die Schaffung gemeinsamer Standards gewinnen“, so der Ausblick von Liedtke.
Redaktion
medienbüro.sohn
Ettighoffer Straße 26 A
53123 Bonn
Tel: 0228 – 620 44 74
Fax: 0228 – 620 44 75
Mobil: 0177 620 44 74
medienbuero@sohn.de;
www.ne-na.de