Daten-Design und Grammatik

Um die Grammatik für ein Sprachdialogsystem zu erstellen, müssen die zur Verfügung gestellten Rohdaten so aufbereitet werden, dass sie für die Spracherkennung verwendbar sind. Bei einer sprachgesteuerten Telefonauskunft beispielsweise haben die gelieferten Rohdaten folgende Form:

Eisenwaren–Hdl. Meier&Schulze gmbh&co. kg

In diesem Format sind die Daten vollkommen unbrauchbar. Um den Eintrag auszuwählen, müßte der Nutzer ihn genau so sprechen, wie er hier geschrieben steht. «gmbh» dürfte dabei nicht als Folge einzelner Buchstaben gesprochen werden («ge em be ha») sondern nur als zusammenhängendes Wort. «Handlung» oder «Handel» würde vom System nicht als gültige Eingabe akzeptiert, sondern nur die Abkürzung «Hdl». Und dem System ist auch völlig unbekannt, dass das Sonderzeichen «&» in der gesprochenen Sprache als «und» realisiert wird.

Bei der Datennormalisierung muss deshalb «gmbh» als Rechtsform erkannt und entsprechend aufbereitet werden. Das Sonderzeichen «&» muss durch «und» und die Abkürzung «Hdl.» durch «Handlung» ersetzt werden. Um dem Nutzer eine freiere Eingabe zu ermöglichen, müssen obendrein sprachliche Varianten vorgesehen werden.

System: Um welche Firma geht es?
User1: Eisenwaren–Handlung Meier und Schulze g m b h und co k g
User2: Meier und Schulze Eisenwaren
User3: Meier und Schulze g m b h
User4: Eisen–Schulze

Es genügt also nicht, Abkürzungen und Sonderzeichen aufzulösen, es muss auch definiert werden, welche Bestandteile eines Eintrags entfallen können und welche nicht und in welcher Reihenfolge die Bestandteile auftauchen dürfen. Dabei sollten allerdings nur die wahrscheinlichsten Möglichkeiten als Eingabe erlaubt werden – zu viele Varianten verschlechtern die Erkennungsleistung.

Dieses Beispiel zeigt: Ohne ein durchdachtes und ausgereiftes Daten-Design ist kein Sprachdialogsystem in der Lage, eine akzeptable, zufrieden stellende Systemleistung zu erbringen.