Linguistische Daten in Speech-Projekten bestehen oft nicht aus Wörter im herkömmlichen Sinne, sondern aus Buchstabenkombinationen wie Akronymen («ADAC») oder Buchstaben-Zahlen-Codes, wie man sie zum Beispiel in Produktbezeichnungen findet (HD-600).
Für solche Daten muss festgelegt werden, ob sie als Einzelbuchstaben («R T L») oder als Wort gesprochen werden sollen («Sat 1» oder «Pro 7») – denn wenn die Daten dem Spracherkenner in Rohform vorgelegt werden, wird er auch bei RTL eine Eingabe als Wort erwarten.
Ob eine Sequenz als Einzelbuchstaben oder als Wort gesprochen wird, ist in erster Linie abhängig von den Phono-Syntax-Regeln zur Kombination von Buchstaben bzw. Lauten. Diese Regeln lassen sich automatisiert auf den Datenbestand anwenden. Nach dem Daten-Design wird die Sequenz «RTL» zu «R T L» (in Einzelbuchstaben), «Sat 1» und «Pro 7» hingegen bleiben als Wörter bestehen. Neben der Phono-Syntax entscheiden weitere Regeln über die Aussprache von Akronymen. Beispielsweise könnte «ADAC» zwar als Wort ausgesprochen werden, dennoch wird die Variante in Einzelbuchstaben vorgezogen.
Ohne eine Vorverarbeitung und ein gut durchdachtes Daten–Design bleiben viele Daten für die Praxis unbrauchbar. Die Folge ist eine Systemleistung, die weit hinter ihren Möglichkeiten zurückbleibt. Vor allem bei großen Datenmengen bedarf es daher der rechtzeitigen Planung und Konzeption.