Questo documento è indirizzato a utenti Linux con un livello di competenze basso o intermedio interessati ad acquisire delle conoscenze teoriche sul riconoscimento del parlato e a provare questa tecnologia nella pratica. Può, inoltre, risultare utile a sviluppatori che vogliano imparare gli aspetti di base della programmazione di riconoscimento del parlato.
La stesura di questo documento è iniziata in contemporanea alle mie ricerche di programmi e librerie di sviluppo per il riconoscimento del linguaggio disponibili per Linux. Il riconoscimento del parlato (ASR o semplicemente SR) su Linux ha appena iniziato a muovere i suoi primi passi. Spero che questo documento lo possa indirizzare nella giusta direzione e sia uno strumento utile sia per gli utenti che per gli sviluppatori di questa tecnologia.
Questo documento non vuole essere un'esposizione completa di tutte le tecniche di SR. Si concentra, invece, nello spirito degli HOWTO, sugli aspetti più pratici. É comunque disponibile una sezione Pubblicazioni dove il lettore interessato può trovare i riferimenti a libri o articoli su argomenti che non sono trattati qui. Questo documento non vuole nemmeno essere la parola definitiva sull'argomento ASR e Linux.
Per ottenere la versione più recente di questo documento, si può consultare l'archivio di LDP o controllare l'indirizzo: http://www.gear21.com/speech/index.html.
Vorrei ringraziare le seguenti persone per il loro aiuto, revisioni e sostegno in favore di questo documento:
Jessica Perry Hekman
Geoff Wexler
Se volete fare commenti, suggerimenti, revisioni, aggiornamenti, o siete semplicemente interessati a discutere di ASR, inviatemi un'email all'indirizzo scook@gear21.com.
Questa è una lista delle cose ancora da fare:
Aggiungere delle descrizioni nella sezione Pubblicazioni.
Aggiungere altri libri alla sezione Pubblicazioni.
Aggiungere altri link completi di descrizione.
Migliorare la descrizione dei vari passi di un sistema ASR.
Includere la descrizione di FFT e Filtri.
Includere la descrizione dei principi dei DSP.
v0.1 prima bozza preliminare - Agosto 2000
v0.5 bozza finale - Settembre 2000