La ricerca del contenuto multimediale rappresenta forse uno degli utilizzi più efficaci del riconoscimento vocale. Grazie al riconoscimento automatico dei testi registrati e alla loro indicizzazione si accede alle informazioni contenute nella registrazione senza doverla ascoltare per intero. Questo è un vantaggio enorme soprattutto oggi che il numero di informazioni e registrazioni da vagliare è cresciuto incredibilmente, ben più del tempo da dedicare alla ricerca! Avendo a disposizione questo archivio di registrazioni non occorre più ascoltare tutto o restringere la ricerca solo a un delimitato numero di parole chiave inserite manualmente: al contrario, ora potete trovare anche informazioni marginali che per parole chiave sarebbe impossibile cercare.

Lingua

Questa tecnologia combina il riconoscimento vocale con la ricerca fulltext integrata dagli strumenti linguistici per la ricerca morfologica, dal dizionario dei sinonimi (Thesaurus) o addirittura dal traduttore automatico. E' possibile combinarlo anche con la ricerca vocale tramite la quale si genera un sistema che non solo effettua ricerche vocali ma dalla voce viene anche controllato.

Software

Come probabilmente accade per tutti gli efficaci sistemi di ricerca, all'interno di un archivio si parte con l'indicizzazione e solo dopo si prosegue con la ricerca che utilizza gli indici creati.

Componente chiave di questa tecnologia è il riconoscitore vocale che converte il suono in testo (con l'avvertimento che se il risultato del riconoscimento è ambiguo, anche il testo può risultare ambiguo). Prima della indicizzazione (creazione di un elenco - indice) il testo viene processato attraverso la lemmatizzazione (per esempio, individuazione della forma base della parola) per la ricerca morfologica, eventualmente la traduzione nella lingua dell'indice, e infine si arriva all'inserimento nell'indice nel quale il motore di ricerca si muove secondo la richiesta immessa. La ricerca può avvenire anche per lemmatizzazione o espansione delle forme (partendo da una forma del sostantivo se ne visualizzano poi tutte le restanti), o ancora per espansione dei sinonimi o traduzione nella lingua dell'indice.

Il riconoscitore vocale richiede strumenti informatici particolari e occorre che sia installato adeguatamente affinché possa essere in grado di far passare nel testo le nuove parole indicizzate in breve tempo. Il tempo utile alla elaborazione dell'entrata è solo una frazione di quello necessario alla sua esecuzione a velocità normale. Un numero maggiore di nuclei permette di elaborare più entrate parallelamente. Se necessario, i riconoscitori vocali potrebbero essere posizionati in server dedicati con parametri adeguati. Se la velocità di lettura del disco limita in qualche modo la ricerca, una soluzione potrebbe essere l'utilizzo, per esempio, di dischi SSD o mirror.