Raccolta di dati audio per lo sviluppo di un sistema di riconoscimento vocale

Introduzione

Abbiamo collaborato a un progetto volto allo sviluppo di un sistema di riconoscimento vocale in lingua italiana, con particolare attenzione alla varietà degli accenti regionali. L’obiettivo era raccogliere registrazioni audio di conversazioni spontanee, differenziate per tematiche, genere dei parlanti e provenienza geografica. La sfida consisteva nel garantire varietà e autenticità dei dati mantenendo alti standard qualitativi e rispettando le specifiche tecniche fornite dal cliente.

Soluzione e vantaggi

  • Organizzazione di coppie di collaboratori incaricate di registrare conversazioni spontanee
  • Registrazione di 140 minuti per coppia, suddivisi in sessioni di almeno 35 minuti ciascuna
  • Tematiche predefinite fornite dal cliente per garantire coerenza e varietà semantica
  • Raccolta dati bilanciata per genere e provenienza, nel pieno rispetto degli standard qualitativi

Risultati e conclusioni

  • Progetto completato in circa 3 mesi
  • Bilanciamento ottimale tra genere dei partecipanti e varietà delle tematiche trattate
  • Rispetto pieno dei requisiti di durata, spontaneità e qualità imposti dal cliente
  • Fornitura di un dataset altamente diversificato e pronto per l’addestramento di sistemi vocali avanzati