Os especialistas acreditam que o reconhecimento preciso varia entre 2% e 3%, mas alertam que muitos utilizadores optam por simplificar as suas mensagens sabendo que estão a interagir com as máquinas, o que promove a compreensão.

Alguns sistemas de reconhecimento automático da fala podem ser menos precisos do que inicialmente presumido. A descoberta provém da investigação da Universidade Johns Hopkins, da Universidade de Tecnologia em Poznań na Polónia, da Universidade de Ciência e Tecnologia em Wrocław e da empresa start-up Avaya.

Os investigadores compararam modelos comerciais de reconhecimento da fala num conjunto de dados criado internamente. Os co-autores do estudo dizem que as taxas de erro de palavras têm sido significativamente mais elevadas do que o inicialmente esperado, pelo que pode indicar um problema maior no processamento da linguagem humana.

Interação com chatbots

O estudo baseia-se no modelo de reconhecimento de fala ASR (Automatic Speech Recognition), através do qual se pode ditar reuniões e e-mails e ajudar a gerir dispositivos inteligentes.

A maioria das interacções ASR ocorrem no contexto de «interações tipo chatbot», onde as pessoas sabem que estão a falar com uma máquina e, portanto, simplificam a sua comunicação fazendo frases curtas e bem estruturadas em vez de outros tipos de frases.

Os investigadores propõem trabalhar em modelos acústicos inclusivos que representam um espectro mais amplo de dialetos, bem como modelos que são responsáveis por avanços tecnológicos que influenciam as propriedades físicas dos sinais de áudio processados, pois acreditam que isto poderia ser fundamental para obter menos falhas no processamento de mensagens por máquinas.

Mantenha-se informado das notícias mais relevantes em nosso canal Telegram