A forma como falamos com a tecnologia evoluiu ao longo dos últimos anos, desde teclados físicos, passando pelos ecrãs táteis, atée chegar à voz. A interacção através da voz tem vindo a ser gradualmente introduzida na vida dos utilizadores, especialmente com a chegada de assistentes de voz e novas soluções no domínio da telefonia para facilitar a reorientação das chamadas, a recolha de informações básicas do autor da chamada ou a simplificação de procedimentos, tais como reservas num restaurante.

O sector está a evoluir a um ritmo vertiginoso e a integrar novas ferramentas para melhorar a sua qualidade e eficiência. De acordo com o Research and Markets, o mercado relacionado com o reconhecimento de voz crescerá a uma taxa de 17,2% ao ano a partir de 2019 e atingirá 26,79 mil milhões de euros em 2025.

Neste sentido, a masvoz, uma empresa com mais de 15 anos de experiência em serviços de comunicação para empresas, analisa as tecnologias de voz que vão revolucionar a forma como nos comunicamos, seja com um contact center ou qualquer outro dispositivo:

  • Reconhecimento automático de voz (ASR). Em ambientes telefónicos, esta tecnologia é responsável por entender e transcrever quando o interlocutor dita um número de identificação ou telefone para o operador virtual, o que permite evitar a marcação via teclado e criar uma interação mais simples para o utilizador. No início, esta tecnologia só era capaz de compreender dígitos e letras como números de telefone. De fato, no início da década de 1960, os investigadores conseguiram que reconhecesse as quatro vogais e nove consoantes, e na década de 1970 o sistema de ASR  mais avançado só reconhecia mil palavras.

Hoje em dia, graças a programas mais avançados, os sistemas são capazes de reconhecer a linguagem natural e são usados para transcrever chamadas ou conversas inteiras e para legendar ou traduzir uma voz automaticamente.

  • Análise da fala. Esta é uma tecnologia capaz de analisar chamadas de voz em tempo real. Amplamente utilizado no campo do atendimento ao cliente ou retalho, é uma ferramenta que detecta emoção, tom e até mesmo stress na voz. Esses dados de áudio são analisados e também servem para identificar se um utilizador está irritado ou frustrado. Desta forma, a pessoa do outro lado pode gerir melhor o pedido ou a necessidade do utilizador e considerar a melhor forma de resolver um problema. Com toda a informação obtida a partir da análise destas interacções, as empresas podem melhorar o seu serviço e adaptar-se às necessidades do seu público-alvo.
  • Optimização de motores de voz (VEO). Altifalantes inteligentes com assistente de voz já são um elemento na decoração de muitas casas. De acordo com os dados da OC&C, em 2022, 55% dos agregados familiares terão um ou mais destes dispositivos. Portanto, interagir com assistentes virtuais tornar-se-á quotidiano e as buscas por voz aumentarão exponencialmente.

Na verdade, a ComScore afirma que metade das pesquisas em 2020 serão feitas por voz. Esse novo hábito é um desafio para os profissionais de marketing digital, pois as estratégias de conteúdo devem ser focadas na criação de perguntas e respostas e tudo isso em torno da criação de palavras-chave de conversação para responder em linguagem natural. Esta estratégia para optimizar as pesquisas de voz chama-se Optimização de Vozes (Voice Engine Optimization) ou VEO, um conceito que será essencial para desenvolver uma estratégia de marketing no futuro.

  • Biometria de voz. Esta tecnologia está ainda numa fase inicial de desenvolvimento, mas a sua chegada significará um avanço na segurança e na privacidade dos dados pessoais. Em vez de utilizar a impressão digital ou as características faciais, este é um sistema que cria uma impressão de voz única, segura e intransmissível como medida de autenticação e assinatura digital. Para obter a impressão vocal de uma pessoa, é feita uma série de testes e registos em que o sistema tem em conta características físicas como a forma e o tamanho da boca, bem como a pronúncia, a frequência e a velocidade da voz.

Esta tecnologia terá múltiplas aplicações em vários campos. Por exemplo, com a biometria de voz será possível votar por telefone numa eleição, autorizar transações bancárias, obter uma senha esquecida ou autenticar num Contact Center. De fato, de acordo com um estudo do emarketer, 21 milhões de pessoas nos Estados Unidos este ano farão pelo menos uma compra através de um altavoz inteligente. A segurança é muito importante nestas transacções e os avanços na biometria permitirão que estas aquisições sejam totalmente seguras e que os dados sejam protegidos.

«Graças a estas novas tecnologias, as possibilidades de realizar ações com a voz estão a expandir-se exponencialmente e cada vez mais empresas estão a apostar nelas. A capacidade de analisar os dados que eles fornecem permitem-nos dar valor diferencial e personalizar o relacionamento com o utilizador, oferecendo assim um serviço mais eficiente«, diz Alfred Nesweda, CEO da masvoz.

A capacidade de falar é, sem dúvida, uma característica inerente ao ser humano, mas a forma de usá-la está a evoluir. Alexa e Google Assistant já são parceiros na vida dos utilizadores, mas a tecnologia de voz vai além dos participantes. Fazer um pagamento com voz ou compreender conversas em línguas estrangeiras graças à tradução simultânea será uma realidade que mudará o uso da fala.

Mantenha-se informado das notícias mais relevantes em nosso canal Telegram