O reconhecimento de voz pode parecer um recurso simples à maioria das pessoas. No entanto, ele nem sempre está disponível para quem tem alguma dificuldade de fala. Por precisarem de uma certa clareza no que é dito, as ferramentas acabam tendo seu uso limitado. O Google identificou esse problema e tem trabalhado para resolvê-lo.
A empresa mantém projetos que buscam permitir a mais pessoas se beneficiarem do reconhecimento de voz. Um deles é o Project Euphonia, que conta com a inteligência artificial para reconhecer os diversos padrões de fala dos usuários.
O objetivo é fazer dispositivos serem capazes de transcrever o que é dito por pessoas em situações diferentes. Para isso, eles precisam reconhecer falas de quem possui dificuldades causadas por acidente vascular cerebral (AVC), esclerose lateral amiotrófica (ELA), esclerose múltipla, lesões cerebrais traumáticas (LCT) ou doença de Parkinson, por exemplo.
O Google ainda não liberou uma solução para o público, mas elas são testadas internamente. Em um dos experimentos, a companhia gravou vozes de pessoas com ELA e as transformou em uma representação visual. A partir daí, a inteligência artificial foi treinada para entender palavras ditas em um novo padrão.
“Nossos algoritmos visam atualmente acomodar pessoas que falam inglês e têm deficiências tipicamente associadas com ELA, mas acreditamos que nossa pesquisa possa ser aplicada a grupos maiores de pessoas e a diferentes deficiências de fala”, afirma o Google.
Um dos projetos da companhia visam permitir que todos consigam realizar uma chamada de voz. Em fase de pesquisa, o Live Relay (retransmissão ao vivo, em tradução livre) é um recurso capaz de transformar texto em fala e fala em texto.
Com ele, é possível digitar uma mensagem de texto para que a pessoa do outro lado da linha o receba como áudio. Quando ela responde, o celular converte o que foi dito em mensagem de texto. Para que a mensagem seja enviada mais rapidamente e a conversa fique natural, a solução utiliza o Smart Reply e o Smart Compose, criados inicialmente para o Gmail.
“O Live Relay é útil para quem não fala ou não ouve durante uma chamada, e pode ser especialmente útil para usuários surdos e com deficiências auditivas, complementando as soluções existentes”, afirma o Google.
Nenhum comentário:
Postar um comentário