O YouTube pretende melhorar a qualidade de áudio em seus em stories com a tecnologia “Looking to Listen”, de aprimoramento de fala. O recurso utiliza inteligência artificial para identificar o locutor e fazer o cancelamento de ruído em vídeos. A novidade começa a ser liberada primeiro para usuários de iPhone (iOS).
O mecanismo do Looking to Listen correlaciona o áudio da fala com elementos visuais presentes nos vídeos curtos, como expressões faciais e movimento da boca. A tecnologia existe há cerca de dois anos, e passou por diversos treinamentos baseados em aprendizado de máquina.
De acordo com o Google, o software foi exposto a pessoas com diferentes idades, tons de pele, tipos de linguagem falada e posturas, incluindo também indivíduos com ou sem pelos faciais e usuários de óculos – tudo isso para evitar problemas com preconceito e discriminação.
O processamento ocorre totalmente no dispositivo do usuário quando o vídeo ainda está sendo gravado, sem a necessidade de enviar dados a um servidor remoto. Além de garantir maior privacidade, esse método torna a dinâmica mais rápida. Para usar, basta ativar a chave relativa à função nos controles de volume do app.
Com informações: Google, Engadget e Venture Beat
Nenhum comentário:
Postar um comentário