Novo sistema de inteligência artificial pode entender 10 idiomas ao mesmo tempo

Um sistema de inteligência artificial poliglota (AI) foi criado para reconhecer com precisão e compreender separadamente a sobreposição de vozes em até 10 idiomas, incluindo japonês, inglês e francês.

A tecnologia, desenvolvida pela gigante de eletrônicos Mitsubishi Electric Corp., pode reconhecer a fala feita simultaneamente por mais de uma pessoa em diferentes idiomas quase instantaneamente e com alta precisão.

As tecnologias convencionais de reconhecimento de voz compreendem apenas um idioma por vez.

“Nosso sistema pode ser ensinado a reconhecer com precisão o que cada usuário disse, mesmo quando o mesmo trocou de língua no meio da fala, ou quando alguém começou a falar em outra língua, desde que os idiomas envolvidos já tenham sido “aprendidos”, disse Takaaki Hori, pesquisador do Mitsubishi Electric Research Laboratories, na descrição da tecnologia.

A tecnologia multilíngue caracteristicamente não precisa de conhecimento especializado específico de idioma, como um dicionário de pronúncias porque se baseia em “aprendizado profundo”, uma tecnologia de IA que usa uma “rede neural”, que imita um circuito nervoso.

A Mitsubishi disse que sua tecnologia combinou um método para inferir relações de correspondência temporal entre voz, uma sequência de caracteres e um método de inferência separado que enfatiza a conexão entre o som e o texto de uma sequência de caracteres.

O sistema, quando ministrado em vários idiomas, alcançou uma precisão de reconhecimento de voz de mais de 90% quando cinco idiomas (japonês, inglês, francês, alemão e italiano) eram falados em ambientes de baixo ruído. A precisão permaneceu acima de 80% quando um total de 10 idiomas foram usados, com a adição de chines, espanhol, portugues, russo e holandes, disseram os oficiais.

O sistema pode funcionar em um sistema de computador pequeno e independente, como um smartphone, com ou sem internet. Pode ser usado, por exemplo, na transcrição de conversas de um vídeo que contém fala em vários idiomas.

Testes extensivos são planejados no futuro para avaliar a praticabilidade, como a extensão das capacidades de reconhecimento de fala em áreas movimentadas e outros ambientes barulhentos, para tornar a tecnologia mais prática, acrescentaram os funcionários.

Fonte: Asahi

Anúncios

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *