“Hola!” Hablas Inglés? ” Perguntei à mulher que atendeu o telefone no restaurante Barcelona.
Eu estava chamando uma tentativa fútil de fazer uma reserva para o jantar da equipe da CNET durante o Cell World Congress este ano. Infelizmente, não conheço espanhol (aprendi francês e alemão na escola). E como se viu, ela também não falava inglês.
“Não!” ela disse, e bruscamente desligou.
O que eu precisava naquele momento period o tipo de recurso de tradução de chamadas de IA que está se tornando cada vez mais prevalente em telefones – incluindo os feitos pela Samsung e Google e, a partir da próxima semana, honra.
Quando a Honor divulgar seu Magic V5 dobrável em um evento de lançamento em 28 de agosto em Londres, ele virá com o que a empresa está chamando de “o primeiro modelo de fala de grande porte do setor”, que permitirá que a tradução de chamadas de IA ao vivo ocorra no dispositivo, sem processamento em nuvem.
Atualmente, o telefone suporta seis idiomas – inglês, chinês, francês, alemão, italiano e espanhol. Por razões acima mencionadas, não posso testar tudo isso, mas já tive uma brincadeira com o recurso e posso confirmar que ele fez um trabalho muito eficaz ao traduzir minhas mensagens distorcidas para o francês. Eu só gostaria de tê -lo disponível na Espanha quando precisava.
A honra do modelo implantada foi projetada pela empresa em colaboração com a Universidade de Xangai Jiao Tong, com base no modelo de sussurro de código aberto, disse Fei Fang, presidente de produto em homenagem em entrevista. Ele foi otimizado para transmissão de reconhecimento de fala, detecção automática de linguagem e aceleração de inferência de tradução (isso é velocidade e eficiência, para você e eu).
De acordo com Fang, os estudos de experiência do usuário de Honor mostraram que, enquanto a tradução ocorre em 1,5 segundos, ele não “induz a ansiedade em espera”, em qualquer pessoa que tenta usar a tradução de chamadas de IA. Como tal, é feito manter a latência dentro desses parâmetros para que você não fique ansioso esperando a tradução entrar em ação.
“Também trabalhamos em conjunto com os especialistas em idiomas do setor para avaliar de forma consistente e abrangente a precisão de nossa produção”, acrescentou. “A avaliação é baseada principalmente em cinco métricas: precisão, coerência lógica, legibilidade, correção gramatical e concisão”.
Além do modelo de IA da Honor, a tradução ao vivo está sendo alimentada pelo chip de elite Snapdragon 8 da Qualcomm. A NPU da 8 elite permite que os aplicativos generativos multimodais sejam integrados ao dispositivo. Os algoritmos de honra trabalham em conjunto com a NPU para manter o consumo de energia o mais baixo possível, mantendo a precisão necessária das traduções, disse Christopher Patrick, vice -presidente sênior de aparelhos móveis da Qualcomm.
Existem vários benefícios em ter o modelo de IA incorporado no Magic V5, mas talvez o mais atraente seja a privacidade que ela garante. Isso significa que tudo é processado localmente e suas chamadas permanecerão completamente confidenciais. O fato de o modelo viver no dispositivo e você não precisar baixar pacotes de voz também reduz suas necessidades de armazenamento.
Outro benefício de executar o modelo no próprio telefone é “usabilidade offline”, disse Patrick. “Todas as informações da conversa são armazenadas diretamente no dispositivo e os usuários podem acessá-las a qualquer hora, em qualquer lugar, sem restrições de rede”.
A honra do trabalho foi realizada na tradução de chamadas de IA deve ser reconhecida na próxima conferência entre países entre ciência e tecnologia da fala. Mas a Honor já está pensando em como esse uso da IA pode ser usado para permitir outros recursos novos e emocionantes para as pessoas que compram seus telefones.
“Além do cenário essencial do usuário da tradução de chamadas, o grande modelo de fala do Honor-Machine também será implantado em cenários como tradução presencial [and] As legendas de IA “, disse Fang. O processo de desenvolvimento do modelo de fala permitiu que a equipe de IA da Honor obtenha uma vasta experiência de otimização de modelos, que ele usará para desenvolver outros aplicativos de IA, acrescentou.
“Olhando para o futuro, continuaremos a expandir as capacidades em áreas como reconhecimento de emoções e monitoramento da saúde, capacitando ainda mais as interações de voz com seu assistente de IA no dispositivo”, disse ela.