Início Tecnologia O OpenAI dá a seus superpotores de agentes de voz aos desenvolvedores...

O OpenAI dá a seus superpotores de agentes de voz aos desenvolvedores – procure mais aplicativos em breve

9
0

Elyse melhora o picaro / zdnet

Siga ZDNet: Adicione -nos como uma fonte preferida no Google.


As principais toca de Zdnet

  • A API em tempo actual do OpenAI agora está otimizada e geralmente disponível.
  • Você pode experimentar o seu mais recente modelo de fala para fala, o REALTIME.
  • As atualizações melhoram as ofertas de voz do OpenAI para desenvolvedores.

Este ano, os agentes de IA que podem realizar tarefas em nome dos usuários têm sido um foco importante, com empresas em constante desenvolvimento que reduzem a carga de trabalho do usuário. Para tornar essas interações o mais fácil possível, muitas empresas estão apoiando -se em agentes multimodais de IA, e o OpenAI está facilitando ainda mais o desenvolvimento desses produtos.

Segundo a empresa, a OpenAI atualizou sua API em tempo actual geralmente disponível na quinta -feira para incluir mais recursos que permitem que desenvolvedores e empresas construam agentes de voz mais confiáveis. Além disso, a empresa divulgou seu modelo de fala para fala mais avançado: GPT-Realtime.

Os lançamentos:

Atualizações da API em tempo actual

  • O que: As atualizações para a API em tempo actual incluem suporte para servidores MCP remotos, entradas de imagem e chamada de telefone através do Protocolo de Iniciação de Sessão (SIP), de acordo com o comunicado.
  • Por que isso importa: Por fim, esses recursos expandidos devem permitir que os agentes de voz acessem mais ferramentas e tenham mais contexto para ajudar os usuários. As ferramentas de IA são tão úteis quanto as informações que eles fornecem, então simplificar o processo de conectar modelos de IA às fontes de dados é uma grande vitória para desenvolvedores e usuários. Mais importante ainda, o MCP Open Normal garante que as conexões sejam feitas, priorizando os dados e a privacidade do usuário.

Um novo modelo de fala para fala

  • O que: O Openai elogiou seu novo modelo GPT-Realtime como o “Modelo de Voz mais avançado e pronto para produção” da empresa. As atualizações incluem melhorias na inteligência, seguintes instruções e chamadas de funções, de acordo com o comunicado.
  • Por que isso importa: Um princípio importante da assistência e interações úteis de voz são os modelos que parecem naturais e têm a capacidade de realmente ajudar nas tarefas. Se o novo modelo funcionar conforme reivindicado, ele permitirá uma melhor experiência para os usuários.



avots

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui