Início Tecnologia Nous Analysis derruba Hermes 4 Modelos de IA que superam o ChatGPT...

Tecnologia

Nous Analysis derruba Hermes 4 Modelos de IA que superam o ChatGPT sem restrições de conteúdo

Por

29 Agosto 2025

Quer insights mais inteligentes em sua caixa de entrada? Inscreva -se para que nossos boletins semanais obtenham apenas o que importa para a IA, dados e líderes de segurança corporativos. Inscreva -se agora

Nous Researchuma startup secreta de inteligência synthetic que emergiu como uma voz de liderança no movimento de IA de código aberto, lançado silenciosamente Hermes 4 Na segunda -feira, uma família de grandes modelos de idiomas que a empresa afirma pode corresponder ao desempenho dos principais sistemas proprietários, oferecendo controle de usuário sem precedentes e restrições mínimas de conteúdo.

O lançamento representa uma escalada significativa na batalha entre os defensores da IA de código aberto e as principais empresas de tecnologia sobre quem deve controlar o acesso a recursos avançados de inteligência synthetic. Ao contrário dos modelos de OpenaiAssim, Googleou AntrópicoHermes 4 foi projetado para responder a quase qualquer solicitação sem os corrimãos de segurança que se tornaram padrão nos sistemas comerciais de IA.

A Nous Analysis apresenta Hermes 4, nossa última linha de modelos de raciocínio híbrido.https://t.co/e5ew9hburb
O Hermes 4 se baseia em nosso legado de modelos alinhados ao usuário com recursos expandidos de computação no tempo de teste.
Atenção especial foi dada a tornar os modelos criativos e interessantes para… pic.twitter.com/52vjnvrdwm
– Nous Analysis (@NousRearch) 26 de agosto de 2025

“O Hermes 4 se baseia em nosso legado de modelos alinhados ao usuário com recursos expandidos de computação no tempo de teste”, anunciou a Nous Analysis no X (anteriormente Twitter). “Atenção especial foi dada a tornar os modelos criativos e interessantes para interagir, sem onerados pela censura e alinhados neutamente, mantendo o desempenho de matemática, codificação e raciocínio de nível de última geração para modelos de peso aberto”.

Como o modo de ‘raciocínio híbrido’ de Hermes 4 supera o chatgpt e o Claude em benchmarks matemáticos

Hermes 4 Introduz o que a Nous Analysis chama de “raciocínio híbrido”, permitindo que os usuários alternem entre respostas rápidas e processos de pensamento mais profundos e passo a passo. Quando ativado, os modelos geram seu raciocínio interno em especial Tags antes de fornecer uma resposta ultimate – semelhante aos modelos de raciocínio O1 da OpenAI, mas com whole transparência no processo de pensamento da IA.

Ai escala atinge seus limites

Capitões de energia, custos crescentes de token e atrasos de inferência estão remodelando a IA corporativa. Junte -se ao nosso salão exclusivo para descobrir como são as principais equipes:

Transformando energia em uma vantagem estratégica

Arquitetagem Inferência eficiente para ganhos reais de rendimento

Desbloqueando o ROI competitivo com sistemas de IA sustentáveis

Prenda seu lugar para ficar à frente:

A conquista técnica é substancial. Nos testes, o maior modelo de parâmetro de 405 bilhões de Hermes 4 obteve 96,3% no MATH-500 Benchmark no modo de raciocínio e 81,9% no desafio Competição de matemática de Aime’24 – Desempenho que rivaliza ou excede muitos sistemas proprietários que custam milhões a mais a serem desenvolvidos.

“O desafio é tornar os traços de pensamento úteis e verificáveis sem raciocínio descontrolado”, observou o pesquisador da IA Rohan Paul em Xdestacando um dos avanços técnicos no lançamento.

Talvez mais notavelmente, Hermes 4 alcançou a pontuação mais alta entre todos os modelos testados em “Recusalbench”, uma nova pesquisa de referência criada para medir a frequência com que os sistemas de IA se recusam a responder perguntas. O modelo obteve 57,1percentno modo de raciocínio, superando significativamente o GPT-4O (17,67%) e o claude Sonnet 4 (17%).

Os modelos Hermes 4 da Nous Analysis responderam significativamente mais perguntas do que os sistemas de IA concorrentes no RecusalBench, um teste que mede a frequência com que os modelos se recusam a responder às solicitações de usuário. (Crédito: Nous Analysis)

Inside Dataforge e Atropos: os sistemas de treinamento inovadores por trás das capacidades do Hermes 4

Por trás das capacidades do Hermes 4, há uma sofisticada infraestrutura de treinamento que Nous Research desenvolveu ao longo de vários anos. Os modelos foram treinados usando dois novos sistemas: Dataforgeum gerador de dados sintéticos baseado em gráfico e Atroposuma estrutura de aprendizado de reforço de código aberto.

Dataforge Cria dados de treinamento através do que a empresa descreve como “caminhadas aleatórias” através de gráficos direcionados, transformando dados simples de pré-treinamento em exemplos complexos de seguidores de instruções. O sistema pode, por exemplo, pegar um artigo da Wikipedia e transformá -lo em uma música de rap, depois gerar perguntas e respostas com base nessa transformação.

AtroposEnquanto isso, opera como centenas de ambientes de treinamento especializados, onde os modelos de IA praticam habilidades específicas – matemática, codificação, uso de ferramentas e escrita criativa – recebendo suggestions apenas quando produzem soluções corretas. Essa abordagem de “amostragem de rejeição” garante que apenas respostas verificadas e de alta qualidade entrem nos dados de treinamento.

ATROPOS é a estrutura de aprendizado de reforço Nous
O Atropos é um ambiente de aprendizado de reforço de código aberto da Nous que possui centenas de “academias” (como matemática, codificação, jogos, uso de ferramentas, visão) para treinar e avaliar trajetórias de LLM por meio de loops escaláveis e assíncronos.
Em outras palavras… pic.twitter.com/fjxaqkclez
– Tommy (@Shaughnessy119) 26 de agosto de 2025

“O Nous usou esses ambientes para gerar o conjunto de dados para Hermes 4!” explicado Tommy Shaughnessyum capitalista de risco em Delphi Ventures que investiu em pesquisas NOUS. “Tudo no conjunto de dados contém 3,5 milhões de amostras de raciocínio e 1,6 milhão de amostras que não são rucas! Hermes foi treinado em dados de RL, não apenas conjuntos de dados estáticos de pergunta e resposta!”

O processo de treinamento exigiu 192 nvidia B200 GPUS e 71.616 horas da GPU para o maior modelo – um investimento computacional significativo, mas não sem precedentes, que demonstra como as técnicas especializadas podem competir com a enorme escala de gigantes da tecnologia.

Por que a Nous Analysis acredita

Nous Research construiu sua reputação em uma filosofia que coloca o controle do usuário acima das políticas de conteúdo corporativo. Os modelos da empresa foram projetados para serem “orientáveis”, o que significa que eles podem ser ajustados ou solicitados a se comportar de maneiras específicas sem as rígidas restrições de segurança que caracterizam os sistemas comerciais de IA.

“Hermes 4 não é algemado por isenções de responsabilidade, regras e ser excessivamente cauteloso, o que é irritante como o inferno e prejudica a inovação e a usabilidade”, escreveu Shaughnessy em um tópico detalhado analisando o lançamento. “Se seu código aberto, mas recusa todos os solicita seu inútil. Não é um problema com Hermes 4.”

Hermes 4 não é algemado por isenções de isenções, regras e ser excessivamente cauteloso, o que é irritante como o inferno e prejudica a inovação e a usabilidade.
Hermes 4 70B está no oposto completo do modelo de código aberto do Spectrum vs Openai. É também ~ 4x mais aberto vs chatgpt 4o!
Se estiver aberto … pic.twitter.com/q5rpx1oozo
– Tommy (@Shaughnessy119) 26 de agosto de 2025

Esta abordagem fez Nous Research Widespread entre pesquisadores e desenvolvedores de IA que desejam a máxima flexibilidade, mas também coloca a empresa no centro de debates em andamento sobre a segurança da IA e a moderação do conteúdo. Embora os modelos possam teoricamente ser usados para fins prejudiciais, a Nous Analysis argumenta que a transparência e o controle do usuário são preferíveis à gatekeeping corporativo.

A empresa Relatório TécnicoLançado ao lado dos modelos, fornece detalhes sem precedentes sobre o processo de treinamento, os resultados da avaliação e até as saídas de texto reais dos testes de referência. “Acreditamos que este relatório outline um novo padrão para transparência no benchmarking”, afirmou a empresa.

Como uma pequena startup com 192 GPUs está competindo contra os orçamentos de IA de bilhões de dólares da Huge Tech

Hermes 4A liberação é um momento essential na indústria de IA. Embora as principais empresas de tecnologia tenham investido bilhões no desenvolvimento de sistemas de IA cada vez mais poderosos, um movimento crescente de código aberto argumenta que essas capacidades não devem ser controladas por um punhado de corporações.

Recentes meses tiveram avanços significativos na IA de código aberto, com modelos como a Meta’s LLAMA 3.1Assim, R1 de Deepseeke Qwen do Alibaba Série alcançando o desempenho que rivaliza com sistemas proprietários. Hermes 4 representa mais uma etapa nesta progressão, particularmente na área de raciocínio – considerou uma força de sistemas fechados como Openi’s O1.

“Primeiro, Nous é uma startup com dezenas de pessoas extremamente talentosas”. notou Shaughnessy. “Eles não têm os gastos com capex de US $ 100 bilhões de US $ 100 bilhões de um hiperescalador nem mil e 1.000 dos funcionários e, apesar de continuarem a lançar modelos e pesquisas inovadores em um ritmo insano”.

A startup, que levantou US $ 65 milhões em financiamento no início deste ano liderado por Paradigmatambém está desenvolvendo Rede de psiquesum sistema de treinamento distribuído que visa coordenar o treinamento de IA em computadores conectados à Web usando a tecnologia blockchain.

A correção técnica que impediu Hermes 4 de pensar em loops sem fim

Um de Hermes 4As contribuições técnicas mais significativas são de um problema que atormenta os modelos de raciocínio: processos de pensamento excessivamente longo. Os pesquisadores descobriram que seu modelo menor de parâmetros de 14 bilhões atingiria o comprimento máximo do contexto 60% do tempo ao raciocinar, ficando essencialmente preso em loops intermináveis de pensamento.

Sua solução envolveu uma segunda etapa de treinamento que ensina modelos a parar de raciocínio em exatamente 30.000 tokens, reduzindo a geração abrangente em 65-79%, mantendo a maior parte do desempenho do raciocínio. Essa técnica de “controle de comprimento” pode ser valiosa para a comunidade de pesquisa de IA mais ampla.

“Modelos menores (<14b) tendem a pensar demais quando destilados, mas modelos maiores não”, observou pesquisador de IA Muyu ele em xdestacando informações do relatório técnico.

No entanto, Hermes 4 ainda enfrenta limitações comuns a modelos de código aberto. Apesar do desempenho impressionante de referência, os modelos exigem recursos computacionais significativos para executar e podem não corresponder à facilidade de uso ou confiabilidade dos serviços comerciais de IA para muitas aplicações.

Onde experimentar Hermes 4 e quanto custa comparado ao chatgpt e claude

Nous Research fez Hermes 4 Disponível através de vários canais, refletindo a filosofia de código aberto. Os pesos do modelo podem ser downloads gratuitamente no rosto de abraço, enquanto a empresa também oferece acesso à API por meio de sua interface de bate -papo renovada e parcerias com provedores de inferência como Chutes, Nebius e Luminal.

“Você pode experimentar o Hermes 4 na nova interface do usuário de bate -papo NOUS”, anunciou a empresa, destacando recursos como interações paralelas e um sistema de memória.

Para usuários e pesquisadores corporativos, os modelos representam uma alternativa potencialmente atraente ao pagamento pelo acesso da API a sistemas proprietários, especialmente para aplicações que exigem altos níveis de personalização ou manuseio de conteúdo sensível.

A imagem maior: o que Hermes 4 significa para o futuro do desenvolvimento da IA

O lançamento de Hermes 4 Representa mais do que apenas mais um lançamento do modelo de IA – é uma declaração sobre quem deve controlar o futuro da inteligência synthetic. Em um setor cada vez mais dominado por um punhado de gigantes da tecnologia com recursos praticamente ilimitados, a Nous Analysis demonstrou que a inovação ainda pode vir de lugares inesperados.

A abordagem da empresa levanta questões fundamentais sobre as trocas entre segurança e capacidade, entre controle corporativo e liberdade do usuário. Enquanto as principais empresas de tecnologia argumentam que a moderação cuidadosa do conteúdo e os corrimãos de segurança são essenciais para a implantação responsável da IA, a Nous Analysis sustenta que a transparência e a agência de usuários são mais importantes do que as restrições impostas às empresas.

Ainda não se sabe se essa filosofia será benéfica ou problemática. Mas uma coisa é certa: Hermes 4 mostrou que o futuro da IA não será determinado apenas pelas empresas com os bolsos mais profundos.

Em um campo em que as impossibilidades de ontem se tornam as mercadorias de amanhã, a pesquisa Nous acabou de provar que a única coisa mais perigosa do que uma IA que diz que não pode ser aquela que está disposta a dizer sim.

Insights diários sobre casos de uso de negócios com VB diariamente

Se você deseja impressionar seu chefe, o VB Day by day o cobriu. Damos a você uma informação interna sobre o que as empresas estão fazendo com a IA generativa, desde mudanças regulatórias a implantações práticas, para que você possa compartilhar informações para o ROI máximo.

Leia nossa Política de Privacidade

Obrigado por assinar. Confira mais boletins de VB aqui.

Ocorreu um erro.

avots

Facebook
Twitter
Pinterest
WhatsApp

Artigo anteriorÉ a temporada? O novo canal de Natal é lançado nas TVs dos Brits … e começará a mostrar clássicos festivos 111 dias antes!
Próximo artigoNova equipe de liderança verde escocesa a ser anunciada

Miguel Rocha

Nous Analysis derruba Hermes 4 Modelos de IA que superam o ChatGPT sem restrições de conteúdo

Como o modo de ‘raciocínio híbrido’ de Hermes 4 supera o chatgpt e o Claude em benchmarks matemáticos

Inside Dataforge e Atropos: os sistemas de treinamento inovadores por trás das capacidades do Hermes 4

Por que a Nous Analysis acredita

Como uma pequena startup com 192 GPUs está competindo contra os orçamentos de IA de bilhões de dólares da Huge Tech

A correção técnica que impediu Hermes 4 de pensar em loops sem fim

Onde experimentar Hermes 4 e quanto custa comparado ao chatgpt e claude

A imagem maior: o que Hermes 4 significa para o futuro do desenvolvimento da IA

DEIXE UMA RESPOSTA Cancelar resposta

Recente

Colaborador: Rotule os ramos da Irmandade Muçulmana como organizações terroristas

Spurs perto de assinar Simons após o interesse do Chelsea

A Apple’s Sydney Retailer parece um templo para a tecnologia –...

Manchester United ‘Make Ruben Amorim Sack Decisão como duas substituições identificadas’

Sean Dyche tombou para substituir Ruben Amorim em Man Utd –...

Lições de um contra-protesto de asilo: chamar de “fascista” de nossos...

A Liga dos Campeões empate na íntegra como Liverpool, Arsenal e...

O homem que jogou sanduíche no oficial federal em DC é...

Ciclista Campeão Chris Froome em terrível acidente de treinamento; condição ‘estável’...

Carta desenterrada expõe como os líderes católicos de Minnesota alertaram Walz...