Quer insights mais inteligentes em sua caixa de entrada? Inscreva -se para que nossos boletins semanais obtenham apenas o que importa para a IA, dados e líderes de segurança corporativos. Inscreva -se agora
Nous Researchuma startup secreta de inteligência synthetic que emergiu como uma voz de liderança no movimento de IA de código aberto, lançado silenciosamente Hermes 4 Na segunda -feira, uma família de grandes modelos de idiomas que a empresa afirma pode corresponder ao desempenho dos principais sistemas proprietários, oferecendo controle de usuário sem precedentes e restrições mínimas de conteúdo.
O lançamento representa uma escalada significativa na batalha entre os defensores da IA de código aberto e as principais empresas de tecnologia sobre quem deve controlar o acesso a recursos avançados de inteligência synthetic. Ao contrário dos modelos de OpenaiAssim, Googleou AntrópicoHermes 4 foi projetado para responder a quase qualquer solicitação sem os corrimãos de segurança que se tornaram padrão nos sistemas comerciais de IA.
A Nous Analysis apresenta Hermes 4, nossa última linha de modelos de raciocínio híbrido.https://t.co/e5ew9hburb
O Hermes 4 se baseia em nosso legado de modelos alinhados ao usuário com recursos expandidos de computação no tempo de teste.
Atenção especial foi dada a tornar os modelos criativos e interessantes para… pic.twitter.com/52vjnvrdwm
– Nous Analysis (@NousRearch) 26 de agosto de 2025
“O Hermes 4 se baseia em nosso legado de modelos alinhados ao usuário com recursos expandidos de computação no tempo de teste”, anunciou a Nous Analysis no X (anteriormente Twitter). “Atenção especial foi dada a tornar os modelos criativos e interessantes para interagir, sem onerados pela censura e alinhados neutamente, mantendo o desempenho de matemática, codificação e raciocínio de nível de última geração para modelos de peso aberto”.
Como o modo de ‘raciocínio híbrido’ de Hermes 4 supera o chatgpt e o Claude em benchmarks matemáticos
Hermes 4 Introduz o que a Nous Analysis chama de “raciocínio híbrido”, permitindo que os usuários alternem entre respostas rápidas e processos de pensamento mais profundos e passo a passo. Quando ativado, os modelos geram seu raciocínio interno em especial
Tags antes de fornecer uma resposta ultimate – semelhante aos modelos de raciocínio O1 da OpenAI, mas com whole transparência no processo de pensamento da IA.
Ai escala atinge seus limites
Capitões de energia, custos crescentes de token e atrasos de inferência estão remodelando a IA corporativa. Junte -se ao nosso salão exclusivo para descobrir como são as principais equipes:
- Transformando energia em uma vantagem estratégica
- Arquitetagem Inferência eficiente para ganhos reais de rendimento
- Desbloqueando o ROI competitivo com sistemas de IA sustentáveis
Prenda seu lugar para ficar à frente:
A conquista técnica é substancial. Nos testes, o maior modelo de parâmetro de 405 bilhões de Hermes 4 obteve 96,3% no MATH-500 Benchmark no modo de raciocínio e 81,9% no desafio Competição de matemática de Aime’24 – Desempenho que rivaliza ou excede muitos sistemas proprietários que custam milhões a mais a serem desenvolvidos.
“O desafio é tornar os traços de pensamento úteis e verificáveis sem raciocínio descontrolado”, observou o pesquisador da IA Rohan Paul em Xdestacando um dos avanços técnicos no lançamento.
Talvez mais notavelmente, Hermes 4 alcançou a pontuação mais alta entre todos os modelos testados em “Recusalbench”, uma nova pesquisa de referência criada para medir a frequência com que os sistemas de IA se recusam a responder perguntas. O modelo obteve 57,1percentno modo de raciocínio, superando significativamente o GPT-4O (17,67%) e o claude Sonnet 4 (17%).
Inside Dataforge e Atropos: os sistemas de treinamento inovadores por trás das capacidades do Hermes 4
Por trás das capacidades do Hermes 4, há uma sofisticada infraestrutura de treinamento que Nous Research desenvolveu ao longo de vários anos. Os modelos foram treinados usando dois novos sistemas: Dataforgeum gerador de dados sintéticos baseado em gráfico e Atroposuma estrutura de aprendizado de reforço de código aberto.
Dataforge Cria dados de treinamento através do que a empresa descreve como “caminhadas aleatórias” através de gráficos direcionados, transformando dados simples de pré-treinamento em exemplos complexos de seguidores de instruções. O sistema pode, por exemplo, pegar um artigo da Wikipedia e transformá -lo em uma música de rap, depois gerar perguntas e respostas com base nessa transformação.
AtroposEnquanto isso, opera como centenas de ambientes de treinamento especializados, onde os modelos de IA praticam habilidades específicas – matemática, codificação, uso de ferramentas e escrita criativa – recebendo suggestions apenas quando produzem soluções corretas. Essa abordagem de “amostragem de rejeição” garante que apenas respostas verificadas e de alta qualidade entrem nos dados de treinamento.
ATROPOS é a estrutura de aprendizado de reforço Nous
O Atropos é um ambiente de aprendizado de reforço de código aberto da Nous que possui centenas de “academias” (como matemática, codificação, jogos, uso de ferramentas, visão) para treinar e avaliar trajetórias de LLM por meio de loops escaláveis e assíncronos.
Em outras palavras… pic.twitter.com/fjxaqkclez
– Tommy (@Shaughnessy119) 26 de agosto de 2025
“O Nous usou esses ambientes para gerar o conjunto de dados para Hermes 4!” explicado Tommy Shaughnessyum capitalista de risco em Delphi Ventures que investiu em pesquisas NOUS. “Tudo no conjunto de dados contém 3,5 milhões de amostras de raciocínio e 1,6 milhão de amostras que não são rucas! Hermes foi treinado em dados de RL, não apenas conjuntos de dados estáticos de pergunta e resposta!”
O processo de treinamento exigiu 192 nvidia B200 GPUS e 71.616 horas da GPU para o maior modelo – um investimento computacional significativo, mas não sem precedentes, que demonstra como as técnicas especializadas podem competir com a enorme escala de gigantes da tecnologia.
Por que a Nous Analysis acredita
Nous Research construiu sua reputação em uma filosofia que coloca o controle do usuário acima das políticas de conteúdo corporativo. Os modelos da empresa foram projetados para serem “orientáveis”, o que significa que eles podem ser ajustados ou solicitados a se comportar de maneiras específicas sem as rígidas restrições de segurança que caracterizam os sistemas comerciais de IA.
“Hermes 4 não é algemado por isenções de responsabilidade, regras e ser excessivamente cauteloso, o que é irritante como o inferno e prejudica a inovação e a usabilidade”, escreveu Shaughnessy em um tópico detalhado analisando o lançamento. “Se seu código aberto, mas recusa todos os solicita seu inútil. Não é um problema com Hermes 4.”
Hermes 4 não é algemado por isenções de isenções, regras e ser excessivamente cauteloso, o que é irritante como o inferno e prejudica a inovação e a usabilidade.
Hermes 4 70B está no oposto completo do modelo de código aberto do Spectrum vs Openai. É também ~ 4x mais aberto vs chatgpt 4o!
Se estiver aberto … pic.twitter.com/q5rpx1oozo
– Tommy (@Shaughnessy119) 26 de agosto de 2025
Esta abordagem fez Nous Research Widespread entre pesquisadores e desenvolvedores de IA que desejam a máxima flexibilidade, mas também coloca a empresa no centro de debates em andamento sobre a segurança da IA e a moderação do conteúdo. Embora os modelos possam teoricamente ser usados para fins prejudiciais, a Nous Analysis argumenta que a transparência e o controle do usuário são preferíveis à gatekeeping corporativo.
A empresa Relatório TécnicoLançado ao lado dos modelos, fornece detalhes sem precedentes sobre o processo de treinamento, os resultados da avaliação e até as saídas de texto reais dos testes de referência. “Acreditamos que este relatório outline um novo padrão para transparência no benchmarking”, afirmou a empresa.
Como uma pequena startup com 192 GPUs está competindo contra os orçamentos de IA de bilhões de dólares da Huge Tech
Hermes 4A liberação é um momento essential na indústria de IA. Embora as principais empresas de tecnologia tenham investido bilhões no desenvolvimento de sistemas de IA cada vez mais poderosos, um movimento crescente de código aberto argumenta que essas capacidades não devem ser controladas por um punhado de corporações.
Recentes meses tiveram avanços significativos na IA de código aberto, com modelos como a Meta’s LLAMA 3.1Assim, R1 de Deepseeke Qwen do Alibaba Série alcançando o desempenho que rivaliza com sistemas proprietários. Hermes 4 representa mais uma etapa nesta progressão, particularmente na área de raciocínio – considerou uma força de sistemas fechados como Openi’s O1.
“Primeiro, Nous é uma startup com dezenas de pessoas extremamente talentosas”. notou Shaughnessy. “Eles não têm os gastos com capex de US $ 100 bilhões de US $ 100 bilhões de um hiperescalador nem mil e 1.000 dos funcionários e, apesar de continuarem a lançar modelos e pesquisas inovadores em um ritmo insano”.
A startup, que levantou US $ 65 milhões em financiamento no início deste ano liderado por Paradigmatambém está desenvolvendo Rede de psiquesum sistema de treinamento distribuído que visa coordenar o treinamento de IA em computadores conectados à Web usando a tecnologia blockchain.
A correção técnica que impediu Hermes 4 de pensar em loops sem fim
Um de Hermes 4As contribuições técnicas mais significativas são de um problema que atormenta os modelos de raciocínio: processos de pensamento excessivamente longo. Os pesquisadores descobriram que seu modelo menor de parâmetros de 14 bilhões atingiria o comprimento máximo do contexto 60% do tempo ao raciocinar, ficando essencialmente preso em loops intermináveis de pensamento.
Sua solução envolveu uma segunda etapa de treinamento que ensina modelos a parar de raciocínio em exatamente 30.000 tokens, reduzindo a geração abrangente em 65-79%, mantendo a maior parte do desempenho do raciocínio. Essa técnica de “controle de comprimento” pode ser valiosa para a comunidade de pesquisa de IA mais ampla.
“Modelos menores (<14b) tendem a pensar demais quando destilados, mas modelos maiores não”, observou pesquisador de IA Muyu ele em xdestacando informações do relatório técnico.
No entanto, Hermes 4 ainda enfrenta limitações comuns a modelos de código aberto. Apesar do desempenho impressionante de referência, os modelos exigem recursos computacionais significativos para executar e podem não corresponder à facilidade de uso ou confiabilidade dos serviços comerciais de IA para muitas aplicações.
Onde experimentar Hermes 4 e quanto custa comparado ao chatgpt e claude
Nous Research fez Hermes 4 Disponível através de vários canais, refletindo a filosofia de código aberto. Os pesos do modelo podem ser downloads gratuitamente no rosto de abraço, enquanto a empresa também oferece acesso à API por meio de sua interface de bate -papo renovada e parcerias com provedores de inferência como Chutes, Nebius e Luminal.
“Você pode experimentar o Hermes 4 na nova interface do usuário de bate -papo NOUS”, anunciou a empresa, destacando recursos como interações paralelas e um sistema de memória.
Para usuários e pesquisadores corporativos, os modelos representam uma alternativa potencialmente atraente ao pagamento pelo acesso da API a sistemas proprietários, especialmente para aplicações que exigem altos níveis de personalização ou manuseio de conteúdo sensível.
A imagem maior: o que Hermes 4 significa para o futuro do desenvolvimento da IA
O lançamento de Hermes 4 Representa mais do que apenas mais um lançamento do modelo de IA – é uma declaração sobre quem deve controlar o futuro da inteligência synthetic. Em um setor cada vez mais dominado por um punhado de gigantes da tecnologia com recursos praticamente ilimitados, a Nous Analysis demonstrou que a inovação ainda pode vir de lugares inesperados.
A abordagem da empresa levanta questões fundamentais sobre as trocas entre segurança e capacidade, entre controle corporativo e liberdade do usuário. Enquanto as principais empresas de tecnologia argumentam que a moderação cuidadosa do conteúdo e os corrimãos de segurança são essenciais para a implantação responsável da IA, a Nous Analysis sustenta que a transparência e a agência de usuários são mais importantes do que as restrições impostas às empresas.
Ainda não se sabe se essa filosofia será benéfica ou problemática. Mas uma coisa é certa: Hermes 4 mostrou que o futuro da IA não será determinado apenas pelas empresas com os bolsos mais profundos.
Em um campo em que as impossibilidades de ontem se tornam as mercadorias de amanhã, a pesquisa Nous acabou de provar que a única coisa mais perigosa do que uma IA que diz que não pode ser aquela que está disposta a dizer sim.
avots