Início Tecnologia O misterioso projeto de ‘nano-balana’ revelou ser o mais recente editor de...

O misterioso projeto de ‘nano-balana’ revelou ser o mais recente editor de imagens do Google

27
0

O Google acabou de atualizar seu modelo de imagem de IA e, na verdade, parece ser um avanço bastante significativo. A empresa lançou a imagem flash Gemini 2.5 hoje, uma grande atualização que promete geração de imagem mais inteligente e flexível.

O modelo atualizado permite que os usuários emitam instruções de linguagem pure para não apenas gerar imagens, mas também mesclar fotos existentes e fazer edições mais precisas sem criar distorções estranhas. Também explora o “conhecimento mundial” de Gêmeos para entender melhor o que está gerando.

Essa atualização ocorre quando o Google tenta fechar a lacuna com o líder da indústria, Openai. No passado, a geração de imagens period um dos principais driver da IA. O uso do ChatGPT disparou em março, quando a empresa lançou seu gerador de imagens nativas do GPT-4O. Os memes virais do Studio Ghibli gerados pelo modelo resultaram na empresa Modelos de GPU derretendode acordo com o CEO da Openai, Sam Altman. ChatGpt atualmente tem acabado 700 milhões de usuários semanais. Em comparação, o CEO do Google, Sundar Pichai 450 milhões de usuários mensaisainda está atrás do chatgpt.

https://www.youtube.com/watch?v=bi-wi2q_xog

Com sua última atualização, o Google diz que resolveu uma das maiores dores de cabeça da IA. Até agora, manter caracteres ou objetos consistentes em várias edições tem sido um grande desafio para os geradores de imagens de IA.

““Agora você pode colocar o mesmo personagem em ambientes diferentes, mostrar um único produto de vários ângulos em novas configurações ou gerar ativos consistentes da marca, enquanto preservam o assunto ” a empresa escreveu em um Postagem do blog.

O Google diz que os usuários agora podem fazer ajustes muito específicos com apenas um immediate. Por exemplo, os usuários podem embaçar o plano de fundo de uma imagem, remover uma mancha de uma camiseta, alterar a pose de um sujeito ou até adicionar cores a uma foto em preto e branco.

Mesmo antes do seu lançamento oficial, o novo modelo estava virando a cabeça na plataforma de avaliação de crowdsourcing Lmarena, onde parecia anonimamente sob o nome “Nano-Banana”. Um X usuário Compartilhou como eles usaram nano-banana para mudar a camisa de Altman em uma foto. O resultado foi surpreendentemente bom. Hoje, o Google deu um passo à frente e reivindicou a propriedade do modelo, revelando que a nano-banana period de fato a imagem flash Gemini 2.5.

Além de estar disponível no aplicativo Gemini, o novo modelo agora está acessível aos desenvolvedores através da API Gemini, Google AI Studio e Vertex AI. O Google já criou vários aplicativos de modelo que utilizam o novo modelo no Google AI Studio, o assistente de IA codificante da empresa, e disse que os usuários podem vibrar o código sobre eles.

A empresa também disse que alguns desenvolvedores já experimentaram o aplicativo para ver como seria útil em cenários do mundo actual, como criar cartões de listagem de imóveis, crachás uniformes de funcionários e maquete de produtos.

avots