Gêmeos é melhor em editar suas imagens com uma nova atualização de modelo do Google DeepMind.
O modelo, que chegou ao topo da tabela de classificação Lmarena sob o pseudônimo de “nano banana”, é realmente chamado Imagem flash de Gemini 2.5. A equipe do Google DeepMind diz que esse modelo foi treinado para tornar os sujeitos mais consistentes em várias edições de imagens geradas pela IA. Esse tem sido um problema para os modelos de imagem de IA, dada sua natureza imprevisível.
Apple Eyes Google Gemini for Siri Improve
A capacidade de fazer add e editar nativamente fotos em gêmeos existe desde abril deste ano. Em vez de aprender os envolvimentos técnicos do software program de edição de fotos, como o Photoshop, os usuários podem fazer add de uma imagem para Gemini e descrever as alterações que desejam em termos simples, não é necessário jargão. Com Modelo atualizado de GêmeosO Google diz que você pode fazer coisas como mudar a roupa e a localização de um assunto, mantendo a semelhança da mesma forma.
Velocidade de luz mashable
Você também pode fazer add de várias fotos e fazer com que os assuntos apareçam juntos na mesma foto, ou adicionar e alterar detalhes específicos em uma imagem enviada para, digamos, ver como é uma sala com uma cor diferente de tinta ou móveis diferentes.
Aqui está a tentativa de Gemini de editar meu cachorro no cachorro descendente e se mudar para um estúdio de ioga. Sua semelhança é a mesma, e editou com sucesso a imagem para deixar seus olhos abertos, mas seu corpo não está arqueado da maneira que deveria ser. (Eu saberia, eu já vi essa pose divertida dela muitas vezes.)
Aqui está meu cachorro Lola, não fazendo ioga
Crédito: Mashable

Aqui está a versão editada geminia-se quando eu a levei a abrir os olhos, colocá-la na pose de cachorro descendente e mudar o fundo para um estúdio de ioga. Está perto, mas não muito certo.
Crédito: Mashable
Como o Google Deepmind disse em seu anúncio, o modelo nem sempre pode acertar. Ainda pode haver imprecisões com detalhes finos, texto na imagem e inconsistências. Com o meu experimento, o pêlo do meu cachorro parece muito suave, mas sua coloração, tamanho e forma em geral permanecem os mesmos. Todas as imagens têm uma marca d’água visível e uma marca d’água invisível chamada Synthid para mitigar qualquer confusão sobre se eles são reais ou gerados pela IA. Esta atualização agora está ativa, para que você possa experimentá -lo no aplicativo Gemini.
Tópicos
Inteligência synthetic Google Gemini