Depois de ver toda a banana-Fanfare da mais nova ferramenta generativa de IA do Google, eu sabia que tinha que dar uma volta. Nomeado Gemini 2.5 Flash Picture, o modelo atualizações Sua capacidade de editar suas fotos nativamente em Gêmeos. Os entusiastas da IA se referiram a ele como o modelo “Nano Bananas”, estimulado por uma série de teasers com tema de banana de Google executivos.
Nas poucas semanas, as pessoas criaram mais de 200 milhões de imagens de IA e mais de 10 milhões de pessoas se inscreveram para usar o aplicativo Gemini, de acordo com Para Josh Woodward, vice -presidente do Google do Google Labs e Gemini.
O Google investiu pesadamente em seus modelos de mídia generativa este ano, lançando versões atualizadas de seus modelos de gerador de imagem e vídeo em sua conferência anual de desenvolvedores de E/S. O gerador de vídeo AI do Google, VEO 3, atordoado com áudio sincronizado, o primeiro entre os gigantes da AI. E os criadores fizeram mais de 100 milhões de vídeos de IA com a ferramenta de cineasta da AI do Google, Stream.
Passei muito tempo testando o software program criativo da IA e fiquei empolgado ao ver o que o Google havia preparado. Mas meu teste de 2,5 flash imagem mostrou que apenas porque algo tem uma entrada chamativa não significa que sempre vá até o seu hype. Eis como foi minha experiência com Gemini Nano Bananas: o bom, o ruim e o frustrante.
O que funcionou
O modelo Gemini Bananas é assustadoramente bom em adicionar elementos às imagens existentes, misturando elementos gerados pela IA em qualquer imagem que você quebrou. Ele também mantém um nível decentemente estável de consistência do personagem – o que significa que as pessoas nas minhas fotos não estavam muito distorcidas ou instáveis depois de passar pelo processamento da IA. Essas são distinções importantes para programas de imagem de IA, e algo que o Google disse que funcionou para melhorar.
Você pode ver essas duas características nesta foto da minha irmã e de mim. Nossas aparências gerais permanecem inalteradas na versão editada (à direita), mostrando essa consistência de personagem. Pedi Gemini para adicionar uma terceira irmã que parecia parecida com nós dois, o que foi assustadoramente bem, adicionando uma terceira mulher entre nós dois.
Bem-vindo à família, irmã AI de aparência assustadora e assustadora.
Também fiquei bastante impressionado com a rapidez com que Gêmeos poderia cuspir imagens completas. Em qualquer lugar, menos de um minuto recebe uma estrela de ouro de mim, e Gemini estava lidando regularmente com pedidos em menos de 15 segundos. Também apreciei como ele acrescentou uma marca d’água a todas as imagens que criou e editou-mesmo que eu não ame como as empresas de tecnologia corromperam o emoji de Sparkles para a IA, é extremamente importante ter alguns marcadores de conteúdo gerado pela IA. O trabalho sintid e nos bastidores do Google também ajuda a diferenciar o conteúdo de IA das imagens criadas pelo homem.
Gêmeos também é bom na criação de imagens de AI por atacado, mas eu recomendo usar o Imagen 4 ou outro gerador de imagem da IA-eles têm mais controles e configurações práticas que o aproximam do que deseja com menos trabalho.
O que realmente não funcionou
Existem sérias limitações para as bananas de Gêmeos. Ele gerou automaticamente imagens quadradas e solicitações de acompanhamento solicitando que as imagens sejam adaptadas em outras dimensões foram ignoradas ou falhadas.
Também notei que Gemini reduziu a resolução de muitas das minhas fotos. Tiro principalmente fotos com o meu iPhone 16, que tem câmeras estelares, mas depois de passar pelo modelo de bananas Gemini, esses detalhes eram frequentemente borrados. Isso é irritante e não vai conquistar nenhum fotógrafo.
Apesar do meu pedido de alegrar os anéis do alvo, a foto authentic (à esquerda) tem mais riqueza e textura do que a AI-editada (à direita).
Tentei repetidamente fazer Gêmeos lidar com edições de fotos que teriam sido difíceis de fazer manualmente. Essa é uma área na edição de fotos em que a IA deve se destacar-automatizando edições mundanas, mas com detalhes intensivos. Infelizmente, Gêmeos realmente lutou com a rápida adesão aqui, o que significa que não fez o que eu pedi.
Tentei muitas vezes fazer Gêmeos remover os reflexos de um estalo de um pôster mais estranho na sexta -feira, mas eles permaneceram teimosamente. E quanto mais eu tentava removê -lo para remover as reflexões, mais pobre a qualidade da imagem se tornava a cada immediate. Uma vez que o texto claro foi ilegível depois que finalmente desisti, sem mencionar os danos acidentais e de aparência assustadora causados aos rostos de Lindsey Lohan e Jamie Lee Curtis.
As bananas Nano Gêmeos lutaram para gerar imagens em diferentes dimensões. As imagens de redimensionamento e corte são um processo de edição de fotos essenciais, mas Gemini não – ou não poderia – lidar com diretrizes simples de dimensionamento em meus avisos.
Tudo o que eu queria period que Gemini removesse o reflexo no canto superior direito do pôster, mas, em vez disso, ele deformou a linha e os rostos do filme.
Entrei no Google sobre os problemas de resolução e dimensão e um porta -voz disse que a empresa de tecnologia está “ciente e trabalhando ativamente nos dois problemas. Foi uma grande atualização do nosso modelo anterior, mas continuaremos melhorando o modelo”.
No geral, a Gemini Nano Bananas provou -me que o Google é sério sobre continuar a dominar em mídia generativa. Mas possui armadilhas significativas, com foco muito grande na geração de novos elementos, em vez de usar a IA para melhorar e ajustar problemas comuns. Por enquanto, o modelo Nano Bananas é mais adequado para os fãs de Gemini que desejam fazer grandes edições rapidamente. Para aqueles que procuram ferramentas mais precisas, teremos que esperar pela próxima grande atualização do Google ou encontrar outro programa.
Disponibilidade, preços e privacidade de Bananas Nano Nano Gêmeos
Você não precisa fazer nada para acessar o novo modelo; Ele é adicionado automaticamente ao modelo Flash Base Gemini 2.5. Gêmeos está disponível gratuitamente, com mais modelos e maiores limites de uso disponíveis nos planos de IA do Google começando em US $ 20 por mês.
Se você é um assinante pagador, também poderá acessar o modelo através do Google AI Studio. A partir daí, tudo o que você precisa fazer é fazer add de uma imagem e digitar seu immediate. Cada immediate usa de um a dois mil tokens, dependendo do nível de detalhe necessário. Os usuários da Adobe Specific e Firefly também podem acessar o novo modelo agora.
Google’s Política de privacidade de Gêmeos Diz que ele pode usar as informações que você carrega para melhorar seus produtos de IA, e é por isso que a empresa recomenda evitar o add de informações sensíveis ou privadas. A empresa Política de uso proibitivo da IA Também proíbe a criação de materials ilegal ou abusivo.
Para mais informações, confira os melhores geradores de imagens de IA e tudo anunciado no evento Made by Google Pixel 10.