A Google iniciou a implementação gradual de uma nova funcionalidade de edição de imagens em sua plataforma Gemini. A funcionalidade começou a ser disponibilizada hoje e será progressivamente acessível para mais usuários, abrangendo mais de 45 idiomas e a maioria dos países nas próximas semanas.
Essa capacidade de edição nativa permite que os usuários modifiquem fotografias diretamente na interface do Gemini, utilizando comandos de texto para obter resultados integrados e contextualizados.
Edição de imagem inteligente e integrada
A nova ferramenta apresenta um fluxo de edição descrito pela Google como “multi-passo”, capaz de gerar respostas “mais ricas e contextuais” que combinam texto e imagem. Isso significa que o usuário pode, por exemplo, carregar uma fotografia e solicitar ao Gemini simulações de diferentes cores de cabelo, alterações no fundo da imagem ou substituições e adições de elementos na cena, tudo dentro da plataforma.
A Google oferece exemplos práticos: um usuário pode carregar uma foto e pedir ao Gemini para gerar uma imagem com diferentes cores de cabelo, ou solicitar a criação de um rascunho de uma história sobre dragões, acompanhada por imagens pertinentes.
Essa funcionalidade é baseada em um modelo de IA que já havia sido testado na plataforma AI Studio em março, conhecido por sua habilidade de remover marcas d’água. De forma semelhante a outras ferramentas de IA generativa, como as atualizações do ChatGPT, espera-se que a edição integrada no Gemini produza resultados mais refinados em comparação a geradores de imagem autônomos.
Preocupações e medidas de segurança
O surgimento de ferramentas com essa capacidade levanta preocupações sobre usos indevidos, particularmente em relação à criação de deepfakes. Para mitigar esses riscos, a Google afirma que todas as imagens criadas ou editadas por meio da nova funcionalidade do Gemini conterão uma marca d’água invisível. Além disso, a empresa está explorando a possibilidade de implementar marcas d’água visíveis nas imagens geradas pelo Gemini, como parte de um esforço para aumentar a transparência sobre a origem do conteúdo.