OpenAI lança ChatGPT Images 2.0: o gerador de imagens que pensa antes de criar

Nova versão da ferramenta de geração visual da OpenAI usa raciocínio interno para planejar composições, resolve problemas históricos com textos e alfabetos não-latinos, e chega com resolução de até 2K, disponível hoje para todos os usuários

A OpenAI acaba de lançar o ChatGPT Images 2.0, a nova versão de seu gerador de imagens por inteligência artificial — e a novidade central não está apenas na qualidade visual, mas na forma como o sistema trabalha antes de produzir qualquer imagem. Lançada nesta quarta-feira (22), a ferramenta introduz um modo de raciocínio que faz o modelo parar, planejar e refletir sobre o que irá gerar antes de renderizar qualquer pixel.

A IA que pensa antes de criar

A grande aposta técnica do ChatGPT Images 2.0 é trazer para a geração de imagens a mesma lógica dos modelos de linguagem que “pensam antes de responder”. Ao ativar o modo de raciocínio, o sistema planeja internamente a composição visual, verifica relações espaciais entre os elementos da cena, conta objetos e analisa a consistência do conjunto — e só então inicia a renderização.

Essa abordagem resolve um problema crônico dos geradores de imagem: a tendência de produzir resultados visualmente coerentes à primeira vista, mas que falham em detalhes específicos pedidos pelo usuário. Com o planejamento interno, a ferramenta passa a seguir instruções com muito mais precisão, preservar detalhes solicitados e entregar composições densas com fidelidade ao que foi descrito.

A OpenAI descreveu o resultado como capaz de “conceitualizar imagens mais sofisticadas e verdadeiramente trazer essa visão à vida de forma efetiva, seguir instruções, preservar detalhes pedidos e renderizar os elementos refinados que com frequência quebram modelos de imagem: textos pequenos, iconografia, elementos de interface do usuário, composições densas e restrições estilísticas sutis” — tudo com resolução de até 2K.

O fim dos menus com palavras inventadas

Um dos pontos mais celebrados pelos usuários dos geradores de imagem ao longo dos anos é, ironicamente, um de seus maiores problemas: textos ilegíveis ou com palavras inexistentes dentro das imagens. Pedir a geração do cardápio de um restaurante, por exemplo, frequentemente resultava em neologismos culinários absurdos dispostos em fontes distorcidas.

O ChatGPT Images 2.0 ataca esse problema em duas frentes. A primeira é puramente técnica: com resolução de até 2K e melhor manuseio de elementos densos, o modelo lida com textos de forma muito mais precisa. A segunda é geográfica — e especialmente significativa: a OpenAI destaca avanços expressivos na renderização de textos em japonês, coreano, chinês, hindi e bengali, línguas que somam mais de dois bilhões de falantes nativos e que historicamente saíam deformadas ou ilegíveis nos geradores ocidentais.

O que muda para usuários pagos

Para assinantes dos planos Plus, Pro, Business e Enterprise, o modo de raciocínio libera ainda mais capacidades. O gerador pode consultar a web em tempo real para buscar referências e dados durante o processo de criação — uma funcionalidade que transforma radicalmente o desempenho em infográficos, diagramas e materiais educativos que exigem precisão factual, não apenas apelo estético.

Outra novidade é a geração em série: o sistema compreende múltiplos pedidos individualmente dentro de uma mesma sequência e pode produzir até 8 imagens de uma única vez, mantendo consistência entre os quadros. A OpenAI cita como exemplos de uso páginas de mangá, fotografias com aspecto de câmera digital, páginas de design gráfico e fotos simulando textos escritos à mão — todos casos em que a coerência entre uma imagem e outra é tão importante quanto a qualidade individual de cada uma.

Disponibilidade e acesso

O ChatGPT Images 2.0 está disponível a partir de hoje para todos os usuários do ChatGPT e do Codex. As funções avançadas de raciocínio ficam restritas às assinaturas pagas. O modelo também está disponível via API para desenvolvedores, com precificação variável conforme a resolução e a qualidade da saída escolhidas.

Artigo Anterior

China Cria IA que se aprimora sozinha e supera pesquisadores humanos em quase três vezes

Escreva um comentário

Leave a Comment

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *