O Google anunciou o lançamento do Gemini 3.1 Flash-Lite, nova versão de seu modelo de inteligência artificial voltado para tarefas rápidas e de alto volume. A atualização prioriza velocidade de resposta, eficiência operacional e custo reduzido para empresas e desenvolvedores.
Considerado o modelo multimodal mais econômico da família Gemini, o Flash-Lite foi projetado para aplicações de baixa latência, em que rapidez e orçamento são fatores críticos. Entre os principais usos estão chatbots de atendimento ao cliente, processamento de mensagens, análise de avaliações e gestão de tíquetes de suporte.
O sistema também pode atuar na conversão de áudio em texto, extração de dados simples e análise de feedbacks de consumidores em plataformas digitais. Outra aplicação é o processamento e resumo de documentos, facilitando a triagem rápida de grandes volumes de arquivos.
De acordo com o Google, o novo modelo apresenta melhorias significativas em relação à geração anterior. O tempo de resposta ao primeiro token é até duas vezes e meia mais rápido, enquanto a velocidade de geração de respostas pode ser até 45% maior. Em testes de benchmark, o Gemini 3.1 Flash-Lite superou modelos concorrentes voltados a tarefas semelhantes, incluindo versões compactas de outras IAs do mercado.
Outro destaque está no custo de operação. O modelo tem preço de US$ 0,25 por 1 milhão de tokens de entrada e US$ 1,50 por 1 milhão de tokens de saída, tornando-se a opção mais barata dentro da série Gemini.
Inicialmente, o Gemini 3.1 Flash-Lite está disponível em versão prévia para desenvolvedores por meio da API Gemini no Google AI Studio. Empresas também podem acessar o modelo antecipadamente pela plataforma Vertex AI, voltada para aplicações corporativas.
Créditos da imagem: Google