Gemini 2.5 Flash é 150x mais caro que Gemini 2.0
Relembrando que, para o sucesso de qualquer modelo AI o factor preço se torna de importância fundamental o preço, temos uma grande disparidade entre modelos Gemini. O novo modelo de inteligência artificial da Google, Gemini 2.5 Flash, traz melhorias significativas no desempenho — mas também é acompanhado de um preço elevado. Uma análise recente revela que este modelo pode ser 150 vezes mais caro de operar do que o Gemini 2.0 Flash quando a capacidade de reasoning (raciocínio) está ativada. Este aumento de custo deve-se a dois motivos principais: os tokens de saída com reasoning custam agora até $3,50 por milhão, comparando com apenas $0,40 no Gemini 2.0. Além disso, o 2.5 Flash usa até 17 vezes mais tokens durante tarefas de raciocínio, o maior consumo alguma vez registado neste tipo de operações. Ainda assim, o modelo justifica-se em cenários mais exigentes. Regista uma melhoria de 12 pontos no Artificial Analysis Intelligence Index, tornando-o mais adequado para casos de uso onde o 2.0 possa não ser suficiente. E mesmo com o aumento de preço, o custo por token continua ligeiramente abaixo do o4-mini da OpenAI. Para muitos programadores, no entanto, o Gemini 2.5 Flash com reasoning ativado pode não ser a melhor opção por defeito. Em várias situações, pode ser mais sensato continuar a usar o Gemini 2.0 Flash ou optar pelo 2.5 Flash com o raciocínio desligado, equilibrando custo e desempenho.

O novo modelo de inteligência artificial da Google, Gemini 2.5 Flash, traz melhorias significativas no desempenho — mas também é acompanhado de um preço elevado. Uma análise recente revela que este modelo pode ser 150 vezes mais caro de operar do que o Gemini 2.0 Flash quando a capacidade de reasoning (raciocínio) está ativada.
Este aumento de custo deve-se a dois motivos principais: os tokens de saída com reasoning custam agora até $3,50 por milhão, comparando com apenas $0,40 no Gemini 2.0. Além disso, o 2.5 Flash usa até 17 vezes mais tokens durante tarefas de raciocínio, o maior consumo alguma vez registado neste tipo de operações.
Ainda assim, o modelo justifica-se em cenários mais exigentes. Regista uma melhoria de 12 pontos no Artificial Analysis Intelligence Index, tornando-o mais adequado para casos de uso onde o 2.0 possa não ser suficiente. E mesmo com o aumento de preço, o custo por token continua ligeiramente abaixo do o4-mini da OpenAI.
Para muitos programadores, no entanto, o Gemini 2.5 Flash com reasoning ativado pode não ser a melhor opção por defeito. Em várias situações, pode ser mais sensato continuar a usar o Gemini 2.0 Flash ou optar pelo 2.5 Flash com o raciocínio desligado, equilibrando custo e desempenho.