Google обновила свою флагманскую модель Gemini: чем она лучше конкурентов

Gemini 2.5 Pro анализирует информацию подобно человеку, выстраивая логические цепочки вместо простой генерации текста. Google выпустила свою самую продвинутую ИИ-модель — Gemini 2.5 Pro Experimental. Ключевое отличие новинки от предшественников и конкурентов — способность к глубокому рассуждению. ИИ теперь не просто выдает ответы, а анализирует информацию, выстраивает логические связи и принимает взвешенные решения. Модель заняла первое место в рейтинге LMArena с существенным отрывом от конкурентов. Этот рейтинг оценивает предпочтения пользователей и показывает, насколько качественно и стильно ИИ выполняет сложные задачи. В математических и научных тестах Gemini 2.5 Pro также демонстрирует впечатляющие результаты. Без использования дополнительных техник, увеличивающих стоимость вычислений, модель лидирует в тестах GPQA и AIME 2025. В тесте Humanity’s Last Exam, созданном сотнями экспертов для проверки границ человеческих знаний и рассуждений, Gemini 2.5 Pro набрал рекордные 18,8%. Программирование стало одним из приоритетных направлений развития для команды Google. Новая версия Gemini совершила значительный скачок по сравнению с предшественником. Модель теперь создает визуально привлекательные веб-приложения и агентные программные решения, а также отлично справляется с трансформацией и редактированием кода. В тесте SWE-Bench Verified, отраслевом стандарте для оценки агентного кода, Gemini 2.5 Pro показал результат 63,8%.

Мар 26, 2025 - 11:49
 0
Google обновила свою флагманскую модель Gemini: чем она лучше конкурентов

Gemini 2.5 Pro анализирует информацию подобно человеку, выстраивая логические цепочки вместо простой генерации текста.

Google выпустила свою самую продвинутую ИИ-модель — Gemini 2.5 Pro Experimental. Ключевое отличие новинки от предшественников и конкурентов — способность к глубокому рассуждению. ИИ теперь не просто выдает ответы, а анализирует информацию, выстраивает логические связи и принимает взвешенные решения.

Модель заняла первое место в рейтинге LMArena с существенным отрывом от конкурентов. Этот рейтинг оценивает предпочтения пользователей и показывает, насколько качественно и стильно ИИ выполняет сложные задачи.

В математических и научных тестах Gemini 2.5 Pro также демонстрирует впечатляющие результаты. Без использования дополнительных техник, увеличивающих стоимость вычислений, модель лидирует в тестах GPQA и AIME 2025. В тесте Humanity’s Last Exam, созданном сотнями экспертов для проверки границ человеческих знаний и рассуждений, Gemini 2.5 Pro набрал рекордные 18,8%.

Программирование стало одним из приоритетных направлений развития для команды Google. Новая версия Gemini совершила значительный скачок по сравнению с предшественником. Модель теперь создает визуально привлекательные веб-приложения и агентные программные решения, а также отлично справляется с трансформацией и редактированием кода. В тесте SWE-Bench Verified, отраслевом стандарте для оценки агентного кода, Gemini 2.5 Pro показал результат 63,8%.