hi-tech.mail.ru

DeepSeek готовит прорыв: что известно про новые модели

Искусственный интеллект научился сам себя улучшать без прямого вмешательства человека, и первые результаты уже превзошли ожидания экспертов. Китайский стартап DeepSeek в сотрудничестве с Университетом Цинхуа разработал технологию, которая позволяет моделям искусственного интеллекта самостоятельно совершенствоваться, сообщает Bloomberg. Новый подход объединяет два ключевых метода: генеративное моделирование вознаграждения (GRM) и самопринципиальную критическую настройку (SPCT). Главная особенность этой технологии — создание замкнутого цикла обучения, где ИИ сам выступает и учеником, и учителем. Система работает по принципу внутренней обратной связи: одна часть модели генерирует ответы, а другая выступает «судьей», оценивая их качество и соответствие заданным критериям. Если ответ удовлетворяет требованиям, модель получает «вознаграждение» и запоминает успешную стратегию. Результаты тестирования впечатляют экспертов. Модели DeepSeek-GRM уже превзошли по эффективности решения от таких гигантов, как Google Gemini и даже GPT-4o. Особенно заметно преимущество при выполнении сложных задач, требующих логического мышления и понимания контекста.

Апр 7, 2025 - 13:10

DeepSeek готовит прорыв: что известно про новые модели

Искусственный интеллект научился сам себя улучшать без прямого вмешательства человека, и первые результаты уже превзошли ожидания экспертов.

Китайский стартап DeepSeek в сотрудничестве с Университетом Цинхуа разработал технологию, которая позволяет моделям искусственного интеллекта самостоятельно совершенствоваться, сообщает Bloomberg. Новый подход объединяет два ключевых метода: генеративное моделирование вознаграждения (GRM) и самопринципиальную критическую настройку (SPCT).

Главная особенность этой технологии — создание замкнутого цикла обучения, где ИИ сам выступает и учеником, и учителем. Система работает по принципу внутренней обратной связи: одна часть модели генерирует ответы, а другая выступает «судьей», оценивая их качество и соответствие заданным критериям. Если ответ удовлетворяет требованиям, модель получает «вознаграждение» и запоминает успешную стратегию.

Результаты тестирования впечатляют экспертов. Модели DeepSeek-GRM уже превзошли по эффективности решения от таких гигантов, как Google Gemini и даже GPT-4o. Особенно заметно преимущество при выполнении сложных задач, требующих логического мышления и понимания контекста.