DeepSeek выпустила улучшенную версию DeepSeek-V3: она работает даже на Mac Studio
Китайская компания DeepSeek выпустила обновленную версию своей большой языковой модели DeepSeek-V3. По данным компании, новая версия превосходит предыдущую в нескольких бенчмарках, а также демонстрирует улучшенную производительность. The post DeepSeek выпустила улучшенную версию DeepSeek-V3: она работает даже на Mac Studio appeared first on Хайтек.

По данным разработчиков, модель демонстрирует лучшую производительность в ряде бенчмарков и отличается эффективным использованием ресурсов. Одновременно компания объявила о переходе на лицензию MIT, которая позволяет использовать модель без ограничений, в том числе в коммерческих проектах.
Особенность новой версии DeepSeek-V3 — архитектура с выборочной активацией параметров. При общем объеме в 671 млрд параметров модель использует в работе лишь около 37 млрд, что резко снижает требования к инфраструктуре. Кроме того, применяется четырехбитное квантование, позволяющее экономить память почти без потери качества.
По словам научного сотрудника Apple Авни Ханнуна, ему удалось запустить DeepSeek-V3 локально на Mac Studio, где она работала со скоростью около 20 токенов в секунду. Это делает модель одной из самых производительных в своем классе, учитывая масштабы и аппаратные ограничения.
The new Deep Seek V3 0324 in 4-bit runs at > 20 toks/sec on a 512GB M3 Ultra with mlx-lm! pic.twitter.com/wFVrFCxGS6— Awni Hannun (@awnihannun) March 24, 2025
Разработчики отмечают рост эффективности модели в задачах программирования. По их данным, в сравнении с предыдущей версией точность выполнения подобных задач выросла на несколько процентных пунктов, хотя DeepSeek-V3 пока уступает узкоспециализированным инструментам.
В начале года DeepSeek вызвала резонанс на ИИ-рынке заявлением о рекордно низкой стоимости обучения модели — $6 млн. Это на два порядка ниже, чем у большинства конкурентов. Заявление вызвало волну обсуждений и даже кратковременное падение акций ведущих технологических компаний США.
Позже аналитики уточнили, что DeepSeek указывала только затраты на активное время работы GPU, не включая инфраструктуру, зарплаты, хранение данных и закупку оборудования. По данным SemiAnalysis, реальные затраты на обучение модели могли составить сотни миллионов долларов, что всё ещё ниже, чем у крупных игроков, но не столь революционно, как было заявлено.
Читать далее:
Вселенная внутри черной дыры: наблюдения «Уэбба» подтверждают странную гипотезу
Сразу четыре похожих на Землю планеты нашли у ближайшей одиночной звезды
Миллионы «невидимых» людей: ученые нашли ошибку в оценке населения Земли
The post DeepSeek выпустила улучшенную версию DeepSeek-V3: она работает даже на Mac Studio appeared first on Хайтек.