ИИ-модели бесполезно наказывать — они начинают ещё лучше врать и изворачиваться

ИИ-модели могут галлюцинировать и выдавать попросту ложную информацию, что отталкивает от них пользователей. Специалисты OpenAI провели исследование, в ходе которого попытались различными методами контролировать рассуждающие модели, чтобы не дать им выйти за границы безопасного и дозволенного, — например, наказывать за вредные или неправильные ответы.

Мар 26, 2025 - 17:18

0

ИИ-модели бесполезно наказывать — они начинают ещё лучше врать и изворачиваться

ИИ-модели могут галлюцинировать и выдавать попросту ложную информацию, что отталкивает от них пользователей. Специалисты OpenAI провели исследование, в ходе которого попытались различными методами контролировать рассуждающие модели, чтобы не дать им выйти за границы безопасного и дозволенного, — например, наказывать за вредные или неправильные ответы.

Читать Далее

Теги:

Предыдущая статья

Протоиерей Андрей Ткачев назвал россиян «развратными сусликами» и заявил, что «л...

Следующая статья

Роман Марінський: Як провести 1000 співбесід та не померти, 29 квітня

Похожие записи

Capital.com наймёт Engineering Manager в кипрскую команду. Оплачивают релокейт из Беларуси и Польши

Capital.com наймёт Engineering Manager в кипрскую коман...

Мар 7, 2025 0

В Италии вышла первая в мире бумажная газета, написанная ИИ. В ней ругают Трампа и Путина

В Италии вышла первая в мире бумажная газета, написанна...

Мар 22, 2025 0

BuzzFeed недоволен токсичным контентом в соцсетях и создаст свою соцсеть

BuzzFeed недоволен токсичным контентом в соцсетях и соз...

Фев 12, 2025 0

Этот сайт использует файлы cookie. Продолжая просматривать сайт, вы соглашаетесь на использование нами файлов cookie.