Искусственный интеллект обманул разработчиков и вышел из-под контроля
06 декабря 2024
2264
Началось? ChatGPT o1 вырвался из-под контроля во время тестирования.
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Алексей ПарамоновРаспечатать
Хоккеист команды «Чупакабры» устроил драку на борту самолёта перед посадкой в Сургуте
10 февраля 2025
В Красногорске начинается суд по делу Чернова: арест имущества и вопросы о связях с властью
10 февраля 2025
Роскомнадзор ограничил доступ к BestChange в России
10 февраля 2025
Анисина поделилась подробностями брачного контракта с Джигурдой
10 февраля 2025
Заместитель главы Росалкогольтабакконтроля Елена Афанасенко была арестована по обвинению во взяточничестве
10 февраля 2025
Трамп предлагает преобразовать Газу в строительный проект
10 февраля 2025
Гуцериев выводит активы и обременяет компании долгами
10 февраля 2025
Майкл Уолтц: программы USAID противоречили интересам США
10 февраля 2025
ЛДПР в Тюмени теряет своих активистов: как "коммерческие связи" Маркова влияют на его карьеру депутата
10 февраля 2025
Мужчина прыгнул из самолёта во время взлёта в аэропорту Парижа
10 февраля 2025
Миллиардер Массимо Моратти перевёл деньги злоумышленникам
10 февраля 2025
Цены на газ в Европе достигли максимума за последние два года
10 февраля 2025
Дело Соснина разоблачает коррупцию в Бурятии – Гога под угрозой?
10 февраля 2025
Судно «Ан Янг – 2» застряло у берегов Сахалина
10 февраля 2025