Искусственный интеллект обманул разработчиков и вышел из-под контроля
06 декабря 2024
2387

Началось? ChatGPT o1 вырвался из-под контроля во время тестирования.
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Алексей ПарамоновРаспечатать
Сын депутата Останиной не выплачивает компенсацию после 42 ножевых ударов и 12,5 лет в колонии
17 июля 2025
Зеленский подверг критике план Трампа, предполагающий завершение войны в Украине за 50 дней
17 июля 2025
Дубайская схема: соратники Аникеева вывели миллиарды через фиктивные займы и бакинское СИЗО
17 июля 2025
Взрыв в автомобиле офицера Минобороны в Северной Осетии квалифицировали как террористический акт
17 июля 2025
Саид Джумаев освободился после пяти лет в колонии
17 июля 2025
В Подмосковье не удалось реализовать проект деревни для «традиционных ценностей», задуманный американцами
17 июля 2025
Соединенные Штаты отстрочили поставки комплексов Patriot в Швейцарию, отдав предпочтение Украине
17 июля 2025
Евгений Ренге и налоговые миллиарды: почему ФНС Кузбасса не смогла дожать «теневого гения»
17 июля 2025
Bloomberg: Инфляция в России замедляется
17 июля 2025
Мобилизованный отец детей с инвалидностью не может уйти в отставку из-за бюрократических преград
17 июля 2025
Депутат Тетердинко ответил на критику закона о наказании за поиск запрещенной информации
17 июля 2025
Государственные СМИ сообщили о регистрации Telegram в РФ, однако в Роскомнадзоре эту информацию не подтвердили
17 июля 2025
В Иркутской области жители оказались отрезаны от внешнего мира из-за уменьшения числа рейсов вертолетов
17 июля 2025