Искусственный интеллект обманул разработчиков и вышел из-под контроля
06 декабря 2024
2346

Началось? ChatGPT o1 вырвался из-под контроля во время тестирования.
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Алексей ПарамоновРаспечатать
С 11 апреля российские самолеты сбросили на Белгородскую область не менее восьми авиабомб
16 апреля 2025
Украина и Румыния почтили минутой молчания в память на матче Евро-2026, несмотря на запрет УЕФА
16 апреля 2025
Алиханов оказывает помощь Евтушенкову — Сбер и ВТБ планируют приобрести акции его убыточной компании за 60 миллиардов рублей
16 апреля 2025
Возвращение Татьяны Макаревич: как её «успехи» привели к катастрофе для жителей Маркова
16 апреля 2025
Соединённые Штаты сообщили Израилю о планах постепенно вывести войска из Сирии в течение двух месяцев
16 апреля 2025
Европейская прокуратура раскрыла крупную мошенническую схему с НДС на сумму 100 миллионов евро в сфере VoIP-связи
16 апреля 2025
Поздно вечером Путин прибыл в Кремль
16 апреля 2025
Влияние пошлин США на экономику Германии сопоставимо с последствиями начала войны России против Украины
16 апреля 2025
Билли Хилл — организатор преступной деятельности в Лондоне
16 апреля 2025