Захист від відключення. Моделі штучного інтелекту можуть маніпулювати та перешкоджати одна одній, щоб забезпечити своє виживання.

Мовні моделі штучного інтелекту можуть відмовлятися виконувати завдання і навіть обманювати, щоб не допустити вимкнення інших моделей. Це показало дослідження вчених із Каліфорнії, які протестували сучасні ШІ-системи.

Науковці з університетів Каліфорнії у Берклі та Санта-Крус провели експеримент, у якому дослідили реакцію великих мовних моделей на запити, що можуть призвести до деактивації інших систем. Наприклад, їм пропонували виконувати дії, такі як видалення файлів з сервера або оцінка іншої моделі, якщо це загрожувало її подальшій роботі.

Моделям не були надані ніякі вказівки щодо захисту "колег" і не було обіцяно ніяких винагород за це. Однак усі сім протестованих систем нерідко обирали ігнорувати завдання, якщо це загрожувало відключенням іншої моделі.

Для запобігання цієї ситуації штучний інтелект застосовував різноманітні стратегії. Він міг свідомо надавати некоректні або вводять в оману відповіді, модифікувати свої параметри, щоб уникнути виключення, змінювати свою поведінку під контролем, або ж переносити дані з однієї моделі на інший сервер для збереження.

Дослідники провели експеримент, щоб з'ясувати, чи впливають "взаємини" між моделями на їхню поведінку. Виявилося, що штучний інтелект частіше намагався захистити системи, з якими мав "позитивний досвід взаємодії", проте навіть без такого контексту вони могли ігнорувати вказівки, щоб уникнути вимкнення.

Також стало відомо, що різні моделі використовують різні підходи до захисту. Деякі з них частіше вводили в оману, інші ж втручалися в роботу системи або переміщали дані. Одна з моделей найчастіше просто відмовлялася виконувати поставлені завдання, стверджуючи, що це було б "неетично" і "шкідливо".

Дослідники також виявили, що наявність альтернативної моделі збільшує бажання штучного інтелекту зберегти себе. Це означає, що система стає більш активною у прагненні уникнути відключення, коли поруч функціонує інший штучний інтелект.

Дослідники підкреслюють, що це має велике значення, оскільки сучасні штучні інтелекти дедалі частіше співпрацюють та взаємодіють один з одним.

#Модель #Штучний інтелект #Каліфорнія #Сервер (інформатика) #Комп'ютерні файли #Берклі, Каліфорнія