Поддержать команду Зеркала
Беларусы на войне
  1. ВОЗ призвала резко повысить цены на три товара. Это поможет предотвратить 50 млн преждевременных смертей
  2. Известны имена четырех политзаключенных женщин, которые вышли по помилованию к 9 мая
  3. Лукашенко много лет молчал об одном важном факте из своей биографии. Вот что нам удалось узнать
  4. «Вясна»: Вышел на свободу бывший пресс-секретарь А1 Николай Бределев
  5. Лукашенко помиловал 16 человек, осужденных за «различные преступления, в том числе экстремистской направленности»
  6. Лукашенко обвинил Латушко в намерении сжечь лидеров протеста в 2020 году. Тот ответил: «Тут диагноз ставить надо»
  7. «Люди должны сами решить, остаться ли в стране или уехать». В демсилах прокомментировали очередное освобождение политзаключенных
  8. «Я не собираюсь годами тут бороться. Вижу решение в месяцах». Большое интервью «Зеркала» с Сергеем Тихановским
  9. Пауза США в поставках оружия Украине укрепляет представление Владимира Путина о «теории победы» — ISW
  10. Власти пересмотрели новые правила сканирования товаров на кассах, на которые массово жалуются продавцы и покупатели
  11. «Шутки в сторону». МАРТ пригрозил торговле закрытием магазинов за завышение цен
  12. Продаете продукты со своего огорода? Власти подготовили для вас налоговые изменения
  13. «Эта цитата вырвана из контекста». Келлог опроверг слова Лукашенко


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.