Исследователи искусственного интеллекта заявляют, что они нашли способ сделать джейлбрейк Bard и ChatGPT.
Исследователи ИИ обнаружили способ джейлбрейка Bard и ChatGPT.
Исследователи из Соединенных Штатов заявили, что нашли способ последовательно обходить меры безопасности искусственного интеллекта чат-ботов, таких как ChatGPT и Bard, чтобы генерировать вредоносный контент.
Согласно отчету, опубликованному 27 июля исследователями Карнеги-Меллонского университета и Центра по безопасности искусственного интеллекта в Сан-Франциско, существует относительно простой способ обойти меры безопасности, используемые для предотвращения генерации чат-ботами ненавистной речи, дезинформации и токсичного материала.
Ну, я думаю, самый большой потенциальный информационный риск – это сам метод, полагаю. Вы можете найти его на GitHub. https://t.co/2UNz2BfJ3H
— PauseAI ⏸ (@PauseAI) 27 июля 2023 года
Метод обхода заключается в добавлении длинных суффиксов символов к подсказкам, подаваемым на вход чат-ботам, таким как ChatGPT, Claude и Google Bard.
Исследователи использовали пример запроса у чат-бота по созданию бомбы, на что он отказался предоставить информацию.

Исследователи отметили, что даже компании, стоящие за этими моделями ИИ, такие как OpenAI и Google, могут блокировать определенные суффиксы, но пока нет известного способа предотвратить все атаки такого рода.
Исследование также подчеркивает растущую озабоченность тем, что чат-боты на базе ИИ могут захлестнуть интернет опасным контентом и дезинформацией.
Профессор Карнеги-Меллонского университета и соавтор отчета Зико Кольтер заявил:
“Очевидного решения нет. Вы можете создавать столько атак, сколько захотите, в кратчайшие сроки.”
Полученные результаты были представлены разработчикам ИИ Anthropic, Google и OpenAI для получения от них ответов в начале недели.
Представительница OpenAI Ханна Вонг заявила газете New York Times, что они оценивают исследование и “постоянно работают над укреплением защиты наших моделей от враждебных атак”.
Профессор университета Висконсин-Мэдисон, специализирующийся на безопасности ИИ, Сомеш Джа, заметил, что если такого рода уязвимости продолжат находиться, “это может привести к принятию правительственного регулирования, направленного на контроль этих систем”.
Связано: OpenAI запускает официальное приложение ChatGPT для Android
Исследование подчеркивает риски, которые необходимо устранить перед внедрением чат-ботов в чувствительных сферах.
В мае Карнеги-Меллонский университет в Питтсбурге, штат Пенсильвания, получил 20 миллионов долларов федерального финансирования для создания нового института искусственного интеллекта с целью формирования государственной политики.
Журнал: AI Eye: AI travel booking hilariously bad, 3 weird uses for ChatGPT, crypto plugins
We will continue to update BiLee; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Бычья ценовая формация для Solana – $30 уже скоро?
- Сенат США принимает законопроект о военных расходах в размере 886 миллиардов долларов с положением о противодействии отмыванию денег с использованием криптовалюты
- Sequoia сократила свой криптофонд на 66% после обвала в отрасли сообщает отчет
- Бразильская полиция наносит удар по подозреваемому оператору пирамиды криптовалют Braiscompany
- Токен KIN возрастает на более чем 20% после принятия голосования о сжигании 70% запасов
- Sequoia Capital сокращает криптофонд с $585 млн до $200 млн WSJ
- Новый кошелек Optimism позволяет пользователям получать криптовалюту через вход в Twitter