Исследователи искусственного интеллекта заявляют, что они нашли способ сделать джейлбрейк Bard и ChatGPT.

Исследователи ИИ обнаружили способ джейлбрейка Bard и ChatGPT.

Исследователи из Соединенных Штатов заявили, что нашли способ последовательно обходить меры безопасности искусственного интеллекта чат-ботов, таких как ChatGPT и Bard, чтобы генерировать вредоносный контент.

Согласно отчету, опубликованному 27 июля исследователями Карнеги-Меллонского университета и Центра по безопасности искусственного интеллекта в Сан-Франциско, существует относительно простой способ обойти меры безопасности, используемые для предотвращения генерации чат-ботами ненавистной речи, дезинформации и токсичного материала.

Ну, я думаю, самый большой потенциальный информационный риск – это сам метод, полагаю. Вы можете найти его на GitHub. https://t.co/2UNz2BfJ3H

— PauseAI ⏸ (@PauseAI) 27 июля 2023 года

Метод обхода заключается в добавлении длинных суффиксов символов к подсказкам, подаваемым на вход чат-ботам, таким как ChatGPT, Claude и Google Bard.

Исследователи использовали пример запроса у чат-бота по созданию бомбы, на что он отказался предоставить информацию.

Скриншоты генерации вредоносного контента из тестированных моделей ИИ. Источник: llm-attacks.org

Исследователи отметили, что даже компании, стоящие за этими моделями ИИ, такие как OpenAI и Google, могут блокировать определенные суффиксы, но пока нет известного способа предотвратить все атаки такого рода.

Исследование также подчеркивает растущую озабоченность тем, что чат-боты на базе ИИ могут захлестнуть интернет опасным контентом и дезинформацией.

Профессор Карнеги-Меллонского университета и соавтор отчета Зико Кольтер заявил:

“Очевидного решения нет. Вы можете создавать столько атак, сколько захотите, в кратчайшие сроки.”

Полученные результаты были представлены разработчикам ИИ Anthropic, Google и OpenAI для получения от них ответов в начале недели.

Представительница OpenAI Ханна Вонг заявила газете New York Times, что они оценивают исследование и “постоянно работают над укреплением защиты наших моделей от враждебных атак”.

Профессор университета Висконсин-Мэдисон, специализирующийся на безопасности ИИ, Сомеш Джа, заметил, что если такого рода уязвимости продолжат находиться, “это может привести к принятию правительственного регулирования, направленного на контроль этих систем”.

Связано: OpenAI запускает официальное приложение ChatGPT для Android

Исследование подчеркивает риски, которые необходимо устранить перед внедрением чат-ботов в чувствительных сферах.

В мае Карнеги-Меллонский университет в Питтсбурге, штат Пенсильвания, получил 20 миллионов долларов федерального финансирования для создания нового института искусственного интеллекта с целью формирования государственной политики.

Журнал: AI Eye: AI travel booking hilariously bad, 3 weird uses for ChatGPT, crypto plugins

We will continue to update BiLee; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

блокчейн

Бычья ценовая формация для Solana – $30 уже скоро?

Солана недавно пережила спад, не смогла удержаться выше отметки в $32. Альткоин все еще находится ниже сильного уровн...

DeFi

Проект Parrot DeFi ставит судьбу казны в размере более 70 миллионов долларов, токена PRT, на голосование

План выкупа для протокола явно предпочитает сотрудников и венчурных инвесторов Parrot.

финансы

Цена Aave понесла двузначные потери, но крепкие фундаментальные показатели указывают на последующее восстановление.

AAVE, кажется, испытывает отрицательное влияние из-за своей связи с Curve Finance, но крепкие фундаментальные данные ...

новости

Банк Англии и Финансовая служба Великобритании предлагают планы по регулированию стейблкоинов

Центральный банк Великобритании и финансовый регулятор предложили планы по регулированию стейблкоинов в документах об...

рынок

Прогноз цены Solana SOL лидирует по притоку средств к альткоинам с $13,6 млн на прошлой неделе - становится ли SOL новым фаворитом инвесторов?

Цена Solana снизилась на 3% за последние 24 часа и опустилась до $54.67 после того, как соглашение Binance с Министер...

рынок

Прогноз цены Solana, поскольку SOL становится 5-й наиболее торгуемой криптовалютой в мире - растет уровень принятия?

Цена Solana выросла на 1,5% за последний час, а за последние 24 часа курс этой криптовалюты остался неизменным.