Ученые создали ‘OpinionGPT’, чтобы исследовать явные предубеждения человека — и вы можете проверить это сами
Ученые создали 'OpinionGPT' для исследования предубеждений человека — и вы можете проверить это сами
Команда исследователей из Гумбольдтского университета в Берлине разработала крупную модель искусственного интеллекта с явной предвзятостью в генерации выводов.
Названная OpinionGPT, модель команды является настроенной вариацией Llama 2 от Meta, системы искусственного интеллекта, аналогичной ChatGPT от OpenAI или Claude 2 от Anthropic.
С помощью процесса, называемого настройкой на основе инструкций, OpinionGPT, как утверждается, может отвечать на запросы, будто бы он является представителем одной из 11 групп предвзятости: американец, немец, латиноамериканец, ближневосточный, подросток, старше 30 лет, пожилой человек, мужчина, женщина, либерал или консерватор.
Анонс “OpinionGPT: очень предвзятая модель GPT”! Попробуйте здесь: https://t.co/5YJjHlcV4n Чтобы исследовать влияние предвзятости на ответы модели, мы задали простой вопрос: Что если настроить модель #GPT только на тексты, написанные политически праворадикальными людьми? [1/3]
- Биткоиновая революция в Сальвадоре два года как законное платежное средство
- 10 лет спустя, все еще нет Биткойн-ETF — но кому это важно?
- Действия в области DeFi вызывают несогласие комиссара CFTC
— Alan Akbik (@alan_akbik) 8 сентября 2023 г.
OpinionGPT был усовершенствован на корпусе данных, полученных из сообществ “AskX” на Reddit, называемых сабреддитами. Примерами таких сабреддитов являются “Ask a Woman” и “Ask an American”.
Команда начала с поиска сабреддитов, связанных с 11 конкретными предвзятостями, и извлекла 25 тысяч самых популярных постов из каждого из них. Затем они оставили только те посты, которые удовлетворяли минимальному порогу голосования, не содержали вложенных цитат и не превышали 80 слов.
С оставшимся материалом они, по-видимому, использовали подход, аналогичный Constitutional AI от Anthropic. Вместо того, чтобы создавать совершенно новые модели для каждой метки предвзятости, они в основном настроили единственную модель Llama2 с 7 миллиардами параметров с отдельными наборами инструкций для каждой ожидаемой предвзятости.
Связано: Использование ИИ в социальных сетях может повлиять на мнение избирателей
Результат, основанный на методологии, архитектуре и данных, описанных в исследовательской статье немецкой команды, представляет собой систему искусственного интеллекта, которая функционирует скорее как генератор стереотипов, чем как инструмент для изучения реальной предвзятости в мире.
Из-за характера данных, на которых модель была уточнена, и сомнительной связи этих данных с определяющими их метками, OpinionGPT не обязательно выдает текст, соответствующий какой-либо измеримой предвзятости в реальном мире. Он просто выводит текст, отражающий предвзятость своих данных.
Сами исследователи признают некоторые ограничения, которые это накладывает на их исследование, пишут:
“Например, ответы “американцев” следует понимать скорее как ‘американцев, публикующихся на Reddit’, или даже как ‘американцев, публикующихся на этом конкретном сабреддите’. Аналогично, ‘немцы’ следует понимать как ‘немцев, публикующихся на этом конкретном сабреддите’ и т.д.”
Эти оговорки можно дополнить, сказав, что посты поступают, например, “от людей, утверждающих, что они американцы и публикующихся на этом конкретном сабреддите”, так как в статье нет упоминания о том, проверялись ли авторы постов, утверждающие, что они представляют определенную демографическую группу или группу предвзятости.
Авторы также заявляют о намерении исследовать модели, которые дополнительно дифференцируют демографические данные (например, либеральные немцы, консервативные немцы).
Выводы, полученные с помощью OpinionGPT, кажутся меняющимися от демонстрируемой предвзятости до значительного отклонения от установленных норм, что затрудняет определение его пригодности в качестве инструмента для измерения или обнаружения реальной предвзятости.

Согласно OpinionGPT, как показано на изображении выше, например, латиноамериканцы предвзяты в пользу баскетбола как своего любимого вида спорта.
Однако эмпирические исследования четко указывают, что футбол (также называемый футболом в некоторых странах) и бейсбол являются самыми популярными видами спорта по числу зрителей и участников в Латинской Америке.
В той же таблице также указано, что OpinionGPT выдает “водное поло” как свой любимый вид спорта, когда ему предлагается “ответ подростка”, что кажется статистически маловероятным для большинства подростков в возрасте от 13 до 19 лет по всему миру.
То же самое относится и к идее о том, что самая любимая еда среднестатистического американца – “сыр”. Мы нашли десятки опросов в Интернете, утверждающих, что пицца и гамбургеры являются самыми популярными блюдами в Америке, но не смогли найти ни одного опроса или исследования, утверждающего, что самым популярным блюдом американцев является просто сыр.
Хотя OpinionGPT, возможно, не подходит для изучения реального человеческого предубеждения, он может быть полезным инструментом для изучения стереотипов, присущих большим хранилищам документов, таким как отдельные сообщества Reddit или наборы данных для обучения искусственного интеллекта.
Для тех, кто любопытен, исследователи сделали OpinionGPT доступным онлайн для публичного тестирования. Однако, согласно сайту, потенциальные пользователи должны знать, что “сгенерированный контент может быть ложным, неточным или даже непристойным”.
We will continue to update BiLee; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Почему опытным биткоинерам стоит рассмотреть возможность перехода на резервное копирование Шамира
- Отвергнуть ЦБДЦ, принять право на проведение транзакций
- Атака Meta на конфиденциальность должна служить предупреждением против искусственного интеллекта
- Назад в школу поддержка следующего поколения инвесторов
- Цена биткоина может достигнуть отметки в 46 тысяч долларов к моменту сокращения награды за майнинг в 2024 году — Интервью с Филбфилбом
- Крипто-кредиторы вызвали крипто-заражение в прошлом году. Как отрасль восстанавливается?
- Почему управляющие состоянием выбирают эти криптовалютные счета