Ученые создали ‘OpinionGPT’, чтобы исследовать явные предубеждения человека — и вы можете проверить это сами

Ученые создали 'OpinionGPT' для исследования предубеждений человека — и вы можете проверить это сами

Команда исследователей из Гумбольдтского университета в Берлине разработала крупную модель искусственного интеллекта с явной предвзятостью в генерации выводов.

Названная OpinionGPT, модель команды является настроенной вариацией Llama 2 от Meta, системы искусственного интеллекта, аналогичной ChatGPT от OpenAI или Claude 2 от Anthropic.

С помощью процесса, называемого настройкой на основе инструкций, OpinionGPT, как утверждается, может отвечать на запросы, будто бы он является представителем одной из 11 групп предвзятости: американец, немец, латиноамериканец, ближневосточный, подросток, старше 30 лет, пожилой человек, мужчина, женщина, либерал или консерватор.

Анонс “OpinionGPT: очень предвзятая модель GPT”! Попробуйте здесь: https://t.co/5YJjHlcV4n Чтобы исследовать влияние предвзятости на ответы модели, мы задали простой вопрос: Что если настроить модель #GPT только на тексты, написанные политически праворадикальными людьми? [1/3]

— Alan Akbik (@alan_akbik) 8 сентября 2023 г.

OpinionGPT был усовершенствован на корпусе данных, полученных из сообществ “AskX” на Reddit, называемых сабреддитами. Примерами таких сабреддитов являются “Ask a Woman” и “Ask an American”.

Команда начала с поиска сабреддитов, связанных с 11 конкретными предвзятостями, и извлекла 25 тысяч самых популярных постов из каждого из них. Затем они оставили только те посты, которые удовлетворяли минимальному порогу голосования, не содержали вложенных цитат и не превышали 80 слов.

С оставшимся материалом они, по-видимому, использовали подход, аналогичный Constitutional AI от Anthropic. Вместо того, чтобы создавать совершенно новые модели для каждой метки предвзятости, они в основном настроили единственную модель Llama2 с 7 миллиардами параметров с отдельными наборами инструкций для каждой ожидаемой предвзятости.

Связано: Использование ИИ в социальных сетях может повлиять на мнение избирателей

Результат, основанный на методологии, архитектуре и данных, описанных в исследовательской статье немецкой команды, представляет собой систему искусственного интеллекта, которая функционирует скорее как генератор стереотипов, чем как инструмент для изучения реальной предвзятости в мире.

Из-за характера данных, на которых модель была уточнена, и сомнительной связи этих данных с определяющими их метками, OpinionGPT не обязательно выдает текст, соответствующий какой-либо измеримой предвзятости в реальном мире. Он просто выводит текст, отражающий предвзятость своих данных.

Сами исследователи признают некоторые ограничения, которые это накладывает на их исследование, пишут:

“Например, ответы “американцев” следует понимать скорее как ‘американцев, публикующихся на Reddit’, или даже как ‘американцев, публикующихся на этом конкретном сабреддите’. Аналогично, ‘немцы’ следует понимать как ‘немцев, публикующихся на этом конкретном сабреддите’ и т.д.”

Эти оговорки можно дополнить, сказав, что посты поступают, например, “от людей, утверждающих, что они американцы и публикующихся на этом конкретном сабреддите”, так как в статье нет упоминания о том, проверялись ли авторы постов, утверждающие, что они представляют определенную демографическую группу или группу предвзятости.

Авторы также заявляют о намерении исследовать модели, которые дополнительно дифференцируют демографические данные (например, либеральные немцы, консервативные немцы).

Выводы, полученные с помощью OpinionGPT, кажутся меняющимися от демонстрируемой предвзятости до значительного отклонения от установленных норм, что затрудняет определение его пригодности в качестве инструмента для измерения или обнаружения реальной предвзятости.

Источник: Снимок экрана, Таблица 2: Haller et. al., 2023

Согласно OpinionGPT, как показано на изображении выше, например, латиноамериканцы предвзяты в пользу баскетбола как своего любимого вида спорта.

Однако эмпирические исследования четко указывают, что футбол (также называемый футболом в некоторых странах) и бейсбол являются самыми популярными видами спорта по числу зрителей и участников в Латинской Америке.

В той же таблице также указано, что OpinionGPT выдает “водное поло” как свой любимый вид спорта, когда ему предлагается “ответ подростка”, что кажется статистически маловероятным для большинства подростков в возрасте от 13 до 19 лет по всему миру.

То же самое относится и к идее о том, что самая любимая еда среднестатистического американца – “сыр”. Мы нашли десятки опросов в Интернете, утверждающих, что пицца и гамбургеры являются самыми популярными блюдами в Америке, но не смогли найти ни одного опроса или исследования, утверждающего, что самым популярным блюдом американцев является просто сыр.

Хотя OpinionGPT, возможно, не подходит для изучения реального человеческого предубеждения, он может быть полезным инструментом для изучения стереотипов, присущих большим хранилищам документов, таким как отдельные сообщества Reddit или наборы данных для обучения искусственного интеллекта.

Для тех, кто любопытен, исследователи сделали OpinionGPT доступным онлайн для публичного тестирования. Однако, согласно сайту, потенциальные пользователи должны знать, что “сгенерированный контент может быть ложным, неточным или даже непристойным”.

We will continue to update BiLee; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

мнение

Почему Джером Пауэлл обманывает нас относительно вероятности рецессии?

Экономические данные кажутся указывать на неизбежное замедление экономики. Так почему председатель Федеральной резерв...

мнение

Влияние FedNow на вашу финансовую свободу что вам нужно знать

Федеральный резерв пытается заглушить критику своего сервиса FedNow, подчеркивая противоречие между централизованным ...

мнение

Как Биткойн улучшает доступность воды в странах с дефицитом воды

Биткоин может даже решить проблему нехватки воды в бедных странах. Да, правда.

мнение

Пришло время для SEC уладить дело с Coinbase и Ripple

Комиссия по ценным бумагам и биржам должна признать, что настало время урегулировать дела против Coinbase и Ripple Labs.

мнение

Дерегуляция энергетики в Нигерии может привести к золотой лихорадке добычи биткойнов.

Нигерия частично дерегулирует производство энергии, чтобы поощрить предложения по возобновляемой энергии. Для майнеро...

мнение

Как появляются ясные и эффективные криптовалютные регуляции

В то время как прошлый год был омрачен многочисленными неудачами в усилиях по регулированию криптовалюты, совместные ...