Ученые создали ‘OpinionGPT’, чтобы исследовать явные предубеждения человека — и вы можете проверить это сами

Ученые создали 'OpinionGPT' для исследования предубеждений человека — и вы можете проверить это сами

Команда исследователей из Гумбольдтского университета в Берлине разработала крупную модель искусственного интеллекта с явной предвзятостью в генерации выводов.

Названная OpinionGPT, модель команды является настроенной вариацией Llama 2 от Meta, системы искусственного интеллекта, аналогичной ChatGPT от OpenAI или Claude 2 от Anthropic.

С помощью процесса, называемого настройкой на основе инструкций, OpinionGPT, как утверждается, может отвечать на запросы, будто бы он является представителем одной из 11 групп предвзятости: американец, немец, латиноамериканец, ближневосточный, подросток, старше 30 лет, пожилой человек, мужчина, женщина, либерал или консерватор.

Анонс “OpinionGPT: очень предвзятая модель GPT”! Попробуйте здесь: https://t.co/5YJjHlcV4n Чтобы исследовать влияние предвзятости на ответы модели, мы задали простой вопрос: Что если настроить модель #GPT только на тексты, написанные политически праворадикальными людьми? [1/3]

— Alan Akbik (@alan_akbik) 8 сентября 2023 г.

OpinionGPT был усовершенствован на корпусе данных, полученных из сообществ “AskX” на Reddit, называемых сабреддитами. Примерами таких сабреддитов являются “Ask a Woman” и “Ask an American”.

Команда начала с поиска сабреддитов, связанных с 11 конкретными предвзятостями, и извлекла 25 тысяч самых популярных постов из каждого из них. Затем они оставили только те посты, которые удовлетворяли минимальному порогу голосования, не содержали вложенных цитат и не превышали 80 слов.

С оставшимся материалом они, по-видимому, использовали подход, аналогичный Constitutional AI от Anthropic. Вместо того, чтобы создавать совершенно новые модели для каждой метки предвзятости, они в основном настроили единственную модель Llama2 с 7 миллиардами параметров с отдельными наборами инструкций для каждой ожидаемой предвзятости.

Связано: Использование ИИ в социальных сетях может повлиять на мнение избирателей

Результат, основанный на методологии, архитектуре и данных, описанных в исследовательской статье немецкой команды, представляет собой систему искусственного интеллекта, которая функционирует скорее как генератор стереотипов, чем как инструмент для изучения реальной предвзятости в мире.

Из-за характера данных, на которых модель была уточнена, и сомнительной связи этих данных с определяющими их метками, OpinionGPT не обязательно выдает текст, соответствующий какой-либо измеримой предвзятости в реальном мире. Он просто выводит текст, отражающий предвзятость своих данных.

Сами исследователи признают некоторые ограничения, которые это накладывает на их исследование, пишут:

“Например, ответы “американцев” следует понимать скорее как ‘американцев, публикующихся на Reddit’, или даже как ‘американцев, публикующихся на этом конкретном сабреддите’. Аналогично, ‘немцы’ следует понимать как ‘немцев, публикующихся на этом конкретном сабреддите’ и т.д.”

Эти оговорки можно дополнить, сказав, что посты поступают, например, “от людей, утверждающих, что они американцы и публикующихся на этом конкретном сабреддите”, так как в статье нет упоминания о том, проверялись ли авторы постов, утверждающие, что они представляют определенную демографическую группу или группу предвзятости.

Авторы также заявляют о намерении исследовать модели, которые дополнительно дифференцируют демографические данные (например, либеральные немцы, консервативные немцы).

Выводы, полученные с помощью OpinionGPT, кажутся меняющимися от демонстрируемой предвзятости до значительного отклонения от установленных норм, что затрудняет определение его пригодности в качестве инструмента для измерения или обнаружения реальной предвзятости.

Источник: Снимок экрана, Таблица 2: Haller et. al., 2023

Согласно OpinionGPT, как показано на изображении выше, например, латиноамериканцы предвзяты в пользу баскетбола как своего любимого вида спорта.

Однако эмпирические исследования четко указывают, что футбол (также называемый футболом в некоторых странах) и бейсбол являются самыми популярными видами спорта по числу зрителей и участников в Латинской Америке.

В той же таблице также указано, что OpinionGPT выдает “водное поло” как свой любимый вид спорта, когда ему предлагается “ответ подростка”, что кажется статистически маловероятным для большинства подростков в возрасте от 13 до 19 лет по всему миру.

То же самое относится и к идее о том, что самая любимая еда среднестатистического американца – “сыр”. Мы нашли десятки опросов в Интернете, утверждающих, что пицца и гамбургеры являются самыми популярными блюдами в Америке, но не смогли найти ни одного опроса или исследования, утверждающего, что самым популярным блюдом американцев является просто сыр.

Хотя OpinionGPT, возможно, не подходит для изучения реального человеческого предубеждения, он может быть полезным инструментом для изучения стереотипов, присущих большим хранилищам документов, таким как отдельные сообщества Reddit или наборы данных для обучения искусственного интеллекта.

Для тех, кто любопытен, исследователи сделали OpinionGPT доступным онлайн для публичного тестирования. Однако, согласно сайту, потенциальные пользователи должны знать, что “сгенерированный контент может быть ложным, неточным или даже непристойным”.

We will continue to update BiLee; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

мнение

Риск стейкинга часто неправильно понимается

Есть разница между стейкингом и стейкингом, плохой подделкой, которая затуманивает риски одной из наименее рискованны...

мнение

Возвращая криптовалютному титулу Примат PoW и криптографии

Только Биткоин следует считать криптовалютой, потому что PoW основан на криптографии и ничем другим для обеспечения б...

мнение

Молния обречена

Объективная оценка ограничений Lightning Network и что это означает с точки зрения ее долгосрочной жизнеспособности. ...

мнение

P1A Рефик Анадол исследует Границы творчества

Художник создал NFT Refik Anadol - другого художника - для нашего пакета 'Самый влиятельный'.

мнение

DAOs - новый Degen трейдеры криптовалют могут копировать торговлю токенами казначейств для веселья и прибыли

Еще один год подходит к концу, и криптовалюта продолжает оставаться открытой для регулирования неопределенностью. Теп...

мнение

Сработает ли стратегия SBF «Виной адвокатам»?

Адвокаты говорят CoinDesk, что тактика может быть эффективной для защиты основателя FTX Сэма Банкмана-Фрида, но она с...