Исследователи из Китая разработали движок для исправления галлюцинаций в AI-моделях.

Китайские исследователи создали механизм для корректировки галлюцинаций в моделях искусственного интеллекта.

Команда ученых из Университета науки и технологий Китая и YouTu Lab компании Tencent разработала инструмент для борьбы с “галлюцинациями” в искусственном интеллекте (ИИ) моделей.

Галлюцинация – это тенденция ИИ модели генерировать выводы с высоким уровнем уверенности, основанные не на информации, присутствующей в ее обучающих данных. Эта проблема проникает в исследования больших языковых моделей (LLM). Ее последствия можно наблюдать в моделях, таких как ChatGPT от OpenAI и Claude от Anthropic.

Команда USTC/Tencent разработала инструмент под названием “Woodpecker”, который, как они утверждают, способен исправлять галлюцинации в многомодальных языковых моделях (MLLMs).

Этот подвид ИИ включает модели, такие как GPT-4 (особенно его визуальную вариацию, GPT-4V) и другие системы, которые объединяют визуализацию и/или другую обработку с генеративной ИИ модальностью наряду с языковым моделированием на основе текста.

Согласно научной статье, предшествующей изданию, Woodpecker использует три отдельные ИИ модели, помимо MLLM, исправляемых на галлюцинации, для выполнения корректировки галлюцинаций.

Это включает GPT-3.5 Turbo, Grounding DINO и BLIP-2-FlanT5. Вместе эти модели работают в качестве оценщиков, чтобы определить галлюцинации и указать модели, которую следует исправить, генерировать вывод, соответствующий ее данным.

Для исправления галлюцинаций ИИ модели, на которых работает “Woodpecker”, используют пятиступенчатый процесс, включающий “извлечение ключевых понятий, формулирование вопросов, проверку визуальных знаний, генерацию визуальных утверждений и исправление галлюцинаций”.

Исследователи утверждают, что эти техники обеспечивают дополнительную прозрачность и “улучшение точности на 30,66%/24,33% по сравнению с базовыми моделями MiniGPT-4/mPLUG-Owl”. Они оценили множество готовых MLLM моделей с использованием своего метода и пришли к выводу, что Woodpecker может быть “легко интегрирован в другие MLLM модели”.

Связано: Люди и ИИ часто предпочитают восхваляющие ответы чат-ботов правде — исследование

Оценочная версия Woodpecker доступна на Gradio Live, где каждый желающий может увидеть инструмент в действии.

We will continue to update BiLee; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more