Исследователи из Китая разработали движок для исправления галлюцинаций в AI-моделях.

Китайские исследователи создали механизм для корректировки галлюцинаций в моделях искусственного интеллекта.

Команда ученых из Университета науки и технологий Китая и YouTu Lab компании Tencent разработала инструмент для борьбы с “галлюцинациями” в искусственном интеллекте (ИИ) моделей.

Галлюцинация – это тенденция ИИ модели генерировать выводы с высоким уровнем уверенности, основанные не на информации, присутствующей в ее обучающих данных. Эта проблема проникает в исследования больших языковых моделей (LLM). Ее последствия можно наблюдать в моделях, таких как ChatGPT от OpenAI и Claude от Anthropic.

Команда USTC/Tencent разработала инструмент под названием “Woodpecker”, который, как они утверждают, способен исправлять галлюцинации в многомодальных языковых моделях (MLLMs).

Этот подвид ИИ включает модели, такие как GPT-4 (особенно его визуальную вариацию, GPT-4V) и другие системы, которые объединяют визуализацию и/или другую обработку с генеративной ИИ модальностью наряду с языковым моделированием на основе текста.

Согласно научной статье, предшествующей изданию, Woodpecker использует три отдельные ИИ модели, помимо MLLM, исправляемых на галлюцинации, для выполнения корректировки галлюцинаций.

Это включает GPT-3.5 Turbo, Grounding DINO и BLIP-2-FlanT5. Вместе эти модели работают в качестве оценщиков, чтобы определить галлюцинации и указать модели, которую следует исправить, генерировать вывод, соответствующий ее данным.

На приведенной выше иллюстрации LLM галлюцинирует неверный ответ (зеленый фон) на подсказку (синий фон). В ответах “Woodpecker” исправленные варианты выделены красным фоном. (Источник изображения: Yin, et. al., 2023).

Для исправления галлюцинаций ИИ модели, на которых работает “Woodpecker”, используют пятиступенчатый процесс, включающий “извлечение ключевых понятий, формулирование вопросов, проверку визуальных знаний, генерацию визуальных утверждений и исправление галлюцинаций”.

Исследователи утверждают, что эти техники обеспечивают дополнительную прозрачность и “улучшение точности на 30,66%/24,33% по сравнению с базовыми моделями MiniGPT-4/mPLUG-Owl”. Они оценили множество готовых MLLM моделей с использованием своего метода и пришли к выводу, что Woodpecker может быть “легко интегрирован в другие MLLM модели”.

Связано: Люди и ИИ часто предпочитают восхваляющие ответы чат-ботов правде — исследование

Оценочная версия Woodpecker доступна на Gradio Live, где каждый желающий может увидеть инструмент в действии.

We will continue to update BiLee; if you have any questions or suggestions, please contact us!

AIChatGPTScience

Was this article helpful?

93 out of 132 found this helpful

Исследователи из Китая разработали движок для исправления галлюцинаций в AI-моделях.

Китайские исследователи создали механизм для корректировки галлюцинаций в моделях искусственного интеллекта.

Was this article helpful?

Самые крупные победители криптовалют сегодня на DEXTools – SAMBO, OBX

Революционируя рынок белых списков для Web3 WhiteList Zone сотрудничает с Cointelegraph Accelerator.

новости