Представьте себе систему ИИ, которая способна ловко прыгать между текстом и таблицами, словно виртуальный акробат на арене данных. Звучит захватывающе? Именно такой эффект произвела новая разработка от Huawei Cloud — TableRAG.
Обычно таблицы при «расплющивании» в текст теряют свой смысл: строки и столбцы превращаются в простую болтовню цифр. А ведь именно взаимосвязи внутри таблицы дают ответы на сложные вопросы: например, подсчитать процент выполнения плана за квартал или найти всплеск продаж в определённом регионе. Современные языковые модели часто промахиваются именно в таких задачах, и это портит всю картину.
Чтобы это исправить, команда из Huawei предложила TableRAG — гибридный фреймворк, который умело чередует два режима работы: чтение текста и выполнение SQL-запросов по таблицам. Сначала система парсит документы, разделяя обычный текст и табличные данные. Затем при запросе она разбивает вопрос на «кусочки», достаёт нужные текстовые фрагменты, пишет SQL-запрос и тут же выполняет его, не теряя ни строчки таблицы. И, наконец, соединяет результаты воедино, как талантливый монтажёр, создающий холст из разных кадров.
Интересно, что для оценки TableRAG создали собственный набор задач HeteQA, включающий 304 примера из девяти разных сфер: от финансов до науки. И знаете что? На всех этих тестах новинка обходит не только базовые RAG-подходы, но и более изощрённые методы, такие как преобразование таблиц в Markdown или программная обработка на Python. Фактически Huawei установили новый стандарт в вопросно-ответных системах для смешанных данных.
Но зачем всё это нужно в реальной жизни? Представьте аналитика, которому нужно экстренно проверить динамику производства деталей в разных цехах, сопоставить её с отчётами о расходах и прогнозами менеджмента. TableRAG позволит задать вопрос на естественном языке — и получить точный ответ, без ручного копирования и утомительных сводок.
Честно говоря, мы давно не видели такого элегантного сочетания символического SQL-выполнения и генеративных способностей ИИ. Разве это не похоже на идеальный синтез логики и творчества?
Разработчики выкладывают исходники на GitHub, так что любой желающий может исследовать TableRAG в деле. Инструмент уже доступен для экспериментов, и, вероятно, скоро мы увидим его интеграцию в бизнес-аналитику, научные публикации и даже образовательные платформы.
Итак, если вы занимаетесь обработкой сложных документов и жаждете более умных решений — стоит присмотреться к TableRAG. Новый шаг в эволюции ИИ-систем, где текст и таблицы говорят на одном языке.
