В стремлении сократить «галлюцинации» и улучшить пользу AI-ассистентов, Nippon India Asset Management обратилась к Amazon Bedrock Knowledge Bases с RAG. Что в итоге? Точность ответов выросла более чем на 95%, а отчёты готовятся не за два дня, а за 10 минут.
С чем столкнулись и как решили?
Когда база знаний корпорации измеряется тысячами документов, классический RAG нередко пропускает важные фрагменты. Представьте: вы запрашиваете отчёт, а AI Assistant выдает не совсем то, что нужно — и начинается «танцы с бубном». Nippon India решила эту проблему семантическим разбиением текстов, продвинутым парсингом и многошаговым «мульти-запросным» подходом.
От пересборки запросов до повторной сортировки
Сложные вопросы обычно ведут к неточным ответам. Что сделали в Nippon India? Сначала AI разбивал запрос на подпроcы и отправлял их параллельно, затем собирал и объединял ответы. А чтобы ключевые фрагменты не затерялись, отдельная модель-перенумератор (reranker) упорядочивала результаты по релевантности.
Результат кажется невероятным
Галлюцинации упали на 90–95 %. Точность подскочила более чем на 95 %. Отчёты, что раньше готовились два дня, теперь создаются за 10 минут. И самое приятное: в ответах появилось указание на исходные фрагменты — пользователи видят, откуда взята информация.
По правде говоря, таких показателей редко добиваются. Но именно так работает продвинутая RAG на Amazon Bedrock. И кто знает — возможно, скоро ваша компания тоже скажет «прощай» долгим отчётам и «привет» суперточным ответам.
