Учёные из Бангладеш представили новую гибридную модель машинного обучения для автоматической классификации новостей на бенгальском языке. Разработка обещает повысить эффективность обработки и сортировки больших массивов медиа-контента.
Команда исследователей из BRAC University и других международных вузов создала систему BanglaNewsClassifier, которая использует метод гибридного стекинга для объединения нескольких алгоритмов машинного обучения. Такой подход позволил значительно повысить точность автоматической классификации новостей.
«Мы стремились создать инструмент, который будет не только точен, но и устойчив к разнообразию тем и стилей в бенгальских новостях», — отмечают авторы исследования. По их словам, применение стекинга — когда несколько моделей объединяются для принятия финального решения — позволило достичь лучших результатов по сравнению с использованием отдельных алгоритмов.
Эксперты считают, что подобные решения могут быть востребованы не только в медиа, но и в других сферах, где требуется быстрая обработка текстовой информации на национальных языках. В перспективе такие технологии способны существенно ускорить работу редакций и повысить качество информационных сервисов.
