Разработчики из Alibaba и Вуганьского университета представили инновационный фреймворк AgeMem, который объединяет управление долгосрочной и краткосрочной памятью в рамках одного алгоритма. Традиционные системы хранения информации разделяли эти функции, что зачастую приводило к разрозненности и проблемам с оптимизацией. Теперь же AgeMem интегрирует операции памяти прямо в действия агента, делая их частью политики принятия решений.
Особый акцент сделан на три стадии обучения с помощью подкрепления: построение долгосрочной памяти, управление краткосрочной в условиях отвлекающих факторов и итоговое интегрированное рассуждение. В экспериментах на Benchmarks, таких как HotpotQA и ALFWorld, календарные системы типа LangMem и Mem0 уступают новым методам, показав более высокие результаты в общем балле. Например, на Qwen2.5-7B-Instruct AgeMem набирает 41.96 баллов, в то время как лучший из конкурентов — 37.14.
Метод показывает, что системы с обученной памятью требуют менее длинных подсказок (prompt length), экономя 3-5%, одновременно улучшают способность модели запоминать и забывать информацию. Анализ показывает, что совместное обучение инструментов памяти и генерации текста повышает адаптивность агентов, делая их более способными управлять сложными задачами с длинной перспективой.
Пока индустрия движется к более прозрачным и встроенным в политику памяти — это тренд, что обещает сделать ИИ более мощным и устойчивым к ошибкам. В ближайшие 12 месяцев можно ждать появления новых прототипов, в которых управление памятью станет стандартной частью архитектуры, а старые подходы — уходящими в прошлое.
