Новости
Каталог новостей ИИ
Anthropic открыла Bloom, open source agentic фреймворк, который автоматизирует создание и запуск поведенческих тестов для крупнейших моделей. Система генерирует сценарии, прогоняет мульти-туровые роллауты и вычисляет метрики вроде elicitation rate.
22 декабря 2025
Автогенерация длинных текстов тормозит с ростом контекста даже при тех же модели и железе. Простой кеш ключей и значений (KV caching) превращает квадратичную боль в почти линейную скорость.
22 декабря 2025
Anthropic представила Bloom, открытый agentic-фреймворк, который автоматизирует проверку поведенческих рисков в frontier моделях. Это шаг от ручных, дорогих тестов к масштабируемым и воспроизводимым эвалюациям.
22 декабря 2025
NVIDIA выпустила Nemotron 3 - открытая MoE платформа для agentic AI с контекстом в 1 000 000 токенов
NVIDIA представила семейство Nemotron 3: три открытые модели для agentic AI с упором на длинный контекст и контроль стоимости inference. Nano уже доступен, Super и Ultra выходят в H1 2026.
21 декабря 2025
Генерация первых токенов в LLM быстрая, но чем длиннее ответ, тем медленнее система работает. Простая оптимизация KV caching радикально меняет картину и делает генерацию практически линейной по времени.
21 декабря 2025
Anthropic представила Bloom - open source фреймворк, который превращает одну спецификацию поведения в сотни воспроизводимых тестов. Это шаг в сторону массовой автоматизации оценок безопасности моделей.
21 декабря 2025
Туториал показывает, как на базе Google Gemini собрать инструмент-агент для автоматизации сбора медицинных доказательств и подачи prior-authorization. Не просто пример - это компактный фреймворк для воспроизводимой и отслеживаемой автоматизации.
21 декабря 2025
NVIDIA представила Nemotron 3 - открытую модельную семью для агентного ИИ, заточенную под длинные контексты и экономичный инференс. Nano уже доступен с весами и рецептами, Super и Ultra выйдут в H1 2026.
21 декабря 2025
При запуске LLM в production первые токены генерируются быстро, но последующие замедляются из-за лишних вычислений внимания. Эксперимент показывает: KV caching дает почти 5x ускорение для 1000 токенов.
21 декабря 2025
Идея федерации знаний выходит за рамки простой интеграции данных. Федеративные цифровые геномы предлагают обмен операционной логикой в виде "генов" с верификацией и Shadow Mode валидацией.
20 декабря 2025