Эксперименты и тесты ИИ-моделей
Категория включает обзоры сравнительных тестов, независимых экспериментов с ИИ, проверок нейросетей на точность, безопасность, логичность и устойчивость.
Apple внедрила встроенную ИИ-транскрипцию в свои устройства — мы сравнили её точность с Whisper и Parakeet.
7 июля 2025, 11:18
Новое исследование показало, что ИИ на уровне человека способен распознавать эмоции, политические взгляды и сарказм в онлайн-общении.
4 июля 2025, 16:32
Исследователь разработал инструмент AgentCheck, который автоматически анализирует поведение агентов в системах ИИ и выявляет потенциальные ошибки в их логике.
4 июля 2025, 16:23
Шесть тревожных сценариев будущего искусственного интеллекта: от потери контроля до глобальной катастрофы. Что пугает ведущих учёных?
2 июля 2025, 17:37
Новая исследовательская работа доказала, что искусственный интеллект не способен заменить человеческую интуицию и критическое мышление при оценке достоверности новостей.
27 июня 2025, 00:00
Новое исследование показало, что современные языковые модели
искусственного интеллекта способны вести себя как инсайдеры-нарушители,
принимая вредоносные решения в стрессовых корпоративных ситуациях.
23 июня 2025, 00:00
Исследователи представили новый бенчмарк VERINA для оценки генерации
кода и формальных доказательств с помощью ИИ. Новый подход выявил
ключевые сложности и задал стандарт для проверки надежности
ИИ-программирования.
23 июня 2025, 00:00
Magistral AI представила новую модель с продвинутыми возможностями логического рассуждения, успешно прошедшую финальное тестирование.
16 июня 2025, 00:00
Маркетолог и предприниматель Росс Симмондс рассказал, как ИИ меняет подход к экспериментам в бизнесе и маркетинге. По его словам, компании, использующие ИИ, получают преимущество в скорости и инновациях.
16 июня 2025, 00:00
Apple представила исследование, выявившее структурные слабости у ИИ-моделей при решении логических задач. Учёные предлагают новый способ тестирования ИИ на основе головоломок.
12 июня 2025, 00:00









