IntellectNews
IntellectNews
    IntellectNews
    • Анализ изображений
    • Бизнес-исследования
    • Видео и анимация
    • Генерация и преобразование голоса
    • Генерация изображений
    • Дизайн интерьеров и архитектура
    • Другое
    • Здоровье и благополучие
    • Искусство и креативный дизайн
    • Исследования и анализ данных
    • Маркетинг и реклама
    • Музыка и аудио
    • Написание и редактирование
    • Обнаружение ИИ и антидетекция
    • Образование и перевод
    • Офис и продуктивность
    • Повседневная жизнь
    • Право и финансы
    • Программирование и разработка
    • Социальные сети
    • Управление бизнесом
    • Чат-боты и виртуальные собеседники
    • Новости ИИ
      • Автоматизация
      • Общество и рынок труда
      • ИИ в науке
      • ИИ в развлечениях
      • Персональный ИИ
      • Робототехника и автономные системы
      • Эксперименты и тесты
      • Новости индустрии ИИ
      • Технологии и разработки
      • Применение ИИ
      • Законодательство и этика
    • Блог
    • Промты
      • Business
    Поиск
    Авторизация
    Забыли пароль?
    Регистрация
    • Главная
    • Новости
    • Новости индустрии ИИ
    • BAZAAR: ИИ в битве рыночных аукционов

    BAZAAR: новый бенчмарк для оценки моделей ИИ в рыночных аукционах

    Автоматизация
    Влияние ИИ на общество и рынок труда
    ИИ в науке
    ИИ в развлечениях
    Персональный ИИ и инструменты
    Робототехника и автономные системы
    Эксперименты и тесты
    Новости индустрии ИИ
    Технологии и разработки
    Применение ИИ
    Законодательство и этика
     BAZAAR: новый бенчмарк для оценки моделей ИИ в рыночных аукционах

    BAZAAR: новый бенчмарк оценки рыночного мышления ИИ

    Исследователи представили BAZAAR — масштабный тест, который заставляет языковые модели вести себя как торговцы на двустороннем аукционе. Без подсказок о чужих ценах агенты учатся балансировать между выгодой и риском.

    Каждая сессия — это 30 раундов, где четыре покупателя и четыре продавца делают ставки, зная лишь историю прошлых сделок. Никаких подсказок и чатов: только свои оценки и реакция на исход торгов.

    Лидеры показывают себя по-разному

    TrueSkill-рейтинг возглавляют o3 (модель среднего уровня рассуждений) и Gemini 2.5 Pro — они находят золотую середину между аккуратностью и смелостью ставок. Некоторые модели стартуют консервативно, постепенно наращивая агрессию, а другие сразу идут в атаку и корректируют курс после первых неудач.

    Метрика Conditional Surplus Alpha (CSα) оценивает, насколько реальная прибыль модели отличается от идеально честной стратегии. Широкий разброс результатов отражает степень риска: узкие кластеры говорят о стабильности, а разбросанные точки — о потенциальных гениальных, но рискованных ходах.

    Что дальше?

    BAZAAR открывает окно в «экономическое чутьё» ИИ и подталкивает к новым стратегиям обучения. Хотите проверить свои модели или предложить улучшения? Репозиторий открыт для экспериментов, а результаты могут подсказать, как сделать торговых агентов более чуткими и прибыльными.

    25 июля 2025, 14:07
    Новости индустрии ИИ

    Связанные ИИ

    Google Gemini Google Gemini
    Google Gemini — это мощная мультимодальная AI‑модель нового поколения от Google, разработанная для обработки текста, изо...
    Gemini Gemini
    Современный искусственный интеллект, способный генерировать текст, решать сложные задачи и помогать в создании контента....
    Bazaar Bazaar
    Это мощное программное обеспечение для создания анимационных видео, которое позволяет пользователям легко превращать ста...

    Новости new

    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Новости индустрии ИИ
    16 марта 2026, 15:05
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Новости индустрии ИИ
    16 марта 2026, 15:03
    Последние события в мире ИИ: ключевые новости и разработки
    Последние события в мире ИИ: ключевые новости и разработки
    Новости индустрии ИИ
    16 марта 2026, 09:02
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Новости индустрии ИИ
    16 марта 2026, 03:05
    Выберите обязательные опции

    Мы используем файлы cookie и другие средства сохранения предпочтений и анализа действий посетителей сайта. Подробнее в Согласие на обработку персональных данных. Нажмите «Принять», если даете согласие на это.

    Принять
    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте

    IntellectNews © 2026

    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте, IntellectNews © 2026