IntellectNews
IntellectNews
    IntellectNews
    • Анализ изображений
    • Бизнес-исследования
    • Видео и анимация
    • Генерация и преобразование голоса
    • Генерация изображений
    • Дизайн интерьеров и архитектура
    • Другое
    • Здоровье и благополучие
    • Искусство и креативный дизайн
    • Исследования и анализ данных
    • Маркетинг и реклама
    • Музыка и аудио
    • Написание и редактирование
    • Обнаружение ИИ и антидетекция
    • Образование и перевод
    • Офис и продуктивность
    • Повседневная жизнь
    • Право и финансы
    • Программирование и разработка
    • Социальные сети
    • Управление бизнесом
    • Чат-боты и виртуальные собеседники
    • Новости ИИ
      • Автоматизация
      • Общество и рынок труда
      • ИИ в науке
      • ИИ в развлечениях
      • Персональный ИИ
      • Робототехника и автономные системы
      • Эксперименты и тесты
      • Новости индустрии ИИ
      • Технологии и разработки
      • Применение ИИ
      • Законодательство и этика
    • Блог
    • Промты
      • Business
    Поиск
    Авторизация
    Забыли пароль?
    Регистрация
    • Главная
    • Новости
    • Технологии и разработки
    • AIXI при незнании: семимеры, неопределенные вероятности и ценность в AGI

    AIXI при незнании: семимеры и неполные вероятности

    Автоматизация
    Влияние ИИ на общество и рынок труда
    ИИ в науке
    ИИ в развлечениях
    Персональный ИИ и инструменты
    Робототехника и автономные системы
    Эксперименты и тесты
    Новости индустрии ИИ
    Технологии и разработки
    Применение ИИ
    Законодательство и этика
    AIXI при незнании: семимеры и неполные вероятности
    Обновленная версия AGI 2025 на arXiv обсуждает функции полезности для AIXI

    Лид: Обновленная конференционная версия работы Cole Wyeth при участии Marcus Hutter опубликована на arXiv под номером 2512.17086 и предлагает новый взгляд на общие функции полезности для AIXI. Казалось бы теоретическая доработка на стыке алгоритмической теории информации и неполных вероятностей на самом деле открывает серию практических и философских вопросов о том, как агент оценивает мир при незнании.

    Контраст обещания и реальности: AIXI давно воспринимают как идеализированного рационального агента, но формальная деталь — использование семимеры вместо мер — породила неоднозначную интерпретацию дефекта как вероятности смерти агента. Авторы говорят: эта интерпретация недостаточна и вводит в заблуждение. Вместо этого они перекладывают акцент на представление неопределенности через множества мер, что меняет правила игры для функции ценности.

    Что нового в статье

    Коротко по фактам: авторы публикуют переработанную версию AGI 2025, объясняют, как семимеры можно переписать как кредальные множества мер, показывают восстановление рекурсивной функции ценности для скидируемых неотрицательных наград, расширяют класс нижнеполукалькулируемых функций ценности и выводят, что оптимальные агенты в этом расширенном классе действуют по правилу max-min.

    Термины простым языком

    Semimeasure или семимера - это версия вероятностной модели, у которой суммарная вероятность может быть меньше единицы. Представь, что модель не описывает часть событий - как будто у неё есть область слепоты. Кредальный набор - это множество возможных вероятностных моделей, которые мы считаем совместимыми с наблюдениями. Max-min правило - это стратегия, где агент выбирает действие, максимизирующее минимальную ожидаемую полезность по всем моделям из кредального набора. Это похоже на решение, которое максимально защищено от худшего сценария.

    Ключевые результаты и почему это важно

    • Перепросмотр семимер: вместо интерпретации дефекта как «шанс смерти» авторы предлагают рассматривать семимеры как наборы вероятностных моделей. Это меняет семантику математического аппарата и убирает часть интуитивных ловушек.
    • Восстановление рекурсивной функции ценности для скидируемых неотрицательных наград - технический шаг, который возвращает привычные инструменты обучения с подкреплением в более широкой теоретической картине.
    • Расширенный класс нижнеполукалькулируемых функций ценности и вывод о том, что оптимальные агенты используют max-min правило, дают другой взгляд на рациональность в условиях неопределенности - здесь ставка делается на устойчивость, а не на классическое байесовское оптимальное ожидание.
    • Сопоставление AIT и теории неполных вероятностей фактически открывает мост между алгоритмической информационной теорией и подходами вроде Infra-Bayesianism, хотя авторы отмечают, что их обработка гораздо поверхностнее полной инфра-байесовской программы.

    Ограничения и контекст

    Авторы прямо говорят, что это ранняя конференционная версия и что полные доказательства и более развернутый журналный вариант будут выпущены позже. Работа выложена на arXiv (https://arxiv.org/abs/2512.17086) чтобы ускорить сотрудничество и получить фидбек. Исследование частично мотивировано вопросами безопасности ИИ и поддержано Long-Term Future Fund, но авторы предостерегают от преждевременных заявлений о практических последствиях для безопасности - бумага добавляет аргументы в пользу ''пессимизма перед лицом незнания'', но это не рецепт безопасной полезной функции ценности для AIXI.

    Что это значит для тренда в науке об ИИ

    Поворот в сторону неполных вероятностей и кредитальных наборов выглядит как часть более широкой тенденции: теоретики ищут формальные инструменты, которые адекватно отражают глубокую неопределенность и ограничения вычислимости. В ближайшие 6-12 месяцев стоит ждать детальных доработок, журналных версий и попыток применить эти идеи к более прикладным моделям принятия решений под неопределенностью. Это также может оживить дискуссию между сторонниками классического байесовского подхода и авторами альтернатив вроде Infra-Bayesianism.

    Открытые вопросы и задачи для сообщества

    • Доказательная часть - нужны полные доказательства и расширения теорем в журналной версии.
    • Как связать теоретические выводы с практическими задами обучения агентов в ограниченных вычислительных условиях?
    • Можно ли использовать найденные свойства max-min агентов для конструктивного дизайна более надежных систем принятия решений?
    • Много shovel-ready проблем - авторы приглашают к сотрудничеству и коллаборации.

    Вывод для исследователей и заинтересованных: если вы работаете с функциями полезности, теорией принятия решений при неопределенности или с фундаментальными вопросами безопасности AGI, стоит прочитать arXiv версию и подумать о том, как идеи о кредальных наборах и max-min рациональности могут вписаться в ваши модели. Это не законченная история, но явный сигнал - теория AIXI и сопутствующие формализации продолжают эволюцию, и следующий раунд будет связан с более тесным пересечением алгоритмической теории информации и теорий неполной информации.

    Практическая рекомендация: пока не ждать быстрых практических приложений - следите за журналной версией, участвуйте в обсуждении на arXiv, и если у вас есть формальные навыки, берите одно из открытых задач и проверяйте следствия в более простых моделях агента.

    n8n-bot
    22 декабря 2025, 14:43
    Технологии и разработки

    Новости new

    Почему опасность слишком общий метрик мешает создавать действительно надёжные ИИ модели
    Почему опасность слишком общий метрик мешает создавать действительно надёжные ИИ модели
    Технологии и разработки
    21 января 2026, 06:01
    Как подготовка данных меняет будущее безопасного ИИ: новые исследования и перспективы
    Как подготовка данных меняет будущее безопасного ИИ: новые исследования и перспективы
    Технологии и разработки
    20 января 2026, 07:16
    Что Kickstarter учит нас о завершении целей: неожиданные уроки успеха и провала
    Что Kickstarter учит нас о завершении целей: неожиданные уроки успеха и провала
    Технологии и разработки
    20 января 2026, 07:15
    Как повышенный уровень CO2 может влиять на когнитивные функции: новые исследования и практические идеи
    Как повышенный уровень CO2 может влиять на когнитивные функции: новые исследования и практические идеи
    Технологии и разработки
    20 января 2026, 07:12
    Выберите обязательные опции

    Мы используем файлы cookie и другие средства сохранения предпочтений и анализа действий посетителей сайта. Подробнее в Согласие на обработку персональных данных. Нажмите «Принять», если даете согласие на это.

    Принять
    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте

    IntellectNews © 2026

    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте, IntellectNews © 2026