В индустрии искусственного интеллекта появилась новая потребность — следить за поведением моделей без полномочного вмешательства. Rаспределение ответственности между автоматикой и человеком оказалось довольно сложным. Еще недавно считалось, что автоаналитика достаточно, однако текущие вызовы показывают обратное — без человеческого взгляда найти скрытые проблемы крайне трудно.
Hodoscope, разработанный Ziqian Zhong и командой, предлагает такой подход. Его pipeline состоит из трех шагов:
- Summarize — преобразование сложных действий в понятные и релевантные обобщения, устраняя шум и нерелевантные детали;
- Embed — создание общего векторного пространства и визуализация с помощью t-SNE для выявления кластеров поведения;
- Density Diffing — сравнение плотности данных по разным моделям для поиска аномалий и потенциальных уязвимостей.
Авторы приглашают разработчиков попробовать инструмент, который можно установить командой ''pip install hodoscope'', и делиться обратной связью. Пока это ранний релиз, и команда работает над более полноценной публикацией. Взгляд на будущее: индустрия движется к более точной и прозрачной автоматике, а человеческий контроль вновь приобретает значение как никогда.


