Apple представила новую функцию автоматической транскрипции, встроенную в свои операционные системы, и независимые тесты показали, как она справляется с задачей по сравнению с лидерами отрасли — Whisper от OpenAI и Parakeet от Meta.
В рамках недавнего обновления Apple добавила встроенную систему распознавания речи, работающую на устройстве и способную преобразовывать аудиозаписи в текст прямо в приложении "Звуки" (Voice Memos). Журналисты протестировали новую функцию, чтобы выяснить, насколько она точна по сравнению с другими известными ИИ-системами транскрипции.
Для оценки использовались аудиозаписи с разным качеством звука и уровнями шума. По итогам тестов, система Apple показала достойные результаты, особенно с хорошо записанными голосами. Однако в сложных условиях — при фоновом шуме, акцентах и перебоях — она уступила конкурентам.
Whisper от OpenAI продемонстрировал наилучшую точность, особенно в распознавании разговорной речи и интонаций. Parakeet от Meta оказался чуть слабее, но в ряде случаев опередил решение от Apple. При этом важно отметить, что система Apple работает локально на устройстве, не передавая данные в облако, что выгодно отличает её с точки зрения конфиденциальности.
Эксперты считают, что встроенная транскрипция от Apple станет особенно полезной для пользователей, которым важна простота и защита данных. Однако для профессиональных нужд или сложных условий записи по-прежнему предпочтительнее использовать специализированные решения, такие как Whisper.
Apple, по всей видимости, продолжит развивать встроенные ИИ-функции, делая акцент на приватность, интеграцию с экосистемой и удобство для конечного пользователя.
