Американские ученые из университета Мэриленда провели масштабное исследование, в ходе которого протестировали большие языковые модели искусственного интеллекта на 26 языках. Целью эксперимента было определить, как нейросети справляются с выполнением команд в зависимости от языка, на котором им задаются вопросы.
Результаты оказались неожиданными. Наивысшую точность выполнения команд — 88% — показал польский язык. Этот показатель превзошел результаты многих распространенных языков, включая английский, испанский и китайский. По словам исследователей, при использовании польского нейросети выполняли задачи стабильнее и допускали меньше ошибок, чем при работе с другими языками.
Авторы работы предположили, что столь высокие результаты могут быть связаны с особенностями обучающих данных. Возможно, польский язык оказался непропорционально представлен в тренировочных корпусах, что и привело к улучшенной адаптации моделей к его структуре. Ученые подчеркнули, что такие различия указывают на необходимость более сбалансированного подхода к обучению нейросетей.
В научном сообществе результаты вызвали активное обсуждение. Одни эксперты считают их важным сигналом для разработчиков, другие отмечают, что подобные диспропорции могут влиять на качество ответов ИИ на разных языках.
Новость быстро распространилась в соцсетях. Пользователи с юмором предложили срочно начинать изучать польский, чтобы «общаться с искусственным интеллектом на его любимом языке». Однако многие также подчеркнули, что подобные исследования поднимают вопрос о необходимости сохранения лингвистического разнообразия при развитии глобальных ИИ-систем.
