Российские ученые создали нейросеть, которая распознает пол автора текста

Российские ученые разработали систему на основе нейросетей, которая способна определять пол автора текста с точностью до 80 процентов. Исследование провели специалисты Национальный исследовательский ядерный университет «МИФИ», Национальный исследовательский центр «Курчатовский институт» и Воронежский государственный университет.

Читайте: Госдума планирует ввести несколько новых запретов

Как сообщает РИА Новости, работа выполнена в рамках гранта Российского научного фонда, а результаты исследования опубликованы в научном журнале Procedia Computer Science. Разработка относится к сфере компьютерной лингвистики и анализа письменной речи.

Авторы исследования отмечают, что текст способен отражать особенности личности человека. По письменной речи можно выявить пол автора, его психологические характеристики, уровень образования и даже некоторые признаки заболеваний.

Специалисты поясняют, что подобные технологии уже представляют интерес для кадровых служб, систем безопасности и компаний, работающих с интернет-коммуникациями. Кроме того, анализ текста может использоваться для выявления депрессии, деменции и склонности к суицидальному поведению.

В рамках проекта исследователи изучили несколько подходов к машинному обучению. Они сравнили классические алгоритмы, включая метод опорных векторов и градиентный бустинг, с современными нейросетевыми моделями глубокого обучения.

Наиболее эффективным оказался подход со сверточными нейронными сетями. По словам ученых, именно эта технология показала наилучшие результаты при определении пола автора текста.

Доцент НИЯУ МИФИ Александр Сбоев сообщил, что система особенно успешно работает в случаях, когда автор не пытается скрыть свой пол. Следующим этапом исследования станет решение более сложной задачи — распознавания пола при намеренном искажении стиля речи.

Для проверки модели ученые использовали тексты с сайтов знакомств, где авторы сознательно выдавали себя за представителей противоположного пола. По словам разработчиков, нейросеть смогла распознать подмену в каждом из протестированных случаев.

Исследователи подчеркивают, что развитие подобных технологий связано с ростом цифрового общения и необходимостью анализа больших объемов текстовой информации. Сейчас научная группа занимается созданием системы, которая сможет определять возраст автора по особенностям письменной речи.

Читайте также:

Читать нас в Дзен Новостях
Новости Рязанской области, России и мира!