> Ученые МГУ изучают способы выявления искусственно сгенерированных текстов - Аргументы Недели

//Наука 13+

Ученые МГУ изучают способы выявления искусственно сгенерированных текстов

22 сентября 2023, 10:34 [ «Аргументы Недели» ]

Ученые факультета вычислительной математики и кибернетики МГУ представили результаты своего исследования, направленного на разработку методов распознавания автоматически созданных текстов.

Искусственно сгенерированный текст представляет собой текст на естественном языке, созданный, модифицированный или дополненный машиной. В прошлом веке для создания таких текстов использовались методы на основе шаблонов и статистические методы. Однако с тех пор появились более продвинутые методы машинного обучения и нейронные сети.

В 2017 году была представлена архитектура глубоких нейронных сетей transformer, что привело к созданию большого количества языковых моделей, способных автоматически создавать крупные объемы качественных текстов на естественном языке. В связи с этим возрос интерес к разработке методов, позволяющих распознавать автоматически порожденные тексты от написанных человеком.

В качестве методов распознавания была выбрана модель ruRoBERTa, разработанная командой SberDevices специально для обработки русскоязычных текстов. Дополнительно была рассмотрена модель на основе архитектуры LSTM.

«По причине того, что мы не смогли найти в открытом доступе подходящий для обучения моделей набор данных, было принято решение сформировать его самостоятельно. Для генерации отзывов была выбрана модель ruGPT-3 Large, которая хорошо зарекомендовали себя на схожих задачах в других исследованиях», - отметила ассистент кафедры алгоритмических языков факультета ВМК МГУ Наталья Ефремова.

Созданный набор данных был использован для обучения и оценки качества работы моделей LSTM и RoBERTa. Модель LSTM достигла точности 82%, а модель RoBERTa - 86%.

В целом, модели правильно распознают сгенерированные отзывы, которые на первый взгляд кажутся реальными. При этом большинство ошибочных распознаваний происходит с короткими отзывами.

МН


Обсудить наши публикации можно на страничках «АН» в Facebook и ВКонтакте

//Политика

Сенатор Косачев: решение по Украине примут не в Киеве, а в высоких овальных кабинетах

Заместитель председателя Совета Федерации Константин Косачев заявил, что принимать решение по урегулированию украинского конфликта, вероятно, будут не в Киеве, а в "более высоких овальных кабинетах". Политик сделал такое заявление, пояснив, что Украина зависима от западных спонсоров, - передает РИА Новости. По словам Косачева, также возможно, что принимать окончательные решения будут не нынешние украинские лидеры. "Весь пафос лозунгов "ни слова об Украине без Украины" может свестись к тому, что Киев просто уведомят о принятых в более высоких овальных кабинетах решениях", - выразил мнение политик. Будущий спецпосланник США по Украине Кит Келлог ранее заявил, что Дональд Трамп хочет устойчивой договоренности между Москвой и Киевом и сможет добиться ее "в относительно короткий срок". Как отметил Косачев, в какой-то степени это было бы выходом для киевского режима, который может сослаться на то, что ему не оставили выбора.