Исследователи Университетского колледжа Лондона выяснили, что люди не могут отличить до 25–27% звуковых дипфейков, где нейросети имитируют реальные голоса.
В эксперименте поучаствовали 500 испытуемых, которых разделили на 2 группы. В них вошли носители английского и китайского языков. Одна группа готовилась распознавать фейки, а другая — нет. Как оказалось, и подготовленная группа, и неподготовленная показали примерно одинаковые результаты. С заданием справился только специальный алгоритм, настроенный на выявление аудио фейков.
В итогах научной работы сказано, что уже пора задуматься о создании большего количества инструментов для защиты от фейков. Пусть сегодня для работы с таким контентом нужны люди со специальными знаниями, много оборудования и ПО, большие вычислительные ресурсы. Однако это не значит, что воссоздать это всё вне лабораторий нельзя.
Специалисты отмечают, что человек может отличить фейковый голос при долгом разговоре, потому что нейросети ещё не скоро будут передавать манеры речи, которые человек считывает на подсознательном уровне. Но так как мошеннические разговоры обычно быстрые и запутанные, в помощь людям нужны новые технологии.