Он не боится телефонных мошенников, потому что привык все цифровые операции проводить самостоятельно. Он умеет «договариваться» с искусственным интеллектом и учит машины видеть. А еще ученый Владимир Сурин знает ответ на вопрос, сколько будет дважды два. И это… не тот ответ, о котором вы подумали.
Справка «АН»
Владимир Анатольевич Сурин, кандидат технических наук, руководитель лаборатории технического зрения и роботизированных систем в индустрии, доцент кафедры «прикладная математика и программирование» ЮУрГУ, руководитель проектных работ по компьютерному зрению в центре образовательных программ топ-уровня в сфере искусственного интеллекта «ВиртУм». Учувствовал в реализации ряда грантов Российского научного фонда и проектов для промышленной сферы Челябинской области. Ведет научные исследования в области компьютерного зрения и искусственного интеллекта. Опубликовал 24 научные работы.
Хобби стало профессией
— Моя научная деятельность стартовала в магистратуре. Первый доклад на конференции, первая опубликованная статья… В аспирантуре уже нужно было исследования проводить, причем не только практические. Придумывал математическую модель некоторого явления, потом ее изучал. Это увлекало, — вспоминает Владимир Анатольевич.
— Почему программирование выбрали?
— В школе все легко и просто было. Я любил математику, физику и программирование, чего нельзя было сказать о русском языке и уж тем более о литературе. В первом классе, как только появился первый компьютер, я практически сразу начал программировать, но очень поверхностно. Конечно, интерес вызывали игры. Но когда попадалась слишком сложная игра, приходилось открывать и смотреть код, править там всякие параметры.
Где программирование, там и математика. Пытался строить какие-то графики, рисуночки примитивные делал — черными линиями на белом фоне. На основе математических формул с помощью алгоритмов и циклов рисовал синусоиды, другие графики, и из этого складывалась картинка. Хобби такое было. Когда дома появился компьютер на основе процессора Pentium I, а в школе нам начали преподавать Basic, у меня уже имелся опыт программирования, и было интересно получать новые знания в этом направлении.
Выбирая вуз для поступления, определился сразу, посмотрев интересующие дисциплины. Екатеринбург мне не нравится, Москва и Питер, Новосибирск и Томск — слишком далеко. А ЮУрГУ — всего 200 километров от моей деревни. Жил в общежитии, пока не купил квартиру.
— А как вы пишете научные статьи, учитывая нелюбовь к русскому языку и литературе?
— В научных статьях важно излагать четко факты. Деепричастные обороты, какие-то метафоры, эпитеты — этого всего не нужно. Так что для меня писать статьи проще, чем, к примеру, сочинение по литературе. За сочинения я всегда плохие оценки получал, хотя казалось, что текст нормально анализировал.
Статья — это цифры, графики. Главное — объяснить суть, а не красота русского языка. К слову, сейчас появились всякие ЛЛМки (LLM, Large language model). Эти большие языковые модели умеют очень красиво генерировать текст, если правильно прописать запрос. Какие-то описательные моменты, которые не хочется самостоятельно придумывать, они помогают сделать. А нарисовать график, посчитать числа — это обычная наша работа.
— Ваша кандидатская диссертация связана с совершенствованием телефонов?
— Она была посвящена фильтрации шумов в изображениях. При фотографировании из-за несовершенства цифроаналоговых преобразователей раньше была проблема: появлялись яркие точки, шумы. Сейчас в телефонах картинка такая идеальная благодаря тому, что применяются методы и алгоритмы фильтрации шумов, которые кто-то разработал. А я разрабатывал собственный метод фильтрации изображений и справился с задачей, получил адекватные результаты.
Этот метод я уже пару раз применял в тех научных статьях, которые писал в рамках государственных заданий и гранта Российского научного фонда. А сейчас помимо компьютерного зрения мой научный интерес — применение искусственного интеллекта. Это трендовое направление. Искусственный интеллект связан с большим потреблением ресурсов, но его проще применять, и он дает лучшие результаты.
— С ним вообще легко «договариваться»?
— Мы имеем дело с машинным обучением, и нейронные сети успешно решают конкретные задачи. Например, фильтрация или обработка изображений либо поиск объектов на изображении. Методы известны, и мы используем те, которые нам интересны. Иногда эти методы немножко «подкручиваем», уточняем параметры, чтобы сети выполняли именно то, что нам нужно. Не до конца понятно, как уж они это делают... Но работает!
Умный беспилотник
— Вы являетесь руководителем двух лабораторий. Сложно постоянно быть в режиме многозадачности?
— Это уже вошло в привычку. Возглавляю лабораторию компьютерного зрения и робототехнических систем индустрии. Параллельно мы реализуем проект для молодежной лаборатории, где являюсь одним из руководителей.
— Словосочетание «компьютерное зрение» звучит настораживающе. Многие и так своих компьютеров слегка побаиваются…
— У нас задача научить компьютер делать то, что делает человек, чтобы освободить человека от определенных забот. В частности, сейчас мы учим компьютер нескольким вещам. Во-первых, дефекты находить в рамках автоматизации производства, во-вторых, распознавать обстановку на дороге. Условно говоря, автопилот, только у нас он немножко специфичный. Речь идет не о дорогах общего пользования, а о промышленных объектах — складах, производственных территориях. В частности, для НПО «Электромашина» создаем систему технического зрения, которая станет помощником водителю новой разработки — электрической грузовой тележки.
Также мы делаем компьютерное зрение для локальной навигации, то есть для беспилотников, как ездящих, так и летающих. Учим ориентироваться в пространстве, чтобы беспилотник сам понимал, где объекты, которые он может задеть при перемещении, и где посадочная площадка.
— «Толковые ребята» эти беспилотники?
— Ну что сказали нейросети, то она и делает. Однако человек пока все равно вне конкуренции. Хотя бы потому, что он все лучше понимает. Но мы же человека не посадим в маленький квадрокоптер. Мы можем только сделать так, чтобы оператор им управлял. А когда коптеров становится очень много, людей не хватает.
Кроме того, мы решаем задачи дефектоскопии. Это одновременно и научная, и практическая разработка. При производстве подвесных высоковольтных изоляторов специалисты ищут дефекты в изделии — разные включения, пузырьки, трещины. Это очень тяжелая для человека работа в плане напряжения зрения. Через четыре часа необходим отдых. А компьютерному зрению без разницы, сколько работать. Нейронная сеть круглосуточно демонстрирует одну и ту же производительность и эффективность.
— Ни одного пузырька не пропустит?
— Ну… смотря как мы научим. Может пропускать дефекты, если научим плохо. Я о том, что там стабильно все работает. Изначально результативность человека эффективнее любых алгоритмов. Но на нее многое влияет: не выспался, не поел, расстроился из-за чего-то...
Мы пытаемся создать алгоритмы, которые заменят человека на нудной и однообразной работе. Задача сложная, потому что форма у объектов разная, они все прозрачные, фотографировать их очень непросто. Не обошлось и без обычной математики, традиционных алгоритмов, потому что все на откуп машинному обучению отдать нельзя. К слову, научных работ, касающихся обнаружения дефектов в стеклянных изоляторах, мы не встречали в открытых источниках, в научном сообществе эта тема не поднимается. Так что, возможно, мы первопроходцы.
Окончание следует.

