AIConstructor: как команда учёных из Политеха решила создать проект для передовых разработок в сфере AI и ML и приблизить глобальное будущее в локальное настоящее

Дата публикации: 9.04.2021

За последний месяц мы уже несколько раз рассказывали в своих материалах о разработках, которыми занимаются учёные из команды проект «AIConstructor» (AIC). Пришло время подробнее рассказать о том, что это за проект, как он появился, кто входит в команду, в чём уникальность «Омской научной школы», а также какие у команды проекта планы на будущее.
Кстати, это уже второй материал в нашей рубрике «Universum», в которой мы пишем об академическом сообществе города, уникальных факультетах и кафедрах, а также научных школах, которые есть в нашем городе. Обязательно прочитайте первый материал в рубрике, посвящённый омскому Хогвардсу.

Время прочтения ≈ 14 минут

Что приходит на ум обычному человеку, когда речь заходит об искусственном интеллекте (AI/ИИ), машинном обучении (ML), больших данных (big data) и нейронных сетях? Например, часть нашей редакции могла бы подумать, что это явно необходимо для создания Терминатора и начала Судного дня. Но всё-таки давайте подумаем. 

Во-первых, этот винегрет из терминов заставляет подумать о том, что это что-то из области современной науки. Что-то солидное, востребованное, нужное, наукоёмкое, про математику и программирование, а ещё технологичное и инновационное. Во-вторых, что это что-то далёкое, потому что занимаются всем этим в каких-нибудь столичных Сколково, секретных, закрытых НИИ и заграницах, потому что для обычной жизни такие сложные технологии не очень нужны. А значит, и в провинции таким не занимаются, потому что незачем. Но это неправда. В нашем городе не только регулярно проходят мероприятия по данной теме, но и ведутся передовые разработки в отрасли. Вот оно наследие мощных математических традиций, существующих в Омске, о которых мы тоже уже как-то писали подробно, а ещё об этом и не только говорил в недавнем интервью выдающийся омский математик Александр Штерн

Более того разработки эти ведутся по инициативе самих учёных, которые объединяются в команды с коллегами из других городов и вместе занимаются тем, что приближают глобальное будущее в локальное настоящее. Именно так и поступили учёные из Политеха, создавшие проект «AIConstructor». Но ничего бы не получилось, если не научная школа, которая к тому времени уже сложилась. 

Научная школа Бориса Епифанцева 

Полное название школы можно сформулировать как: «Омская научная школа нейросетевых алгоритмов искусственного интеллекта в защищенном исполнении». Основателем школы является Борис Николаевич Епифанцев (1939-2016), доктор технических наук, профессор, один из ведущих ученых нашего города. Он занимался разработками в разных научных направлениях: от удалённой биометрической идентификации до разработки систем защиты от утечек информации.

Особенностью разработок Епифанцева было использование так называемых сетей вероятностных выводов Байеса для решения задач интеллектуального анализа данных и неразрушающего контроля. Именно эти его идеи и послужили фундаментом научной школы и получили развитие в работах его учеников

Сконцентрировались последователи Епифанцева на кафедре «Комплексной защиты информации» (КЗИ) ОмГТУ, сегодня возглавляемой доктором технических наук Павлом Сергеевичем Ложниковым. Именно тут и сложился коллектив из молодых исследователей, которые сегодня представляют ядро научной школы и основной костяк команды «AIConstructor». 

Мы поговорили с автором идеи проекта AIC, руководителем и главным разработчиком проекта, кандидатом технических наук, доцентом кафедры КЗИ, старшим научным сотрудником ОмГТУ Алексеем Сулавко.

Хотелось облегчить жизнь молодым исследователям в начале пути

 – Идея создания AIConstructor возникла ещё в 2014 году. В то время я окончил аспирантуру и работал программистом на одном из омских предприятий. Параллельно с работой готовился к защите кандидатской диссертации. Моим научным руководителем был доктор технических наук, профессор Епифанцев Борис Николаевич, основатель кафедры информационной безопасности в СибАДИ и факультета ИСУ. Научная группа Бориса Николаевича тогда выполняла несколько задач из разных предметных областей. Несмотря на все различия этих задач, в них применялись схожие методы и подходы к анализу сигналов и машинному обучению. Все эти задачи сводились к классификации образов. Многие студенты и аспиранты, прежде чем получить какую-либо научную новизну в рамках исследований, обычно заново реализовывали в своих приложениях функционал, который ранее уже кто-то делал. Тогда мне пришла мысль, что все наработки нужно как-то аккумулировать, заключить их внутри одной системы, одного программного комплекса, таким образом, чтобы его можно было дополнять новыми алгоритмами и использовать в любых задачах классификации. 

«Такой программный комплекс по изначальному замыслу должен был облегчить жизнь молодым исследователям в начале пути»

В определенный момент я просто уволился и ушел в никуда 

– Никаких средств на разработку программы не было. Но сама мысль о ней не давала мне покоя. Я пробовал участвовать в программе УМНИК с этой идеей, но безуспешно – никто не оценил задумку (тема моего доклада называлась «Программный комплекс для быстрого прототипирования систем распознавания образов»). Обычная работа программиста не давала возможности реализовать свои идеи, а времени заниматься исследованиями не хватало. К тому же нужно было искать совет для защиты диссертации. И в определенный момент я просто уволился и ушел в никуда (искать совет, искать деньги, писать программу, не понимая до конца зачем), хотя об организации, где я работал, остались исключительно положительные впечатления. Однако в итоге все сложилось весьма неплохо.

О закреплении в науке и везении

– В 2014 году я защитил кандидатскую диссертацию и все-таки выиграл грант по программе УМНИК (правда, на другую тему). В этот же период вместе с моим товарищем кандидатом технических наук Александром Еременко мы выиграли грант РФФИ (Российский фонд фундаментальных исследований) на 3 года на тему генерации криптографических ключей из биометрических данных). Он дал возможность заниматься любимым делом и получать за это деньги. Это в свою очередь позволило в свободное время разрабатывать программный комплекс, который использовался для проверки гипотез в рамках собственных исследований. Мы называли его «система проверки гипотез». Потом были еще гранты РФФИ и РНФ (Российский научный фонд), наша группа росла, я «закрепился в науке», а программный комплекс оброс множеством функций.

«Мне повезло со студентами. Примерно полтора-два года я стал руководителем трёх человек (ныне магистрантов и аспиранта) Дениса Стадникова (крайний справа), Адиля Чобан (второй справа) и Даниила Иниватова (крайний слева). Примерно за год мы очень существенно доработали программный комплекс, выполнив действительно большой объем работы»

Название AIConstructor пришло в голову сравнительно недавно, около года назад, когда пришло осознание, что эта система является чем-то большим, чем предполагалось изначально.

Со всеми настоящими и бывшими участниками команды мы работали над совместными научными проектами в разное время

– С доктором технических наук Ложниковым Павлом Сергеевичем я познакомился ещё в 2004 году (почти 18 лет назад!), когда был студентом. Павел Сергеевич тогда работал на кафедре информационной безопасности в СибАДИ, он был куратором нашей группы и учеником Бориса Николаевича. Позже я выполнял дипломную работу под его руководством. В 2014 году он предложил работать на кафедре комплексной защиты информации, заведующим которой он является по сей день. Нас с ним объединяют долгие годы совместной работы. Можно сказать, что Павел Сергеевич был (и до сих пор остается) моим наставником во многих отношениях.

Бывшими учениками Бориса Николаевича также являются Александр Еременко, Елена Левитская, Самал Жумажанова и Александр Самотуга. Мы также давно знакомы и много работали вместе. 

Самал является моей аспиранткой и сейчас готовиться к защите диссертации, о ее работе кстати неоднократно писали в омской прессе. Елена из города Снежинск, при этом она поступила в аспирантуру СибАДИ, а потом защитила диссертацию в ОмГТУ. Александр Еременко на данный момент живет в Санкт-Петербурге, остальные работают на нашей кафедре.

С Денисом, Адилем и Даниилом я познакомился в ОмГТУ, когда читал у них курс «Основы информационной безопасности». Сейчас Денис стал профессиональным дата-сайентистом (работает на предприятии), Даниил – мой аспирант, а Адиль работает в ОмГТУ.

Кафедра КЗИ

В 2014 году на защите своей диссертации в городе Уфа (видимо в этом году произошли самые ключевые события этой истории) я познакомился с замечательным человеком доктором технических наук, профессором Владимиром Ивановичем Васильевым. Он сыграл огромную роль в развитии нашей научной группы и оказал неоценимую помощь по многим вопросам. Некоторые выпускники Владимира Ивановича являются членами нашей научной группы, например,  Екатерина Шалина.

«Деятельность, связанную с проектом AIConstructor, мы совмещаем с основной работой, так как на данный момент у нас нет финансирования, которое позволило бы некоторым участникам полностью перейти на задачи проекта. Поэтому всё идет не так быстро, как хотелось бы. Кроме того, многие на данный момент занимаются подготовкой диссертаций (Самал и Даниил – кандидатских, я – докторской), что также отнимает много времени. Однако надеюсь, что скоро мы решим вопрос с финансированием»

На текущий момент у нас накопилось множество разработок с разной степенью готовности от идей до почти готовых к внедрению продуктов

Основной фокус внимания (помимо самого AIConstructor) направлен на разработку систем высоконадежной биометрической аутентификации, дистанционной оценки психофизиологического состояния человека и нейроинтерфейсов. Для этого у членов команды есть силы и частично средства (например, Денис получил грант УМНИКа, Самал – стипендию президента, я – грант на защиту докторской по специальности «Методы и системы защиты информации, информационная безопасность»). О некоторых разработках уже упоминалось в прессе, поэтому я опишу только пару других.

Схема работы одного из исследований команды

Идентификация по ушному каналу

– Например, мы придумали и разработали технологию идентификации личности по внутренним особенностям строения ушного канала. В специальный наушник встраивается микрофон, через динамик в ухо посылается сигнал, который отталкивается от стенок ушного канала и меняет свои свойства. Отраженный сигнал регистрируется микрофоном. Регистрируемый сигнал у каждого человека имеет отличия, обусловленные индивидуальными особенностями наружного уха. По этим отличиям человека можно определить с очень высокой точностью, примерно, как по отпечатку пальца. При этом у технологии есть значительные преимущества. Отпечаток пальца, радужка, лицо, голос, автограф находятся «на виду» и поэтому компрометируются в естественной среде. Злоумышленник может снять биометрические характеристики бесконтактно или скрыто от владельца (например, с ручки двери, фотографии и др.). Индивидуальные особенности ушного канала скрыты от непосредственного наблюдения и не могут быть скопированы фотографированием. «Плоское» изображение уха недостаточно информативно для изготовления «муляжа».

Одни боятся ИИ. Другие думают, как его защитить

– Другим актуальным направлением на сегодняшний день является защита искусственного интеллекта (ИИ) от угроз информационной безопасности и его обучение на малых выборках. Важнейшим свойством для ИИ является возможность быстрого и устойчивого обучения на малом числе примеров, что означает способность ИИ обрабатывать большие объемы данных, а также формировать достоверные решения и делать высокоточные предсказания, даже если обучающая выборка ограничена в объеме и не в полной мере репрезентативна. Любое несанкционированное вмешательство в работу искусственного интеллекта может повлечь за собой последствия – материальный ущерб, нарушение информационной безопасности, угрозу жизни, здоровья граждан, технологический сбой или катастрофу и т.д. Все зависит от назначения конкретной реализации ИИ и возможностей, которыми данный экземпляр обладает. 

Под «защищенным исполнением» понимается невозможность совершения следующих действий любым неавторизованным лицом (процессом, пользователем, злоумышленником):

– анализа операций, совершаемых ИИ (алгоритма работы ИИ, суть преобразований);

– управления ИИ (с помощью изменения алгоритма работы, подмены данных ИИ и т.д.);

– извлечения знаний ИИ.

При работе над этим направлением мы вдохновились многими идеями доктора технических наук, профессора Иванова Александра Ивановича, проживающим в городе Пенза, который являлся научным руководителем при разработке первых отечественных стандартов по защите приложений нейросетевого искусственного интеллекта.

Никогда не сдавайся

– Провалов случается много (улыбается). Они, прежде всего, связаны с отказом в финансировании проектов, подаваемых на «грантовые» конкурсы. Но это естественный процесс, некоторые идеи поддерживают, некоторые ждут своей очереди. Количество отклоненных заявок всегда больше, чем поддержанных. Никогда не нужно сдаваться. Любой ученый должен быть фанатичным и гореть своей идей. Ученый всегда должен быть верен своей идее, и рано или поздно все задуманное реализуется. Если веры нет, то заниматься наукой бесполезно.

Демократизация искусственного интеллекта

– В планах – разработать, наконец, полнофункциональную версию AIConstructor и поместить её в облако. Наша цель – разработать платформу для быстрого создания ИИ (no-code platform). Этот проект крайне актуален. В мире полным ходом идет глобальная цифровая трансформация и так называемая демократизация ИИ (повышается доступность технологий искусственного интеллекта для широкого круга потребителей, особенно для неспециалистов). Подобные проекты стали появляться не так давно, но их все больше. Наверное, основной из них – это Microsoft Azure Machine Learning Designer. Существуют и другие, не такие масштабные. Эти продукты позволяют максимально насколько возможно упростить процесс создания ИИ. Минимум программного кода (или вообще его отсутствие). Искусственный интеллект создается в графическом редакторе, в виде последовательности блоков обработки информации. Некоторые блоки способны к обучению, некоторые нет (просто выполняют изначально заданные преобразования). Эти блоки выстраиваются в системы, которая обучается на загружаемых пользователем данных. Конечно, такой процесс нельзя назвать тривиальным, но он существенно проще, чем написание кода и его отладка.

«Через 3-5 лет таких продуктов будет множество, в том числе в России. Возможно раньше. Сегодня в России таких продуктов пока нет (где задача решается на таком уровне автоматизации). За рубежом этот рынок также формируется, он очень растущий. Я считаю, продукт можно назвать стратегически важным. Так как в близком будущем спрос на такие продукты сильно возрастет, сейчас еще не все понимают, зачем он нужен. Демократизация, в том числе подразумевает повышение информированности пользователей и их способности применять продукт»

Преимущества проекта: скорость, автоматизация и безопасность

Наше первое преимущество заключается в том, что мы реализуем поддержку «быстрого» обучения. Быстрого не столько в плане вычислительной скорости, а в плане снижения объема обучающей выборки. Наши модели в облачном AIC будут обучаться на выборке меньшего размера по сравнению с аналогами. Меньшего в разы. При этом решения ИИ будут такими же точными. Вопрос объема обучающей выборки для некоторых приложений имеет принципиальное значение. Не везде есть достаточное количество данных, как это не странно звучит. Например, в задачах из области медицины формирование выборки для исследований сопряжено с необходимостью верификации заболевания у пациента, что часто связано с инвазивными исследованиями. Обычно выборки достаточного объема собираются в течение многих лет. Другим примером является задача биометрической аутентификации. Настройка биометрической системы должна выполняться быстро (нельзя требовать от пользователя повторять ввод биометрических данных множество раз, иначе система не будет востребована на практике). Данный пример характерен тем, что проблема нехватки выборки в будущем никуда не исчезнет, независимо от того, какие объемы биометрических данных накоплены исследователями по всему миру. В реальной практике система все равно будет обучаться на малом числе примеров (обычно от 5 до 20). Подобные проблемы с нехваткой объемов выборки имеются и в других задачах.

Второе преимущество – автоматизация построения оптимальной конфигурации ИИ. Грубо говоря, нейронная сеть (или комитет сетей) будет строиться автоматически, и обучаться автоматически. Нагрузка на пользователя в этом процессе будет снижена. Пользователь даёт данные, а умный алгоритм подбирает решение.

Наконец, третье преимущество – безопасность. Мы разрабатываем защищенный режим исполнения, который позволяет защититься от многих угроз, которые существуют для приложений ИИ. Ну, тут уже надо разбираться подробнее, в рамках одной статьи не расскажешь.

Если спрос есть, то будет и предложение 

– Заинтересованность в использовании продукта пока выразили несколько предприятий (не только из Омска). В частности, ООО «НТЦ «КАСИБ» – инновационное предприятие, где я работал до 2014 года. 

Однако, как я уже упоминал, мы находимся на этапе разработки. На сегодняшний день есть демонстрационная десктопная версия, в которой можно создавать, обучать и тестировать модели, но нельзя размещать их в облаке, т.е. пока это не среда разработки ИИ. К тому же есть функционал, который мы еще не закончили. 

Пока демо-версию используют студенты и аспиранты в своих исследованиях, при выполнении дипломных и диссертационных проектов. В первую очередь, конечно, это ребята из ОмГТУ, где в целом нашему проекту оказывается всяческое содействие. Например, нас поддерживали, когда мы принимали участие в конкурсе Архипелаг 20.35. Есть также среди этих ребят обучающиеся в СибАДИ, ОмГУПС, УГАТУ.

«На данный момент проект находится на такой стадии, когда требуются инвестиции. В ближайшее время мы скорей всего начнем делать шаги по их привлечению»

Про донаты 

В свою очередь «Трамплин» также нуждается в поддержке своих читателей. Если хотите сделать пожертвование/задонатить (кому как больше нравится) нашему медиа, то можете это сделать буквально в пару кликов. Все подробности ниже. 

 

Поделиться:
Поддержи проект

Через интернет

Банковской картой или другими способами онлайн

Через банк

Распечатать квитанцию и оплатить в любом банке

  1. Сумма
  2. Контакты
  3. Оплата
Сумма
Тип пожертвования

Ежемесячное пожертвование списывается с банковской карты.
В любой момент вы можете его отключить в личном кабинете на сайте.

Сумма пожертвования
Способ оплаты

Почему нужно поддерживать «Трамплин»
Все платежи осуществляются через Альфа-банк

Скачайте и распечатайте квитанцию, заполнте необходимые поля и оплатите ее в любом банке

Пожертвование осуществляется на условиях публичной оферты

распечатать квитанцию
Появилась идея для новости? Поделись ею!

Нажимая кнопку "Отправить", Вы соглашаетесь с Политикой конфиденциальности сайта.