Борьба с вирусным и вредоносным ПО может быть стать более эффективной, если научиться находить авторов таких программ. В Томском государственном университете уверены, что это возможно. Силами сотрудников научного центра разработана система способная «вычислять» программистов по их почерку, манере написания кода. Разработка может быть использована и для пресечения случаев плагиата, которые встречаются все чаще. В популярном тематическом журнале Future Internet опубликована статья, описывающая это интересное исследование.
Технология базируется на машинном обучения. Она анализирует исходный код и находит в нем особенности, которые и определяют почерк каждого конкретного разработчика. Выполнив, анализ других его продуктов, она может найти повторение особенностей. Кроме того, этот ИИ способен определить код, написанный людьми от кода, написанного машинами. Специалисты ТУСУР утверждают, что их разработка не просто дает подобное заключение, но и указывает на использованную генеративную модель.
Подобные решения уже существуют, но результаты их использования явно не дотягивают до результатов, показанных российской системой ИИ-анализа. Точность определения автора, пользующегося 2 языками программирования достигает 87%. Если программист работает с использованием трех языков, она ниже, но все равно остается достаточно высокой для практического применения – 76%. А вот верно отличить работу человека от плода машинного труда система может с 81.5% точностью.
Исследователи не останавливаются на достигнутом и планируют продолжить разработки. Направление поддержано и признано приоритетным – оно включено в программу университета до 2030 года. В дальнейшем ученые хотят освоить точный анализ скомпилированного кода.