НАУКОЕМКИЕ ТЕХНОЛОГИИ
В КОСМИЧЕСКИХ ИССЛЕДОВАНИЯХ ЗЕМЛИ

Сравнительный анализ алгоритмов оценки количества и структуры атрибутов в задачах классификации мобильных приложений

Шелухин О.И., Барков В.В., Полковников М.В.

Для оценки эффективности алгоритмов классификации в режимах обучения и тестирования с помощью разработанного программно-аппаратного комплекса была сформирована база данных мобильных приложений трафика, WEB (http, https), mail (SMTP, IMAP),  Skype (TCP, UDP)  и др.

Из полученных потоков трафика 66% исходных данных использовались для обучения, остальные для тестирования алгоритмов классификации выбранных приложений методами машинного обучения. В качестве алгоритмов классификации методами машинного обучения рассматривались: Random Forest, С4.5, SVM, Adaboost, Naive Bayes.

Для обоснования выбора количества атрибутов классификации использовались оберточный и фильтрующий методы. Показано, что некоторые атрибуты, используемые для классификации трафика, не несут значимой информации, и их использование незначительно влияет на эффективность классификации.

Рассмотрены алгоритмы выбора атрибутов классификации: PCA, InfoGain, CFS, Wrapper. Показано, что использование оберточного алгоритма выбора атрибутов является ресурсоемкой вычислительной операцией, которая при большом количестве атрибутов требует длительного времени.

Показано, что среди рассмотренных алгоритмов классификации предпочтение следует отдать алгоритму С4.5.

Сравнительный анализ алгоритмов отбора информативных атрибутов мобильных приложений показал, что наиболее эффективным и легко реализуемым является алгоритм InfoGain.

Специфической особенностью классификации мобильных приложений является высокая информативность всего нескольких атрибутов.  При выборе способа отбора атрибутов наиболее предпочтителен алгоритм, при котором сначала отбирается наиболее информативный атрибут, а к нему добавляются следующие менее информативные.

Для количественной оценки отбора   количества атрибутов предложен алгоритм отбора на основе их информативности.

Редакционная коллегия

Бобровский В.И.
(д.т.н., доцент, начальник отдела ОАО "ИНТЕЛТЕХ")

Борисов В.В.
(д.т.н., профессор, Действительный член Академии военных наук РФ, профессор кафедры вычислительной техники МЭИ)

Будко П.А.
(д.т.н., профессор, профессор кафедры технического
обеспечения связи и автоматизации ВАС)

Будников С.А.
(д.т.н., доцент, действительный член Академии информатизации
образования, начальник кафедры автоматизированных
систем управления ВУНЦ ВВС "ВВА")

Верхова Г.В.
(д.т.н., профессор, заведующая кафедрой автоматизации
предприятий связи СПб ГУТ им. профессора М.А.Бонч-Бруевича)

Гончаревский В.С.
(д.т.н., профессор, заслуженный деятель науки и техники
РФ, профессор кафедры технологий и средств технического
обеспечения и эксплуатации автоматизированных систем
управления ВКА имени А.Ф.Можайского)

Комашинский В.И.
(д.т.н., профессор, профессор кафедры обработки и передачи
дискретных сообщений СПб ГУТ им. профессора
М.А.Бонч-Бруевича)

Кирпанев А.В.
(д.т.н., доцент, начальник отдела ОАО «НПП «РАДАР ММС»)

Курносов В.И.
(д.т.н., профессор, академик Арктической академии наук,
академик Международной академии информатизации,
академик Международной академии обороны, безопасности
и правопорядка, член-корреспондент РАЕН, главный научный
сотрудник ОАО "НИИ "Рубин")

Мануйлов Ю.С.
(д.т.н., профессор, профессор кафедры автоматизированных
систем управления космических комплексов ВКА имени
А.Ф.Можайского)

Морозов А.В.
(д.т.н., профессор, действительный член Академии военных наук РФ, начальник кафедры автоматизированных систем боевого управления ВА ВПВО ВС РФ)

Мошак Н.Н.
(д.т.н., доцент, начальник отдела ОАО "ИНТЕЛТЕХ")

Пророк В.Я.
(д.т.н., профессор, профессор кафедры автоматизированных
систем управления ВКА имени А.Ф.Можайского)

Семенов С.С.
(д.т.н., доцент, профессор кафедры технического
обеспечения связи и автоматизации ВАС)

Синицын Е.А.
(д.т.н., профессор, начальник НИО ОАО "ВНИИРА")

Шатраков Ю.Г.
(д.т.н., профессор, заслуженный деятель науки РФ, ученый
секретарь ОАО "ВНИИРА")