Вестник Бурятского государственного университета
Математика, информатика
АвторизацияРУСENG

Вестник БГУ. Математика, информатика

Библиографическое описание:
Кузьмин О. В.
,
Лавлинский М. В.
АРХИТЕКТУРЫ СЕГМЕНТАЦИИ ИЗОБРАЖЕНИЙ И ИХ ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ ДЛЯ БЕСПИЛОТНОЙ ПОСАДКИ ЛЕТАТЕЛЬНОГО АППАРАТА // Вестник БГУ. Математика, информатика. - 2023. №1. . - С. 38-46.
Заглавие:
АРХИТЕКТУРЫ СЕГМЕНТАЦИИ ИЗОБРАЖЕНИЙ И ИХ ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ ДЛЯ БЕСПИЛОТНОЙ ПОСАДКИ ЛЕТАТЕЛЬНОГО АППАРАТА
Финансирование:
Коды:
DOI: 10.18101/2304-5728-2023-1-37-46УДК: 519.25
Аннотация:
В данной работе рассматриваются архитектуры сегментации изображений и их практическое применение для беспилотной посадки, примеры реализованных систем доставки товаров дронами. Выбрана и реализована опти- мальная посадка дрона с использованием сегментации изображения нейронной сетью. Выбран и модифицирован набор данных для обучения, путем отзеркали- вания изображения и разворота изображения. Создана дополнительная выборка данных с использованием приложения, симулирующего полёт дрона в настраи- ваемом окружении. Найден способ быстрой разметки видеозаписи приземления дрона. Представлены результаты тестирования нейронных сетей различных архитек- тур для выявления оптимальной для решаемой задачи. Были применены две раз- ные метрики точности нейронной сети для получения достоверных данных о распознавании. Были выбраны наиболее точно узнаваемые классы окружения. Для этого было создано три варианта нейронных сетей с разным набором клас- сов. Результаты были проанализированы и выбраны наиболее узнаваемые классы. Создана финальная нейронная сеть на основе архитектуры LinkNet. Исходя из высоты дрона выбрана зона приземления и зона для последующей сегментации. Найдена оптимальная высота полета над поверхностью для начала процедуры приземления.
Ключевые слова:
нейронная сеть, сегментация изображения, беспилотный дрон, безопасная посадка, дистанционное управление.
Список литературы:
Ross Girshick, Jeff Donahue, Trevor Darrell, Jitendra Malik. Rich feature hierarchies for accurate object detection and semantic segmentation Tech report (v5) // UC Berkeley, arXiv:1311.2524v5. URL: https://arxiv.org/abs/1311.2524 (дата обращения: 10.02.2023).

George Vosselman, Gui-Song Xia, Alper Yilmaz, Michael Ying Yang. UAVid: A Semantic Segmentation Dataset for UAV Imagery, arXiv:1810.10438v2. URL: https://arxiv.org/abs/1810.10438 (дата обращения: 9.02.2023).

Shafaei, A., Little, J.J., Schmidt, M.: Play and learn: Using video games to train computer vision models, arXiv:1608.01745v2. URL: https://arxiv.org/abs/1608.01745 (дата обращения: 11.02.2023).

Tsung-Yi Lin, Piotr Dollar´, Ross Girshick, Kaiming He, Bharath Hariharan, and Serge Belongie. Feature Pyramid Networks for Object Detection, arXiv:1612.03144v2. URL: https://arxiv.org/abs/1612.03144 (дата обращения: 11.02.2023).

Abhishek Chaurasia, Eugenio Culurciello. LinkNet: Exploiting Encoder Repre- sentations for Efficient Semantic Segmentation, arXiv:1707.03718v1. URL: https://arxiv.org/abs/1707.03718. (дата обращения: 12.02.2023).

Olaf Ronneberger, Philipp Fischer, and Thomas Brox. U-Net: Convolutional Networks for Biomedical Image Segmentation, arXiv:1505.04597v1. URL: https://arxiv.org/abs/1505.04597 (дата обращения: 12.02.2023).

Hengshuang Zhao, Jianping Shi, Xiaojuan Qi, Xiaogang Wang, Jiaya Jia, Pyra- mid Scene Parsing Network, arXiv:1612.01105. URL: https://arxiv.org/abs/1612.01105 (дата обращения: 12.02.2023).

Keiron O’Shea, and Ryan Nash. An Introduction to Convolutional Neural Networks, arXiv:1511.08458v2. URL: https://arxiv.org/abs/1511.08458 (дата обращения: 12.02.2023).

Dor Bank, Noam Koenigstein, Raja Giryes. Autoencoders, arXiv:2003.05991. URL: https://arxiv.org/abs/2003.05991 (дата обращения: 12.02.2023).

Sibylle Hess, Wouter Duivesteijn, Decebal Mocanu. Softmax-based Classifica- tion is k-means Clustering: Formal Proof, Consequences for Adversarial Attacks, and Improvement through Centroid Based Tailoring, arXiv:2001.01987v1. URL: https://arxiv.org/abs/2001.01987 (дата обращения: 12.02.2023).

Zhilu Zhang, Mert Sabancu. Generalized Cross Entropy Loss for Training Deep Neural Networks with Noisy Labels, arXiv:1805.07836v4. URL: https://arxiv.org/abs/1805.07836 (дата обращения: 12.02.2023).

Hamid Rezatofighi, Nathan Tsoi JunYoung Gwak Amir Sadeghian, Ian Reid Silvio Savarese. Generalized Intersection over Union, arXiv:1902.09630. URL: https://arxiv.org/abs/1902.09630. (дата обращения: 8.02.2023).

Marina Sokolova, Nathalie Japkowicz, Stan Szpakowicz. Beyond Accuracy, F- score and ROC:a Family of Discriminant Measures for Performance Evaluation, Ad- vances in Artificial Intelligence. Lecture Notes in Computer Science. 2006. Vol. 4304. P. 1015–1021.

Ayoub Benali Amjoud, Mustapha Amrouch, Convolutional Neural Networks Backbones for Object Detection, Image and Signal Processing: 9th International Con- ference, ICISP 2020, Marrakesh, Morocco, June 4–6, 2020, Proceedings, Jun 2020. 282–289.

Andrew G. Howard, Menglong Zhu, Bo Chen, Dmitry Kalenichenko, Weijun Wang, Tobias Weyand, Marco Andreetto, Hartwig Adam. MobileNets: Efficient Con- volutional Neural Networks for Mobile Vision Applications, arXiv:1704.04861. https://arxiv.org/abs/1704.04861 (дата обращения: 12.02.2023).

Обнаружение лесных пожаров с помощью беспилотных летательных ап- паратов / О. В. Кузьмин, А. А. Лавлинская, Г. А. Филь, М. Д. Камнев // Матема- тика, ее приложения и математическое образование (МПМО'20): материалы конференции. 2020. С. 134–136.

Лавлинская А. А., Филь Г. А., Камнев М. Д. Создание модели квадрокоптера-эколога // Прикладные вопросы дискретного анализа: сб. науч. тр. / под ре- дакцией О. В. Кузьмина. Иркутск: Изд-во ИГУ, 2020. Вып. 6. С. 78–83.

Проектирование БПЛА для мониторинга лесных массивов и водных пространств / О. В. Кузьмин, А. А. Лавлинская, Б. А. Тараканов [и др.] // Прикладные проблемы дискретного анализа: сб. науч. тр. / под редакцией О. В. Кузьмина. Иркутск: Изд-во ИГУ, 2021. Вып. 7. С. 66–72.

Кузьмин О. В., Лавлинский М. В. Создание модели беспилотного летательного аппарата для помощи в решении проблемы пожаров в Иркутской облас- ти // Современные технологии. Системный анализ. Моделирование. 2020. № 2 (66). С. 136–143. DOI: 10.26731/1813-9108.2020.2(66).136-143.

Кузьмин О. В., Лавлинский М. В. Создание модели беспилотного летательного аппарата типа биплан, использующей генетический алгоритм в полете, для помощи в решении проблемы пожаров в Иркутской области // Современные технологии. Системный анализ. Моделирование. 2021. № 3 (71). С. 185–192. DOI: 10.26731/1813-9108.2021.3(71).185-192.