'
Научный журнал «Вестник науки»

Режим работы с 09:00 по 23:00

zhurnal@vestnik-nauki.com

Информационное письмо

  1. Главная
  2. Архив
  3. Вестник науки №6 (87) том 3
  4. Научная статья № 207

Просмотры  77 просмотров

Гладков Н.Ю.

  


ВЛИЯНИЕ ТИПА РЕЛЬЕФА НА НАДЕЖНОСТЬ ВИЗУАЛЬНОЙ ОДОМЕТРИИ: ТЕСТИРОВАНИЕ НА СИНТЕТИЧЕСКИХ ДАТАСЕТАХ *

  


Аннотация:
в работе исследуется эффективность алгоритмов визуальной одометрии на основе изображений подстилающей поверхности разных типов рельефа. Представлен метод генерации сложных синтетических данных с использованием игровых движков. Результаты экспериментов демонстрируют, как различные типы рельефа влияют на надежность методов визуальной одометрии.   

Ключевые слова:
компьютерное зрение, визуальная одометрия, генерация синтетических данных, подстилающая поверхность   


Компьютерное зрение играет ключевую роль в автономной навигации роботов, беспилотных транспортов и дронов. Одной из важнейших задач в этой области является визуальная одометрия (VO), позволяющая оценивать перемещение системы по последовательности изображений.В представленных абзацах содержится почти идентичная информация о проблемах, связанных с однородными и водными поверхностями, что создает избыточность. Оба текста подчеркивают, что традиционные методы визуальной одометрии (VO), такие как ORB-SLAM, DSO и LSD-SLAM, теряют надежность при работе в условиях низкой текстуры и сложного освещения, особенно на изменчивых поверхностях, таких как вода. Рекомендуется объединить эти идеи в один более ёмкий абзац, чтобы избежать повторений и сделать текст более сжатым и информативным.В большинстве исследований VO рассматриваются фронтальные или боковые обзоры [1, 2], однако в ряде приложений, таких как навигация дронов или наземных роботов [3]. В данной работе рассматривается камера, направленная перпендикулярно вниз прямо на подстилающую (опорную) поверхность. Такой ракурс обеспечивает постоянное присутствие подстилающей поверхности в поле зрения, что делает ее перспективным источником данных для одометрии.Однако существующие датасеты редко учитывают специфику подобной конфигурации камеры. Большинство доступных наборов данных ориентированы на фронтальные или боковые обзоры, что затрудняет валидацию алгоритмов для данного случая. Кроме того, проведение натурных экспериментов требует сложной аппаратуры [4] и трудоемких полевых испытаний [5], что экономически оправдано лишь на финальных этапах проверки точности VO. На ранних стадиях разработки достаточно математического моделирования и упрощенных синтетических экспериментов, позволяющих проверить работоспособность метода.Ключевым аспектом исследования является разнообразие типов подстилающей поверхности, включая как стандартные варианты (асфальт, грунт, трава), так и сложные для трекинга среды, например, водную поверхность. Последняя представляет особый интерес из-за слабой текстуры, специфики освещения и постоянных динамических изменений из-за волн, что делает ее наиболее проблемной для визуальной одометрии. Учитывая сложность работы с реальными данными в изменчивых условиях, возникает необходимость в контролируемых экспериментах. Синтетические датасеты позволяют воспроизводить различные типы поверхностей с минимальными трудностями и затратами времени.Разработка системы моделирования с нуля представляется нецелесообразной – такой подход потребовал бы значительных вычислительных и временных затрат на воссоздание реалистичной физики, освещения и динамики поверхностей. Вместо этого эффективным решением является использование современных игровых движков, таких как Unreal Engine или Unity.Их графические возможности за последние годы достигли уровня, достаточного для генерации фотореалистичных сцен, а встроенные инструменты физического моделирования позволяют воспроизводить сложные взаимодействия с окружающей средой. Это дает возможность быстро создавать разнообразные синтетические датасеты с контролируемыми параметрами, не затрачивая ресурсы на самостоятельную реализацию рендеринга и симуляции.На последующих этапах исследования перспективным направлением могло бы стать использование ROS (Robot Operating System) для интеграции дополнительных датчиков и проверки алгоритмов в условиях, приближенных к реальным. Однако в данной работе сознательно ограничиваемся анализом исключительно визуальных данных, чтобы оценить максимальный потенциал одометрии, основанной только на изображениях. Такой подход позволяет выявить фундаментальные ограничения методов, связанных с различными типами рельефа, прежде чем усложнять систему за счет других источников информации. В этом контексте рассмотрим использование игровых движков в качестве инструмента для исследований. Рассмотрим несколько примеров использования данного метода в научных работах.В исследовании [6] Unreal Engine применялся для создания точной 3D-визуализации долины реки Влтавы площадью 1670 км² на основе ГИС-данных, демонстрируя возможности движка в работе с крупномасштабными территориями.В работе [7] Unreal Engine 5 использовался для моделирования последствий повышения уровня моря на острове Маврикий, что наглядно показало потенциал движка в экологических исследованиях и моделировании среды.Особый интерес представляет исследование [8], где сравнивалась эффективность Unity и Unreal Engine в создании фотореалистичных морских сцен. Результаты показали преимущество Unity в моделировании водной поверхности.Эти работы подтверждают научную ценность игровых движков как инструментов моделирования реальных сред, природных изменений и последствий.В данной работе для создания реалистичных датасетов использовались два наиболее распространенных игровых движка — Unreal Engine 5 и Unity. Оба обеспечивают высококачественную визуализацию, близкую к реальным условиям, что критически важно для тестирования алгоритмов визуальной одометрии.Однако в ходе экспериментов с Unreal Engine 5 выявились существенные ограничения:высокие требования к аппаратным ресурсам,сложность настройки и дороговизна готовых ассетов,проблемы с реалистичностью физики воды.В частности, при моделировании водной поверхности в Unreal Engine 5 наблюдались артефакты коллизий волн (рисунок 1), что требовало дополнительных трудоемких корректировок. В то же время Unity продемонстрировал стабильную работу даже на средних мощностях, обеспечив естественное поведение волн без визуальных искажений.Учитывая эти факторы, дальнейшая разработка датасетов с водными поверхностями была сосредоточена на Unity, где удалось эффективно воспроизвести различные типы подстилающих поверхностей. Этот выбор позволил оптимизировать процесс генерации данных без потери качества визуализации.Рисунок 1. Демонстрация кадров водной поверхности в игровых движках:справа в Unreal Engine, слева в Unity.Более подробно рассмотрим метод создания синтетического датасета на примере Unity. В начале было создано несколько сцен с различными типами подстилающей поверхности, используя ассеты и библиотеки Unity, что дало возможность смоделировать как водные, так и наземные ландшафты.Далее были настроены параметры сцены и камеры: камера была размещена на высоте 30 метров и направлена строго вниз, чтобы имитировать полет БПЛА. Заданная высота позволяет упростить задачу одометрии и не вычислять высоту камеры, ограничиваясь определением координат X и Y.Была задана траектория движения камеры по сцене, что позволило получать изображения с разных позиций по мере движение камеры, максимально приближенных к реальным условиям съемки с беспилотника.Для получения набора изображений использовался встроенный инструмент Recorder, с помощью которого была произведена запись последовательности кадров с камеры. В результате был сформирован датасет из 300 изображений с заданными параметрами разрешения, который затем использовался для дальнейших экспериментов и исследований в области визуальной одометрии.По аналогичной методике было создано несколько специализированных датасетов, различающихся типами подстилающей поверхности и условиями съемки. Основные характеристики сгенерированных датасетов представлены в таблице 1. Такой подход позволил создать комплекс тестовых данных для оценки устойчивости алгоритмов визуальной одометрии к различным типам подстилающих поверхностей.Таблица 1. Список и характеристики синтетических датасетов.В данной работе одним из алгоритмов исследуется метод визуальной одометрии, разработанный на основе подхода статьи [9].Процесс обработки начинается с предварительной подготовки изображений. Каждый кадр преобразуется в градации серого для упрощения последующих вычислений, после чего выделяется рабочая область для анализа. На следующем этапе выполняется корреляционный анализ - программа ищет соответствия между областями соседних кадров и вычисляет пиксельный сдвиг с использованием формулы нормированной корреляции.Для повышения точности измерений применяется метод оптического потока. Он позволяет итеративно уточнить смещения отдельных пикселей и компенсировать сдвиги между кадрами. На заключительном этапе происходит интеграция результатов - совмещение данных корреляционного анализа и оптического потока для расчета итогового смещения камеры.Для объективной оценки эффективности работы алгоритмов был выполнен анализ классических подходов к визуальной одометрии, основанных на детекторах ключевых точек. В качестве других методов VO для сравнения были использованы библиотеки OpenCV и ORB-SLAM3, более подробно описанная в статье [10].Реализация с помощью OpenCV использует комбинированный алгоритм ORB, объединяющий преимущества детектора FAST и дескриптора BRIEF с дополнительными модификациями для повышения устойчивости к изменениям ориентации. Этот подход позволяет эффективно идентифицировать и описывать ключевые точки на изображениях.Теперь перейдем к демонстрации работы алгоритмов на полученных сгенерированных датасетах. Для оценки эффективности нескольких методов визуальной одометрии (ORB в OpenCV и ORB-SLAM3) был проведен эксперимент на различных типах рельефа и траекториях движения. В таблице 1 представлены основные параметры использованных датасетов, включая тип поверхности, разрешение и характер движения камеры. Для удобства в траекториях отсутствуют повороты камеры, что позволяет сосредоточиться на оценке смещений в линейном движении.Сократим результаты экспериментов для анализа самых наглядных данных о работе алгоритмов над водной и земной поверхностью. Рассмотрим работу алгоритма на основе библиотеки OpenCV c технологией ORB на тех же самых траекториях разного типа, подстилающих поверхности на рисунке 2, высота камеры возрастает слева направо.Рисунок 2. Движение по оси х по прямой над земной поверхностью на разной высоте камеры алгоритма с технологией ORB.На рисунке 2 можно заметить, что алгоритм OpenCV отлично справляется при ряде условий: наличия неизменной среды, то есть богатой ключевыми точками. Наиболее точные результаты получается при максимальном отдалении камеры от земли, таким образом алгоритм может видеть больше подстилающей поверхности и работает точнее.На рисунке 3, можно наблюдать корректное отображение перемещения камеры, определенное с помощью алгоритма, использующего метод корреляции с оптическим потоком.Рисунок 3. Движение по оси х и y по прямой над озером алгоритма с методом корреляции.Теперь рассмотрим рисунок 4, там демонстрируется, что у алгоритма ORB является проблемой полностью водная поверхность и перемещения над ней приводит к некорректным результатам. В то время как одометрии на основе корреляции и оптического потока справляется с задачей определения своего перемещения корректно над всеми типами подстилающей поверхности. Результат можно наблюдать на рисунках 3 и 5.Рисунок 4. Движение по оси х по прямой над водной поверхностьютипа океан на разной высоте камеры алгоритма ORB.Рисунок 5. Движение по оси х по прямой над водойалгоритма с использование корреляции.Экспериментальные данные подтвердили ограничения алгоритма ORB при работе с водными поверхностями и однородными текстурами. Хотя оба тестируемых метода в целом справляются с задачей, ORB показывает значительную погрешность на каменистой местности при сложном освещении - проблемы, которых удается избежать корреляционному методу, правда ценой существенно большего времени вычислений.Анализ работы алгоритмов выявил прямую зависимость между размером анализируемого окна, точностью одометрии и скоростью обработки. Корреляционный подход, обеспечивая надежные результаты, требует значительно больше вычислительных ресурсов. Как показано на рисунке 4, алгоритм на основе ORB оказывается неспособен корректно определять траекторию над водной поверхностью без наличия четких ориентиров типа береговой линии, что связано с недостатком устойчивых ключевых точек в таких условиях.Визуальная одометрия с ключевыми точками демонстрирует отличные результаты на сценах с богатыми текстурами, но сталкивается с проблемами при работе с однородными поверхностями, включая водные пространства и участки со слабым освещением. В отличие от ORB метод с использованием корреляции показывает универсальность на всех типах рельефа, но его главным минусом является высокая вычислительная стоимость, что и ограничивает применение. На основе этих результатов алгоритм ORB более предпочтительный выбор для большинства практических задач, испытывая в специфических сценариях с бедными или динамически изменчивыми текстурами подстилающей поверхности.Проведенные исследования доказывают, что тип рельефа влияет на надежность алгоритмов VO. Алгоритмы на основе ключевых точек (ORB) быстры и эффективны на текстурированных поверхностях. Корреляционный метод универсален, но требует много ресурсов. Результаты подчеркивают важность выбора алгоритма в зависимости от среды и необходимость гибридных решений.   


Полная версия статьи PDF

Номер журнала Вестник науки №6 (87) том 3

  


Ссылка для цитирования:

Гладков Н.Ю. ВЛИЯНИЕ ТИПА РЕЛЬЕФА НА НАДЕЖНОСТЬ ВИЗУАЛЬНОЙ ОДОМЕТРИИ: ТЕСТИРОВАНИЕ НА СИНТЕТИЧЕСКИХ ДАТАСЕТАХ // Вестник науки №6 (87) том 3. С. 1713 - 1724. 2025 г. ISSN 2712-8849 // Электронный ресурс: https://www.вестник-науки.рф/article/24420 (дата обращения: 22.01.2026 г.)


Альтернативная ссылка латинскими символами: vestnik-nauki.com/article/24420



Нашли грубую ошибку (плагиат, фальсифицированные данные или иные нарушения научно-издательской этики) ?
- напишите письмо в редакцию журнала: zhurnal@vestnik-nauki.com


Вестник науки © 2025.    16+




* В выпусках журнала могут упоминаться организации (Meta, Facebook, Instagram) в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25 июля 2002 года № 114-ФЗ 'О противодействии экстремистской деятельности' (далее - Федеральный закон 'О противодействии экстремистской деятельности'), или об организации, включенной в опубликованный единый федеральный список организаций, в том числе иностранных и международных организаций, признанных в соответствии с законодательством Российской Федерации террористическими, без указания на то, что соответствующее общественное объединение или иная организация ликвидированы или их деятельность запрещена.