Нейросетевой метод коррекции оптических искажений на основе предсказания карт смещений
02 апреля 2025 года
Бушмелев Дмитрий Вячеславович
(аспирант 3-го г. о., научные руководители к.ф.-м.н. Буданов В.М., Макаренко А.В., рецензент асп. 4 г. о. Капралов Ф.С.)
Современные оптические системы, особенно широкоугольные камеры, подвержены значительным геометрическим искажениям, таким как дисторсия. Традиционные методы её коррекции опираются на параметрические модели и калибровку, но не всегда способны эффективно обрабатывать сложные и нелинейные искажения. В данной работе представлен нейросетевой подход к коррекции дисторсии, основанный на предсказании карт смещений пикселей.
Предложенный метод использует единичную сферическую модель с варьированием фокусного расстояния, что позволяет охватить широкий диапазон углов обзора (от 60° до 80°). Архитектура модели представляет собой модифицированную U-Net с residual-блоками и транспонированными свертками, что позволяет эффективно обрабатывать как локальные, так и глобальные искажения.
Для обучения модели был сгенерирован синтетический датасет из 80 000 бинарных черно-белых изображений с разными углами обзора. Анализ результатов показал, что точность предсказаний заметно снижается при выходе за пределы обучающей выборки, особенно при больших углах обзора. Однако внутри диапазона 60°–80° предложенный метод демонстрирует высокую эффективность.
Данный подход открывает перспективы для дальнейшего развития методов коррекции дисторсии с использованием глубокого обучения. Будущие исследования будут направлены на улучшение архитектуры, снижение ошибок предсказания и повышение устойчивости модели к различным типам искажений.