بررسی مدلهای شبکه عصبی عمیق برای پردازش تصاویر سونار زیر آب
کد مقاله : 1166-NAEC
نویسندگان
سید حسین زراعتکار *1، محمد هادی علائیان2
1دانشچوی کارشناسی ارشد دانشگاه خواجه نصیر الدین طوسی
2تهران - سیدخندان - دانشکده مهندسی کامپیوتر دانشگاه صنعتی خواجه نصیرالدین طوسی
چکیده مقاله
در این مقاله، به بررسی عملکرد نسخه‌های مختلف مدل YOLO در پردازش تصاویر زیرآب با استفاده از امواج سونار پرداخته شده است. تشخیص اشیاء در این نوع تصاویر به دلیل ویژگی‌های خاص آن‌ها با چالش‌هایی همراه است که آن‌ها را از دیگر تصاویر متمایز می‌کند. در این تحقیق، از مدل‌های YOLO با نسخه‌های ۳، ۷ و ۸ استفاده شده است و همچنین، در نسخهYOLOv3 ، مقایسه‌ای بین backbone های MobilenetV2 و Resnet18 انجام گردیده است. برای پیاده‌سازی این مدل‌ها، از چارچوب‌های متن‌باز MMDetection (نسخه ۳.۰.۰) و MMYolo (نسخه ۰.۶.۰) استفاده شده است. مجموعه داده UATD برای مراحل آموزش و ارزیابی در نظر گرفته شده است. بهترین نتایج حاصل از مدل YOLOv8 بوده که بالاترین دقت ارزیابی را با مقادیر mAP=0.832 و mAR=0.537 به دست آورده است. دومین مدل با نتایج خوب و البته سرعت بالا مدل YOLOv3MobilenetV2 بوده است که دقت ارزیابی آن برابر mAP=0.802 و mAR=0.426 بوده است. ضعیف‌ترین عملکرد نیز متعلق به YOLOv7 می‌‎باشد.
کلیدواژه ها
تشخیص اشیاء زیر آب، تصاویر سونار، Yolo
وضعیت: پذیرفته شده