تعزيز تقنيات
Enhancing Object Detection Techniques Through Transfer Learning and Pre-trained Models
Asst-Lecturer \ Ashwaq Katham Mtashre*1, Asst-Lecturer \ Dhakaa Mohsin Kareem2, Asst-Lecturer \ Zainab Abd Al-Abbas Muhsen3
1 College of Health and Medical Technologies Kufa | Al-Furat Al-Awsat Technical University | Iraq
2 Technical Institute Suwaira |Middle Technical University | Iraq
3 Babylon Technical Institute | AL-Furat Al-Awsat University | Iraq
Abstract: This study aims to enhance object detection systems by comparing pre-trained classification models with custom-trained ones, focusing on task-based deep learning for image recognition. The problem addressed is the challenge of accurately detecting and classifying objects in complex environments where traditional recognition systems may fall short. The proposed solution leverages transfer learning utilizing pre-trained models like ResNet or VGGNet as feature extractors.
By exploiting the convolutional layers of these models, the system captures common features for specific detection tasks. Experimental analyses on benchmark datasets confirm the efficacy of this approach, demonstrating improved detection accuracy and efficiency in various scenarios. Specifically, FasterRCNN achieves a mean Average Precision (mAP) of 78% on synthetic datasets and 74% on real datasets at an Intersection over Union (IoU) threshold of 0.5. This indicates FasterRCNN’s superior performance in terms of accuracy, making it a strong candidate for applications requiring high detection accuracy.
Keywords: pre-trained models, VGG, ResNet, Deep Learning. convolutional neural networks, convolutional neural networks.
تعزيز تقنيات الكشف عن الأشياء من خلال نقل التعلم والنماذج المدربة مسبقًا
المدرس المساعد / اشواق كاظم مطشر*1, المدرس المساعد / ذكاء محسن كريم2, المدرس المساعد / زينب عبد العباس محسن3
1 كلية التقنيات الصحية والطبية / كوفة | جامعة الفرات الأوسط التقنية | العراق
2 معهد الصويرة التقني | الجامعة التقنية الوسطى | العراق
3 المعهد التقني بابل | جامعة الفرات الأوسط | العراق
المستخلص: تهدف هذه الدراسة إلى تعزيز أنظمة الكشف عن الكائنات من خلال مقارنة نماذج التصنيف المدربة مسبقًا بنماذج مدربة خصيصًا، مع التركيز على التعلم العميق القائم على المهام للتعرف على الصور. المشكلة التي تم تناولها هي التحدي المتمثل في الكشف الدقيق عن الأشياء وتصنيفها في بيئات معقدة، حيث قد تقصر أنظمة التعرف التقليدية. الحل المقترح يعزز نقل التعلم،
وذلك باستخدام نماذج مدربة مسبقًا مثل ResNet أو VGGNet كمستخلصات للميزات. من خلال استغلال الطبقات التلافيفية لهذه النماذج، يلتقط النظام السمات المشتركة لمهام الكشف المحددة. أكدت التحليلات التجريبية على مجموعات البيانات المعيارية فعالية هذا النهج، حيث أظهرت دقة وكفاءة الكشف المحسنة في سيناريوهات مختلفة
. حقق FasterRCNN على مجموعات البيانات الاصطناعية متوسط دقة 78% و 74%على مجموعات البيانات الحقيقية عند عتبة Intersection over Union (IoU) تبلغ 0.5. وهذا يدل على الأداء المتفوق لـ FasterRCNN من حيث الدقة، مما يجعله مرشحًا قويًا للتطبيقات التي تتطلب دقة كشف عالية.
الكلمات المفتاحية: نماذج مدربة مسبقا ، فغ ، رينيت ، التعلم العميق. الشبكات العصبية التلافيفية ، الشبكات العصبية التلافيفية.