المصدر: منظمة العفو الدولية Youdao
هذه المقالة حول 2000 كلمة القراءة الموصى بها 5 دقائق
يعطي هذا المقال تلخيص 52 نموذج العميق كشف التعلم.العلامات: الحاسوب الرؤية
الكشف عن الهدف كفرع هام من رؤية الكمبيوتر، وتحسنت بشكل ملحوظ في السنوات الأخيرة مع نظرية الشبكات العصبية ومتعمقة السلطة حساب الأجهزة GPU، أصبح العالم الذكاء الاصطناعي الساخن البحوث، وهبطت المشروع هو أيضا أول من يبدأ.
طوال 2013-2020، من أقرب R-CNN، في وقت لاحق OverFeat SSD، YOLO V3 ثم العام الماضي M2Det، تيار لانهائي من النماذج الجديدة، والأداء هو الحصول على أفضل وأفضل! وهذه الورقة تلخيص 52 الأداء الكامل المقارنة هدف نموذج الكشف للغاية، بما في ذلك قائمة كاملة من المستندات الورقية.
أول هذه النقطة، التي أدرجت 52 نموذج الكشف عن الهدف (جمع موصى به):
وكشف الأهداف على ملخص كامل لمسار التقنية من مشروع المعروفة على جيثب، والمؤلف هو خريج الهندسة الكهربائية وهندسة الكمبيوتر من جامعة سيول الوطنية لي hoseong، الآن تحصد نجوم 7.3k.
عناوين المشروع هي:
https://github.com/hoya012/deep_learning_object_detection
تشغيل طريق التقنية من خلال جدول زمني هي 2013 إلى أوائل عام 2020، يلخص الرقم الكشف عن الهدف خلالها عن نماذج تمثيلية. تآمر الجزء الأحمر مهم نسبيا، فإنه من المهم أن النموذج الرئيسي.
تحديث السجل
ومن الجدير بالذكر أن الحجر الأحمر في وقت مبكر من بداية العام الماضي أصدرت وثيقة أن يوصي حول هذا المشروع، كما تم تحديث المؤلف في فبراير 2020، عملية تحديث رئيسية مما يلي:
- 2019.2: تحديث 3 ورقات
- 2019.3: تحديث التخطيط وربط رمز
- 2019.4: تحديث ICLR 2019 وCVPR 2019 ورقة
- 2019.5: تحديث CVPR 2019 ورقة
- 2019.6: تحديث CVPR 2019 أوراق أطروحة ومجموعات البيانات
- 2019.7: تحديث BMVC 2019 الورق وبعض الورق ICCV 2019
- 2019.9: تحديث NeurIPS 2019 ورقة ورقة ICCV 2019
- 2019.11: AAAI 2020 تحديث بعض الأوراق وغيرها من الأوراق
- 2020.1: تحديث ICLR 2020 أوراق وصحف أخرى
التفاصيل التالية!
جدول مقارنة الأداء النموذجي
منذ أجهزة مختلفة (على سبيل المثال، وحدة المعالجة المركزية، GPU، RAM، الخ)، وغالبا ما لا يكفي دقيقة لمقارنة FPS. مقارنة طريقة أكثر ملاءمة لقياس أداء جميع النماذج في تكوين الأجهزة نفسها. نتائج المقارنة أداء كل نموذج أعلاه هي كما يلي:
من الجدول أعلاه، يمكننا أن نرى بوضوح نماذج مختلفة في VOC07، VOC12، والأداء على مجموعة البيانات COCO، كما يسرد أوراق نموذج نشرت المصادر.
وفيما يلي بعض أبرز ملحوظ نموذج الأحمر لفترة وجيزة.
أوراق أوراق نموذجية
2014
R-CNN
التسلسلات الهرمية ميزة الغنية للكشف عن وجوه دقيقة وتجزئة الدلالي |
ورقة:
https://arxiv.org/pdf/1311.2524.pdf
الرمز الرسمي كافيه:
https://github.com/rbgirshick/rcnn
OverFeat
OverFeat: المتكاملة الاعتراف، الأقلمة وكشف باستخدام التلافيف الشبكات |
ورقة:
https://arxiv.org/pdf/1312.6229.pdf
كود الرسمية الشعلة:
https://github.com/sermanet/OverFeat
2015
سريع R-CNN
سريع R-CNN |
ورقة:
https://arxiv.org/pdf/1504.08083.pdf
الرمز الرسمي كافيه:
https://github.com/rbgirshick/fast-rcnn
أسرع R-CNN
أسرع R-CNN: نحو الكشف عن الكائنات في الوقت الحقيقي مع شبكات اقتراح منطقة |
ورقة:
https://papers.nips.cc/paper/5638-faster-r-cnn-towards-real-time-object-detection-with-region-proposal-networks.pdf
الرمز الرسمي كافيه:
https://github.com/rbgirshick/py-faster-rcnn
مدونة غير رسمية tensorflow:
https://github.com/endernewton/tf-faster-rcnn
مدونة غير رسمية pytorch:
https://github.com/jwyang/faster-rcnn.pytorch
2016
OHEM
على أساس المنطقة التدريب كائن كشف لها أون لاين الصلب مثال التعدين |
ورقة:
https://arxiv.org/pdf/1604.03540.pdf
الرمز الرسمي كافيه:
https://github.com/abhi2610/ohem
YOLO V1
كنت انظر فقط مرة واحدة: الموحدة، في الوقت الحقيقي كائن كشف |
ورقة:
https://arxiv.org/pdf/1506.02640.pdf
كود الرسمية ج:
https://pjreddie.com/darknet/yolo/
SSD
SSD: طلقة واحدة MULTIBOX الكاشف |
ورقة:
https://arxiv.org/pdf/1512.02325.pdf
الرمز الرسمي كافيه:
https://github.com/weiliu89/caffe/tree/ssd
مدونة غير رسمية tensorflow:
https://github.com/balancap/SSD-Tensorflow
مدونة غير رسمية pytorch:
https://github.com/amdegroot/ssd.pytorch
R-FCN
R-FCN: كائن كشف عبر شبكات التلافيف على أساس المنطقة بالكامل |
ورقة:
https://arxiv.org/pdf/1605.06409.pdf
الرمز الرسمي كافيه:
https://github.com/daijifeng001/R-FCN
كود غير رسمي كافيه:
https://github.com/YuwenXiong/py-R-FCN
2017
YOLO V2
YOLO9000: أفضل وأسرع وأقوى |
ورقة:
https://arxiv.org/pdf/1612.08242.pdf
كود الرسمية ج:
https://pjreddie.com/darknet/yolo/
كود غير رسمي كافيه:
https://github.com/quhezheng/caffe_yolo_v2
مدونة غير رسمية tensorflow:
https://github.com/nilboy/tensorflow-yolo
مدونة غير رسمية tensorflow:
https://github.com/sualab/object-detection-yolov2
مدونة غير رسمية pytorch:
https://github.com/longcw/yolo2-pytorch
FPN
شبكات الهرم ميزة للكشف عن وجوه |
ورقة:
كود غير رسمي كافيه:
https://github.com/unsky/FPN
RetinaNet
فقدان التنسيق للكشف عن وجوه الكثيفة |
ورقة:
https://arxiv.org/pdf/1708.02002.pdf
كود مسؤول keras:
https://github.com/fizyr/keras-retinanet
مدونة غير رسمية pytorch:
https://github.com/kuangliu/pytorch-retinanet
مدونة غير رسمية mxnet:
https://github.com/unsky/RetinaNet
مدونة غير رسمية tensorflow:
https://github.com/tensorflow/tpu/tree/master/models/official/retinanet
قناع R-CNN
قناع R-CNN |
ورقة:
كود مسؤول caffe2:
https://github.com/facebookresearch/Detectron
مدونة غير رسمية tensorflow:
https://github.com/matterport/Mask_RCNN
مدونة غير رسمية tensorflow:
https://github.com/CharlesShang/FastMaskRCNN
مدونة غير رسمية pytorch:
https://github.com/multimodallearning/pytorch-mask-rcnn
2018
YOLO V3
YOLOv3: تزايدي تحسين |
ورقة:
https://pjreddie.com/media/files/papers/YOLOv3.pdf
كود الرسمية ج:
https://pjreddie.com/darknet/yolo/
مدونة غير رسمية pytorch:
https://github.com/ayooshkathuria/pytorch-yolo-v3
مدونة غير رسمية pytorch:
https://github.com/eriklindernoren/PyTorch-YOLOv3
مدونة غير رسمية keras:
https://github.com/qqwweee/keras-yolo3
مدونة غير رسمية tensorflow:
https://github.com/mystic123/tensorflow-yolo-v3
RefineDet
واحد شوت صقل الشبكة العصبية للكشف عن وجوه |
ورقة:
الرمز الرسمي كافيه:
https://github.com/sfzhang15/RefineDet
كود غير رسمي chainer:
https://github.com/fukatani/RefineDet_chainer
مدونة غير رسمية pytorch:
https://github.com/lzx1413/PytorchSSD
2019
M2Det
M2Det: كائن طلقة واحدة-A الكاشف على أساس متعدد المستويات ميزة الشبكة الهرم |
ورقة:
https://arxiv.org/pdf/1811.04533.pdf
كود مسؤول pytorch:
https://github.com/qijiezhao/M2Det
2020
ارتفاعه-YOLO
ارتفاعه-YOLO: ارتفاعه الشبكة العصبية لفي الوقت الحقيقي كائن كشف |
ورقة:
https://arxiv.org/pdf/1903.06530.pdf
أوراق أطروحة بيانات
في الوقت نفسه أيضا هو مدرج أعلاه مجموعات البيانات نموذج الإفصاح شيوعا: VOC، ILSVRC، COCO، كما هو مبين في الجدول التالي:
مقالات البيانات ذات الصلة المحددة للكشف عن الهدف على النحو التالي:
هذه هي يصف ملخص التعلم العميق 52 نموذج الكشف. يمكن القول المشروع أنه في السنوات الأخيرة إلى نموذج الكشف عن الهدف يلخص بشكل جيد، بما في ذلك الأوراق وشفرة المصدر. أريد أن مساعدة!
تحرير: لتانغ كاي
تم التعليق بواسطة: لين يي لين
- انتهى -
تسينغهوا الانتباه - بيانات أكاديمية تشينغداو للعلوم قناة الصغرى الرسمية منصة الجمهور " بيانات الإرسال THU "أيتها الأخوات ولا". إرسال البيانات THU "لرعاية المزيد من المحاضرات ونوعية المحتوى.