52 التعلم العميق أوراق ملخص هدف نموذج الكشف، وشفرة المصدر متاحة

المصدر: منظمة العفو الدولية Youdao

هذه المقالة حول 2000 كلمة القراءة الموصى بها 5 دقائق

يعطي هذا المقال تلخيص 52 نموذج العميق كشف التعلم.

العلامات: الحاسوب الرؤية

الكشف عن الهدف كفرع هام من رؤية الكمبيوتر، وتحسنت بشكل ملحوظ في السنوات الأخيرة مع نظرية الشبكات العصبية ومتعمقة السلطة حساب الأجهزة GPU، أصبح العالم الذكاء الاصطناعي الساخن البحوث، وهبطت المشروع هو أيضا أول من يبدأ.

طوال 2013-2020، من أقرب R-CNN، في وقت لاحق OverFeat SSD، YOLO V3 ثم العام الماضي M2Det، تيار لانهائي من النماذج الجديدة، والأداء هو الحصول على أفضل وأفضل! وهذه الورقة تلخيص 52 الأداء الكامل المقارنة هدف نموذج الكشف للغاية، بما في ذلك قائمة كاملة من المستندات الورقية.

أول هذه النقطة، التي أدرجت 52 نموذج الكشف عن الهدف (جمع موصى به):

وكشف الأهداف على ملخص كامل لمسار التقنية من مشروع المعروفة على جيثب، والمؤلف هو خريج الهندسة الكهربائية وهندسة الكمبيوتر من جامعة سيول الوطنية لي hoseong، الآن تحصد نجوم 7.3k.

عناوين المشروع هي:

https://github.com/hoya012/deep_learning_object_detection

تشغيل طريق التقنية من خلال جدول زمني هي 2013 إلى أوائل عام 2020، يلخص الرقم الكشف عن الهدف خلالها عن نماذج تمثيلية. تآمر الجزء الأحمر مهم نسبيا، فإنه من المهم أن النموذج الرئيسي.

تحديث السجل

ومن الجدير بالذكر أن الحجر الأحمر في وقت مبكر من بداية العام الماضي أصدرت وثيقة أن يوصي حول هذا المشروع، كما تم تحديث المؤلف في فبراير 2020، عملية تحديث رئيسية مما يلي:

  • 2019.2: تحديث 3 ورقات
  • 2019.3: تحديث التخطيط وربط رمز
  • 2019.4: تحديث ICLR 2019 وCVPR 2019 ورقة
  • 2019.5: تحديث CVPR 2019 ورقة
  • 2019.6: تحديث CVPR 2019 أوراق أطروحة ومجموعات البيانات
  • 2019.7: تحديث BMVC 2019 الورق وبعض الورق ICCV 2019
  • 2019.9: تحديث NeurIPS 2019 ورقة ورقة ICCV 2019
  • 2019.11: AAAI 2020 تحديث بعض الأوراق وغيرها من الأوراق
  • 2020.1: تحديث ICLR 2020 أوراق وصحف أخرى

التفاصيل التالية!

جدول مقارنة الأداء النموذجي

منذ أجهزة مختلفة (على سبيل المثال، وحدة المعالجة المركزية، GPU، RAM، الخ)، وغالبا ما لا يكفي دقيقة لمقارنة FPS. مقارنة طريقة أكثر ملاءمة لقياس أداء جميع النماذج في تكوين الأجهزة نفسها. نتائج المقارنة أداء كل نموذج أعلاه هي كما يلي:

من الجدول أعلاه، يمكننا أن نرى بوضوح نماذج مختلفة في VOC07، VOC12، والأداء على مجموعة البيانات COCO، كما يسرد أوراق نموذج نشرت المصادر.

وفيما يلي بعض أبرز ملحوظ نموذج الأحمر لفترة وجيزة.

أوراق أوراق نموذجية

2014

R-CNN

التسلسلات الهرمية ميزة الغنية للكشف عن وجوه دقيقة وتجزئة الدلالي |

ورقة:

https://arxiv.org/pdf/1311.2524.pdf

الرمز الرسمي كافيه:

https://github.com/rbgirshick/rcnn

OverFeat

OverFeat: المتكاملة الاعتراف، الأقلمة وكشف باستخدام التلافيف الشبكات |

ورقة:

https://arxiv.org/pdf/1312.6229.pdf

كود الرسمية الشعلة:

https://github.com/sermanet/OverFeat

2015

سريع R-CNN

سريع R-CNN |

ورقة:

https://arxiv.org/pdf/1504.08083.pdf

الرمز الرسمي كافيه:

https://github.com/rbgirshick/fast-rcnn

أسرع R-CNN

أسرع R-CNN: نحو الكشف عن الكائنات في الوقت الحقيقي مع شبكات اقتراح منطقة |

ورقة:

https://papers.nips.cc/paper/5638-faster-r-cnn-towards-real-time-object-detection-with-region-proposal-networks.pdf

الرمز الرسمي كافيه:

https://github.com/rbgirshick/py-faster-rcnn

مدونة غير رسمية tensorflow:

https://github.com/endernewton/tf-faster-rcnn

مدونة غير رسمية pytorch:

https://github.com/jwyang/faster-rcnn.pytorch

2016

OHEM

على أساس المنطقة التدريب كائن كشف لها أون لاين الصلب مثال التعدين |

ورقة:

https://arxiv.org/pdf/1604.03540.pdf

الرمز الرسمي كافيه:

https://github.com/abhi2610/ohem

YOLO V1

كنت انظر فقط مرة واحدة: الموحدة، في الوقت الحقيقي كائن كشف |

ورقة:

https://arxiv.org/pdf/1506.02640.pdf

كود الرسمية ج:

https://pjreddie.com/darknet/yolo/

SSD

SSD: طلقة واحدة MULTIBOX الكاشف |

ورقة:

https://arxiv.org/pdf/1512.02325.pdf

الرمز الرسمي كافيه:

https://github.com/weiliu89/caffe/tree/ssd

مدونة غير رسمية tensorflow:

https://github.com/balancap/SSD-Tensorflow

مدونة غير رسمية pytorch:

https://github.com/amdegroot/ssd.pytorch

R-FCN

R-FCN: كائن كشف عبر شبكات التلافيف على أساس المنطقة بالكامل |

ورقة:

https://arxiv.org/pdf/1605.06409.pdf

الرمز الرسمي كافيه:

https://github.com/daijifeng001/R-FCN

كود غير رسمي كافيه:

https://github.com/YuwenXiong/py-R-FCN

2017

YOLO V2

YOLO9000: أفضل وأسرع وأقوى |

ورقة:

https://arxiv.org/pdf/1612.08242.pdf

كود الرسمية ج:

https://pjreddie.com/darknet/yolo/

كود غير رسمي كافيه:

https://github.com/quhezheng/caffe_yolo_v2

مدونة غير رسمية tensorflow:

https://github.com/nilboy/tensorflow-yolo

مدونة غير رسمية tensorflow:

https://github.com/sualab/object-detection-yolov2

مدونة غير رسمية pytorch:

https://github.com/longcw/yolo2-pytorch

FPN

شبكات الهرم ميزة للكشف عن وجوه |

ورقة:

كود غير رسمي كافيه:

https://github.com/unsky/FPN

RetinaNet

فقدان التنسيق للكشف عن وجوه الكثيفة |

ورقة:

https://arxiv.org/pdf/1708.02002.pdf

كود مسؤول keras:

https://github.com/fizyr/keras-retinanet

مدونة غير رسمية pytorch:

https://github.com/kuangliu/pytorch-retinanet

مدونة غير رسمية mxnet:

https://github.com/unsky/RetinaNet

مدونة غير رسمية tensorflow:

https://github.com/tensorflow/tpu/tree/master/models/official/retinanet

قناع R-CNN

قناع R-CNN |

ورقة:

كود مسؤول caffe2:

https://github.com/facebookresearch/Detectron

مدونة غير رسمية tensorflow:

https://github.com/matterport/Mask_RCNN

مدونة غير رسمية tensorflow:

https://github.com/CharlesShang/FastMaskRCNN

مدونة غير رسمية pytorch:

https://github.com/multimodallearning/pytorch-mask-rcnn

2018

YOLO V3

YOLOv3: تزايدي تحسين |

ورقة:

https://pjreddie.com/media/files/papers/YOLOv3.pdf

كود الرسمية ج:

https://pjreddie.com/darknet/yolo/

مدونة غير رسمية pytorch:

https://github.com/ayooshkathuria/pytorch-yolo-v3

مدونة غير رسمية pytorch:

https://github.com/eriklindernoren/PyTorch-YOLOv3

مدونة غير رسمية keras:

https://github.com/qqwweee/keras-yolo3

مدونة غير رسمية tensorflow:

https://github.com/mystic123/tensorflow-yolo-v3

RefineDet

واحد شوت صقل الشبكة العصبية للكشف عن وجوه |

ورقة:

الرمز الرسمي كافيه:

https://github.com/sfzhang15/RefineDet

كود غير رسمي chainer:

https://github.com/fukatani/RefineDet_chainer

مدونة غير رسمية pytorch:

https://github.com/lzx1413/PytorchSSD

2019

M2Det

M2Det: كائن طلقة واحدة-A الكاشف على أساس متعدد المستويات ميزة الشبكة الهرم |

ورقة:

https://arxiv.org/pdf/1811.04533.pdf

كود مسؤول pytorch:

https://github.com/qijiezhao/M2Det

2020

ارتفاعه-YOLO

ارتفاعه-YOLO: ارتفاعه الشبكة العصبية لفي الوقت الحقيقي كائن كشف |

ورقة:

https://arxiv.org/pdf/1903.06530.pdf

أوراق أطروحة بيانات

في الوقت نفسه أيضا هو مدرج أعلاه مجموعات البيانات نموذج الإفصاح شيوعا: VOC، ILSVRC، COCO، كما هو مبين في الجدول التالي:

مقالات البيانات ذات الصلة المحددة للكشف عن الهدف على النحو التالي:

هذه هي يصف ملخص التعلم العميق 52 نموذج الكشف. يمكن القول المشروع أنه في السنوات الأخيرة إلى نموذج الكشف عن الهدف يلخص بشكل جيد، بما في ذلك الأوراق وشفرة المصدر. أريد أن مساعدة!

تحرير: لتانغ كاي

تم التعليق بواسطة: لين يي لين

- انتهى -

تسينغهوا الانتباه - بيانات أكاديمية تشينغداو للعلوم قناة الصغرى الرسمية منصة الجمهور " بيانات الإرسال THU  "أيتها الأخوات ولا". إرسال البيانات THU  "لرعاية المزيد من المحاضرات ونوعية المحتوى.

نموذج AI هزيمة 12 نوعا من الغش، وقتل جميع أنواع GAN وDeepfake

أساسيات التعلم العميق - وظائف التنشيط ومتى يتم استخدامها؟ (مع الرمز)

كبير التعلم الشبكة العصبية، وحدة المعالجة المركزية وراء V100 GPU، تعتمد في الواقع على تجزئة؟

0.052 ثواني المفتوحة 100GB البيانات؟ تحليل البيانات بيثون مكتبة مفتوحة المصدر تفعل

دليل: شجرة القرار الحساسة من حيث التكلفة للتصنيف غير المتوازن (مع الكود والرابط)

تحت هذا الوباء، فإن أعداد الأزمة الاقتصادية في المسار العضوية

"الصغيرة عينة التعلم (التعلم قليل شوت)" 2020 ورقات ورمز

أصدرت منظمة OpenKG الدفعة الثانية من العهد الجديد عشرة والمعرفة أكثر حداثة أطلس قواعد البيانات المفتوحة

العزلة جناح جولات الروبوت القادمة! تسينغهوا إلى الوراء

سباق الكمبري Kechuang متن أول AI الأسهم رقاقة: أكاديمية الصينية للعلوم حاضنة، تأسست أربع سنوات بقيمة 17.5 مليار

يجب أن تكون على بينة من الأسلحة وباء الحجب - انترنت الطبية

"الحرب" الطاعون "متى" ليس وجها لوجه مقابلة مع العالم أقرب ووهان