التاريخ الأكثر اكتمالا! على مدى السنوات المخزون CVPR أفضل ورقة (في 2000--2018 سنوات)

شبكة لى فنغ منظمة العفو الدولية تكنولوجي ريفيو: كما مؤتمرات القمة في رؤية الكمبيوتر، CVPR 2019 يتلقى نتائج الأوراق النهائية التي نشرت مؤخرا، اجتذب اهتمام وثيق للأكاديميين. وتفيد التقارير أنه CVPR 2019 تلقت هذا العام ما مجموعه 5165 ورقة صالحة المقدمة، والخروج النهائي من 1300 جويه يتلقون معدل القبول رقة من 25.2.

(تلقي قائمة ورقة: HTTP: //cvpr2019.thecvf.com/files/cvpr_2019_final_accept_list.txt)

بينما العلماء مناقشات لحظة كل وحدة مؤهلة للحصول على كمية من الورق، شبكة لى فنغ AI تقنية مراجعة كافة جمعت بعناية قائمة من أفضل الورق من 2000--2018 سنوات CVPR، لتحمل هذه الأوراق الهامة في مجال الكمبيوتر وقد تم استعراضها.

2018 أفضل ورقة

مهمة التعلم: التعلم مهمة فصل الهجرة

التعلم نقل تفكيك التشابك المهمة: Taskonomy

المحتوى الأساسي: وموضوع الرسالة رواية جدا، وهذا هو العلاقة بين المهام البحثية البصرية، والعلاقة التي يمكن استخلاصها بين المهام المختلفة القيام به لتعلم نقل مساعدة. هذا ويعرض الورقة "Taskonomy" - وهي طريقة تعتمد بالكامل على الحاسوب التي يمكن تحديد العلاقة بين عدد كبير من المهام الحاسوبية، اقترح هيكل موحد من بينها، وأعتبر بمثابة نموذج لدراسة الهجرة. الإعداد التجريبية، مؤلف حصلت أول مجموعة من ما مجموعه 26 المهام، بما في ذلك الدلالي، 2D، 2.5D، مهمة 3D، ثم قائمة المهام هذه 26 تم تدريبهم للقيام بهذه المهمة 26 الشبكات العصبية مهمة محددة. وأظهرت النتائج أن أداء هذه النماذج قد تم ترحيل والأداء المعيار الذهبي لشبكة مهمة محددة جيدة تقريبا. تقدم الورقة مجموعة من الأدوات لكشف وحساب هيكل تصنيف ذات الصلة، والذي يتضمن حلالا، ويمكن للمستخدم استخدامها لتصميم استراتيجية فعالة لحالات الاستخدام الرصد.

أوراق تحتوي على وصلة:

2017 أفضل ورقة

شبكة اتصالات كثيفة الإلتواء

شبكات التلافيف متصلة كثيفة

المحتوى الأساسي: وقد أثبتت الدراسات الحديثة وجود نزعة ذلك، إذا كان الاتصال بين أقرب الإدخال أو من إخراج طبقة شبكة التلافيف أقرب أقصر، يمكن أن تكون الشبكة بشكل كبير أعمق وأكثر دقة، وتدريب أكثر كفاءة. ورقة في هذا الاتجاه بحوث متعمقة، وطرحت كثيفة شبكة الإلتواء (DenseNet)، حيث كل طبقة وكل طبقة قبل القيام تغذية بعد اتصاله. للشبكة العصبية التلافيف التقليدية التي في كل طبقة وطبقة اتصال لاحق لشبكة طبقة L L جود اتصالات، في DenseNet، فإن العدد الإجمالي للإتصال مباشرة هو L (L + 1) / 2. لكل طبقة، ميزة تعيين جميع طبقات قبل وسوف تستخدم كل ذلك كمدخل والخاصة ميزة خريطة كطبقة مساهمة منه بعد كل شيء.

أوراق تحتوي على وصلة:

التعلم من محاكاة الصورة وغير خاضعة للرقابة من خلال التدريب على القتال

التعلم من مقلد وبدون اشراف الصور من خلال التدريب الخصومة

المحتوى الأساسي: مع التقدم في مجال الصورة والجدوى التدريب صورة نماذج التعلم آلة تستخدم لتوليد أكثر وأكثر، وإمكانات كبيرة لتجنب الصورة الحقيقية اليدوي الشرح. ومع ذلك، ويرجع ذلك إلى توزيع والصور الحقيقية الناتجة تختلف، مع الصورة الناتجة قد لا يتم تدريب تدريبية نموذجية مع أداء صورة حقيقية حتى جيدة. لتضييق الفجوة، وتقترح ورقة محاكاة + التعلم غير خاضعة للرقابة، حيث كانت المهمة هي معرفة نموذج، فمن الممكن لتحسين صحة بيانات الصورة ولدت محاكاة مع عدم وجود حقيقي ملحوظ، في حين أيضا تحفظات صورة معلومات التسمية جهاز محاكاة إنشاء. شيدت رقة مماثلة شبكة GANS العداء للقيام محاكاة + التعلم غير خاضعة للرقابة، ولكن شبكة إدخال الورق هي صورة بدلا من ناقلات عشوائي. من أجل الحفاظ على معلومات التسمية إلى عيوب الصور تجنب واستقرار عملية التدريب، الخوارزمية رقة GAN القياسية لعدة تغييرات رئيسية الموافق عناصر "تنظيم الذاتي"، والتشويه المترجمة خسارة المواجهة، والتماهي مع صورة محدثة من تجميل الماضي الجهاز.

أوراق تحتوي على وصلة:

2016 أفضل ورقة

دراسة متعمقة من التعرف على الصور المتبقية

ديب المتبقية التعلم من أجل التعرف على الصور

المحتوى الأساسي: وفقا لمبدأ الحالية، تريد تعزيز شبكة التدريب وأعمق العصبي أمر صعب للغاية. نقترح للحد من إطار التعلم المتبقية لعبء شبكة التدريب على طبيعة مستوى الشبكة لهذه الشبكة لاستخدام من أي وقت مضى أعمق. نحن بوضوح هذه الطبقات باعتبارها وظائف طبقة المدخلات المتبقية المتعلقة التعلم، بدلا من التعلم وظيفة غير معروفة. في الوقت نفسه، ونحن نقدم بيانات تجريبية شاملة، وهذه البيانات تظهر المتبقية تحسين شبكة أسهل، ويمكن أن تحسن بشكل كبير من دقة هذه الزيادة في العمق. نحن نستخدم طبقة 152 في ImageNet مجموعة البيانات - 8 مرات أعمق من عمق الشبكة لتقييم شبكة VGG المتبقية، لكنه لا يزال لديه منخفضة التعقيد. في ImageNet مجموعة الاختبار، وشبكة المتبقية الإجمالية تصل الخطأ 3.57. فازت نتيجة في عام 2015 أول مهمة التعرف البصري تصنيف التحدي على نطاق واسع. وبالإضافة إلى ذلك، ونحن نستخدم أيضا 100-1000 يحلل عمق طبقة من CIFAR-10.

بالنسبة لمعظم مهمة التعرف البصري، فإنه يشير إلى عمق مهم جدا. كما قال إلا أن عمق في COCO تحقق الكائنات البيانات، وحصلنا على التحسينات المتعلقة يقرب من 28 في المئة. عمق الشبكة المتبقية هو أساس تقديم جهدنا لILSVRC وCOCO2015 المنافسة، ولكن أيضا في مهام ImageNet التفتيش، ImageNet تحديد المواقع، وتجزئة كشف COCO COCO وغيرها من المجالات التي نحصل عليها الفوز الأول.

أوراق تحتوي على وصلة: الشبكي: //www.cv-foundation.org/openaccess/content_cvpr_2016/papers/He_Deep_Residual_Learning_CVPR_2016_paper.pdf

2015 أفضل ورقة

التكامل الحيوي: إعادة الإعمار في الوقت الحقيقي وتتبع المشهد غير جامدة

DynamicFusion: إنشاء وتتبع من مشاهد غير جامدة في الوقت الحقيقي

المحتوى الأساسي: ملزمة لعرض التجاري للاستشعار الأول لاستخلاص النتائج RGBD مسح، فإن النتائج في إعادة الإعمار في الوقت الحقيقي من تشوه SLAM نظام كثيفة غير جامدة من مكان الحادث. وتسمى هذه الطريقة لحظة DynamicFusion في إعادة بناء هندسة المشهد، في حين أن تقدير أيضا كثيفة حجم 6D مشاهد الحركة وفي الوقت الحقيقي نتيجة تقدير إلى الإطار. وKinectFusion نفسه، يمكن للنظام توليد المزيد والمزيد من دي الإشاعة، للحفاظ على التفاصيل بالتزامن مع إعادة بناء كاملة من مجموعة متنوعة من نتائج القياس، وعرض في الوقت الحقيقي من أحدث طراز. لأن هذا الأسلوب لا يتطلب أي قالب أو نموذج يستند على الساحة في الماضي، وذلك لأكثر من الأجسام المتحركة ومشاهد.

أوراق تحتوي على وصلة: https://rse-lab.cs.washington.edu/papers/dynamic-fusion-cvpr-2015.pdf

2014 أفضل ورقة

معلومات غير معروفة ثنائية الاتجاه دالة التوزيع الانعكاس، تكشف حركة الكاميرا ما

ما وجوه الحركة تكشف عن الشكل مع غير معروف BRDF والإضاءة

المحتوى الأساسي: يقترح المؤلفون نظرية عن حل الإضاءة مسافة غير معروفة وغير معروفة الانعكاس الخواص، وشكل من المشكلة المحددة جسم متحرك أو ما إذا كان الإسقاط المتعامد اختراق الإسقاط. ارتفعت نظرية إعادة الإعمار سطح أساسي حدود صلابة، بغض النظر عن طريقة وفقا ل. في سيناريوهات إسقاط المتعامدة، ثلاثة الحركة التفاضلية دون العد BRDF والضوء، يمكن أن تولد صورة مشتقة مع ربط شكل ثابتة. في سيناريو إسقاط المنظور، في مواجهة أربعة الحركة BRDF الظروف غير معروف الإضاءة التفاضلية وقد تكون ولدت على أساس التدرج الخطي من سطح القيد. وبالإضافة إلى ذلك، يصف الورقة أيضا الأدوات الدرجة طوبولوجيا إعادة الإعمار التي الثوابت.

وأخيرا، يستخلص الورق وسيلة لاستعادة صلابة العالمية الهرمية وتعقيد المشهد شكل الارتباط. من وجهة نظر النوعية للعرض، والتي هي ثابتة لإضاءة موحدة بسيطة من المعادلات التفاضلية الجزئية، والمعادلات لإضاءة معقدة غير موحدة. من بالمعنى الكمي، فإنه يشير إلى أن الإطار يتطلب الحد الأدنى من الحركات المزيد من مشكلة الاعتراف شكل للتعامل مع مشاهد أكثر تعقيدا. لنفترض على الأعمال السابقة للسطوع ثابت، أو كليهما Lambertian BRDF مصادر الضوء الاتجاه هو معروف، كان ينظر دائما كحالة خاصة من الطبقات. على استخدام البيانات الاصطناعية والحقيقية توضيح مزيد من كيفية إعادة الإعمار أفضل يمكن الاستفادة من هذه الأطر.

أوراق تحتوي على وصلة: https://cseweb.ucsd.edu/~ravir/differentialtheory.pdf

2013 أفضل ورقة

بسرعة، الكشف بدقة فئة الكائن 100000 على جهاز واحد

بسرعة، وكشف دقيق للفئات 100،000 كائن على آلة واحدة

المحتوى الأساسي: العديد من نظام الكشف عن وجوه من صورة الهدف مرشح الإلتواء ملزمة تقييد الوقت اللازم لهذه المرشحات ترميز الكائن الخارجي (على سبيل المثال، وجوه التجمع) من زوايا مختلفة. عن طريق تجزئة الحساسة محليا من هذا، والمنتج نقطة المشغل التفاف نواة استبدال مع عدد محدد من تحقيقات التجزئة، يمكن لهذه للكشف عن تجاهل حجم البنك التصفية، في الوقت المناسب، تصنف على نحو فعال جميع وردا على عينات.

من أجل إظهار فعالية هذه التقنية، والكتاب المقرر لتقييم 100،000، ونماذج تشوه، سيحتاج نموذج لاستخدام أكثر من واحد مليون مرشح وفقا لتعدد أبعاد الصورة المستهدفة، من خلال الحاجة إلى 20GB RAM في غضون 20 ثانية معالج متعدد النوى واحد لتحقيق هدف التقييم. وقد اظهرت النتائج أنه، مقارنة مع النظم الأخرى أداء التفاف التكوين نفس الجهاز، ويتم الحصول على نموذج بسرعة ما يقرب من 20،000 مرات - بناء على أمر من يساوي أربعة. في نموذج 100،000 متوسط دقة فئات الكائن صلت 0.16، ويرجع ذلك أساسا إلى التحديات في جمع البيانات والتدريب تنفيذ الأساسية، ونموذج الخريطة النهائية تحقيق 0.20 على الأقل ثلث الطبقة، والآخر في حوالي 20 خريطة تحقيق 0.30 أو أعلى على هذه الفئة.

أوراق تحتوي على وصلة: https://www.cv-foundation.org/openaccess/content_cvpr_2013/papers/Dean_Fast_Accurate_Detection_2013_CVPR_paper.pdf

2012 أفضل ورقة

لطريقة بسيطة على أساس النشاط تحلل بنية غير جامدة، دون بداهة

A بسيطة الطريقة مجانا السابقة لغير جامدة هيكل-من-الحركة التحليل للعوامل

المحتوى الأساسي: ويقترح المؤلفان بسيط "لا بداهة" نهج لحل حركة غير جامدة مشكلة هيكل عامل التحلل. بالإضافة إلى المادة رتبة أدنى الأساسية، لا يتطلب طريقة أي معرفة مسبقة عن المشهد غير جامدة أو حركة الكاميرا. وحتى مع ذلك، يبقى أن عملية مستقرة، وتحقيق أفضل النتائج، والتي لا تخضع للعديد من تقنية التحلل غير جامدة التقليدية - ضبابي (قضية أساس الغموض) المشاكل.

هذه الطريقة سهلة التنفيذ، ويمكن حلها تشمل صغيرة ذات حجم ثابت وSDP (SDP)، أو خطية الأقل الساحات القاعدة تتبع مشكلة الحد. وقد اظهرت النتائج أن هذه الطريقة أفضل من معظم غير جامدة طريقة الى عوامل الخطي التقليدي. هذه الرسالة ليس فقط توفر رؤى نظرية جديدة، مع توفير بنية غير جامدة مناسبة لعملية حل التحلل الرياضية كل يوم.

أوراق تحتوي على وصلة:

2011 أفضل ورقة

في الوقت الحقيقي للهيئة نموذج الاعتراف الموقف عمق واحد عضوا صورة

في الوقت الحقيقي بوز الإنسان الاعتراف في أجزاء من العمق الصور واحدة

المحتوى الأساسي: الكتاب اقتراح غير مرة بناء على المعلومات بسرعة ودقة التنبؤ الجسم المفاصل 3D موقف عمق من صورة واحدة. باستخدام طريقة التعرف على الأشياء وضعت بشكل غير مباشر يدل على جزء من الجسم، بدورها تشكل مشكلة تقدير صعوبة في الخريطة بسيط في تصنيف بكسل. على نفسه من خلال، مجموعة بيانات التدريب المتنوع الضخم، يمكن أن المصنف جعل، شكل الجسم والملابس والثوابت الأخرى المتوقعة لأجزاء من موقف الهيئة، ومن ثم العثور على طريقة الإسقاط المحلي من خلال نتائج إعادة التصنيف، وتولد في نهاية المطاف الجسم لديهم الثقة النمذجة 3D المشتركة.

لا يمكن للنظام تشغيل بسرعة 200 لقطة في الثانية في الأجهزة الاستهلاكية. يعرض النظام نتيجة تقييم الدقة تجهيز وتركيب الفعلي للمجموعة الاختبار، وتأثير هذا العديد من المعلمات التدريب. مقارنة مع الأعمال ذات الصلة، وتنفذ نموذج أكثر دقة المتقدمة، وأحرزت تقدما كبيرا في أقرب مباراة الهيكل العظمي الكامل.

أوراق تحتوي على وصلة: https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/BodyPartRecognition.pdf

2010 أفضل ورقة

باستخدام المعيار L1 قوية لفقدان البيانات بشكل فعال رتبة منخفضة مصفوفة تقريب حساب

احتساب كفاءة قوية منخفضة الرتبة مصفوفة التقريب في وجود فقدان البيانات باستخدام L1 نورم

المحتوى الأساسي: حساب انخفاض رتبة المصفوفة هو عملية قاعدة تقريبية في العديد من التطبيقات رؤية الكمبيوتر. وكان الحل الرئيسي لهذه المشاكل قيمة التحلل المفرد (المفرد قيمة التحلل). مرة واحدة في عداد المفقودين البيانات وجود القيم المتطرفة، لن تطبق الاسلوب، لسوء الحظ، فإننا كثيرا ما يواجهون هذا الوضع على أرض الواقع.

وتقترح هذه الورقة حساب رتبة أدنى تفكيك مصفوفة، وسوف تأخذ زمام المبادرة لتقليل L1 القاعدة مرة واحدة والبيانات المفقودة. هذا الأسلوب هو تمثيلية من خوارزمية يبيرج - واحدة من التحلل أكثر إقناعا في L2 القاعدة. يمكن أن تمتد إلى الفكرة الأساسية لهذه الطريقة يمكن تمييزها عن طريق استخدام إجراءات الخطية، مما يزيد من مشكلة تضم L1. وأظهرت النتائج أن الخوارزمية برامج التحسين القائمة يمكن أن تنفذ على نحو فعال الأطروحة المقترحة. تقدم ورقة، والنتائج الأولية مقنعة على أساس الاصطناعية وبيانات حقيقية.

أوراق تحتوي على وصلة: https://acvtech.files.wordpress.com/2010/06/robustl1_eriksson.pdf

2009 أفضل ورقة

قناة الظلام مسبق طريقة defogging

صورة واحدة بالضباب إزالة عن طريق قناة الظلام قبل

المحتوى الأساسي: وتقترح هذه الورقة طريقة بسيطة لكنها فعالة لdefogging صورة واحدة الظلام قناة الإدخال. قناة الظلام defogging قبل طريقة في الهواء الطلق هي تقنية إحصائية لالضباب صورة، والتي تقوم أساسا على الملاحظة الرئيسية - تضم التصحيح الأكثر المحليين صورة الضباب في الهواء الطلق بكسل، وكثافة هذه بكسل لديها لون واحد على الأقل توجيه في حالة انخفاض. باستخدام هذه الطريقة مسبقا التصوير نموذج الضباب، ضباب يمكننا تقدير مباشرة سمك من الصورة، حيث جودة الصورة لاستعادة دولة خالية من الضباب. الضباب عدم وضوح الصورة إلى مجموعة متنوعة من النتائج تظهر فعالية من الأسلوب السابق الورقة المقترحة. وبالإضافة إلى ذلك، يمكننا الحصول على خريطة العمق ذات جودة عالية من خلال هذا الأسلوب.

أوراق تحتوي على وصلة:

2008 أفضل ورقة

إعادة البناء من الدرجة الثانية منظور شامل سلس قبل

التعمير ستيريو العالمي بموجب الأمر الثاني النعومة رؤساء أديرة

المحتوى الأساسي: نعومة سطح 3D من الدرجة الثانية هي بداهة أكثر من نموذج سياق النظام السابق نموذجي. ومع ذلك، ليس على ما يرام تكون جنبا إلى جنب مع النظام الثاني بداهة الاستدلال خوارزمية على أساس عالمي (على سبيل المثال، وقطع نمط) من بين سلسة الثاني طريقة مسبق، لأن المطلوب التعبير توليد الثلاثي التجمع (لا الفرعي وحدة) الحل الأمثل لمن الصعب التعامل معها.

وهذا يدل على الصحيفة أن مجموعة الثلاثي للاستدلال يمكن الحصول على التحسين الفعال. وتقوم استراتيجية التحسين المقترحة من قبل المؤلفين على تمديد آخر ما توصل ، من الخوارزمية "QPBO". يتم تكرار هذه الاستراتيجية على الاندماج المقترح من أحدث التوسع QPBO خريطة العمق الخوارزمية. اقتراح لمصدر من الخريطة عمق لا تخضع لقيود، مثل يجوز تمديدها قبل طائرات موازية، أو عن طريق أي خوارزميات ستيريو الفعلية مع المعلمات. أثبتت النتيجة النهائية من صلاحية الدرجة الثانية القانون السابق وإطار استراتيجية التحسين.

أوراق تحتوي على وصلة:

ما وراء نافذة انزلاق: استخدام كفاءة الكائن تنفيذ البحث لتحديد المواقع نافذة فرعية

ما وراء انزلاق ويندوز: كائن التعريب التي كتبها كفاءة النافذة الفرعية البحث

المحتوى الأساسي: معظم أنظمة التعرف على وجوه فعالة تعتمد على تصنيف ثنائي، ولكن هذا الأسلوب يمكن أن تؤكد فقط وجود الكائن، ولكن لا يمكن أن توفر الوضع الفعلي للكائن. لتحقيق وظيفة الكائن تحديد المواقع، ويمكن أن نعتبر انزلاق أسلوب النافذة، ولكن هذا سيزيد من تكلفة الحسابية، لتقييم وظيفة يجب أن تصنف في عدد كبير من المرشحين نافذة فرعية.

ولهذه الغاية، يمكن أن يقدم ورقة بسيطة لكنها قوية وفرع مخطط ملزمة تعظيم فعالية فئات وظيفة المصنف في جميع الصور دون الممكنة. ويوفر الحل الأمثل بناء على برنامج التقارب العالمي في الزمن الخطي. وهذا يدل على الورقة كيف طريقة مناسبة للكشف عن وجوه مختلفة ومشاهد. ويسمح البرنامج لتحقيق تأثير تسارع SVMs مماثلة مساحة الهرم وجود الأساسية، أو إلى كائن وضع أقرب مسافة 2- مقرها في الماضي، وتعتبر هذه المصنفات عندما تكون سرعة بطيئة جدا المهام المتعلقة بعملية جار المصنف. البرنامج في UIUC جمع بيانات السيارة، باسكال VOC 2006 مجموعة البيانات وPASCAL VOC 2007 مسابقة حققت معظم النتائج المتقدمة.

أوراق تحتوي على وصلة: https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/34843.pdf

2007 أفضل ورقة

تتحرك دينامية المشهد ثلاثي الأبعاد أداة التحليل

دينامية 3D تحليل المشهد من مركبة متحركة

المحتوى الأساسي: وتقترح الورقة المشهد تقدير متكاملة التلقائي والهندسة، والكشف عن وجوه 2D، 3D تحديد المواقع، وتقدير مسار ونظام تتبع للمشهد ديناميكي الحركة أداة التحليل. مدخلات الوحيد هو يتم معايرة مصدر جهاز نظام ستيريو سقف السيارة. من هذه دفق الفيديو، وكنا قادرين على تقدير الوقت الحقيقي Structurefrom-الحركة (SFM) والهندسة مكان الحادث. وفي الوقت نفسه، حاولت الكتاب لأداء متعددة بغية / متعددة فئة الاعتراف الكائن إلى الكشف عن الكاميرا داخل السيارة والمشاة.

بواسطة الإدارة المستدامة للغابات نظام تحديد المواقع الذاتي، يمكننا تحويل الكشف عن الكائنات 2D إلى 3D التصوير، ومواصلة تتراكم في العالم الحقيقي نظام الإحداثيات. سوف 3D حدة تتبع ثم تحليل النتائج الملاحظة، ومن ثم العثور على مساحة يتفق مع مسار الزمكان المادي. وأخيرا، فإن المعايير الأمثل العالمية أن يكون الموضوع - وجوه التفاعل (التفاعل الكائن بين وجوه) بعين الاعتبار، من أجل الحصول على دقة تحديد المواقع 3D ومسار السيارات والمشاة توقع النتائج. أداء النظام يظهر ورقة متكاملة من حيث التحديات بيانات حقيقية في العالم، مجموعة تظهر بيانات منطقة حضرية مزدحمة من السيارات مع الوضع.

نظرية وصلات النص: https://homes.esat.kuleuven.be/~konijn/publications/2007/00483.pdf

2006 أفضل ورقة

مشهد منظور وضع كائنات تعيين

وضع الكائنات في المنظور

المحتوى الأساسي: صورة تفاهما لا تحتاج فقط إلى النظر في العناصر في العالم المرئي، تحتاج أيضا إلى النظر في التفاعل بين هذه العناصر. وتقترح هذه الورقة إطارا الكشف عن وجوه المحلي في سياق مشهد 3D، والتي تقوم أساسا على تفاعل إطار كائن، واتجاه سطح وجهة نظر الكاميرا.

ويعتبر معظم طريقة الكشف عن وجوه حجم ومكانة الصورة. بواسطة تقدير احتمال 3D الهندسة (بما في ذلك السطح والإحداثيات العالم)، يمكننا وضع كائن في طريقة عرض المنظور، وبالتالي تغيير حجم ووضع نماذج الصورة. في هذه الطريقة، يفترض الكائن إلى صقل احتمال الهندسي، حيث وتيرة المشكلة، والعكس بالعكس. يسمح الإطار أي كشف الكائن "الألم" بدلا من ذلك، وسهلة ليتم توسيع نطاقها لتشمل جوانب أخرى، بما في ذلك فهم الصورة. النتيجة النهائية تؤكد مزايا النهج المتكامل.

أوراق تحتوي على وصلة:

2005 أفضل ورقة

كشف في الوقت الحقيقي من سطح غير جامدة

في الوقت الحقيقي غير جامدة السطحية كشف

المحتوى الأساسي: وتقترح الورقة دون أي علم مسبق، في الوقت الحقيقي الكشف عن طريقة تشوه السطح. يبدأ الأسلوب من مجموعة واسعة من نقاط خط الأساس، لا تشوه مطابقة بين صورة الجسم والصورة الكشف عنها. هذا مطابقة يمكن استخدامها للكشف عن فحسب، ولكن أيضا يمكن أن تستخدم لحساب التعيين المحدد بين النقاط. الخوارزمية في مواجهة تشويه خطير، والتغيرات الخفيفة، الضبابية وقوية عند انسداد. تشغيله بسرعة 10 لقطة في الثانية الواحدة عند 2.8 غيغاهرتز على جهاز الكمبيوتر، وفقا لمقدم البلاغ أن نفهم، ولكن هناك تقنيات أخرى لتحقيق نتائج مماثلة.

شبكة تشوه مع التصميم الجيد لوبين مقدر ملزمة، التي هي قادرة على معالجة نموذج سطح تشوه قد تنطوي على عدد من المعلمات، والحصول على ما يصل إلى 95 أساسيا لتجنب معدل مباراة كاذبة يفوق بكثير الاحتياجات الفعلية .

أوراق تحتوي على وصلة: https://infoscience.epfl.ch/record/128408/files/PiletLF05.pdf

2004 أفضل ورقة

مجموعة برمجة الصورة باستخدام المجهر الالكتروني خلقت

التصوير برمجة باستخدام صفيف Micromirror الرقمية

المحتوى الأساسي: تقدم هذه الورقة مفهوم نظام التصوير برمجة. يوفر نظام التصوير طريقة السيطرة على قياس الإشعاع النظام والخصائص الهندسية للنظام البصري الإنسان أو. كان يتحقق من خلال مجموعة micromirror برمجة هذه المرونة قادرة على تحقيقه. نحن يمكن التحكم بدقة عالية على اتجاه مجموعة من مساحة تحكم والوقت، حتى يتسنى للنظام يمكن اختيار بمرونة والتضمين الخفيفة اعتمادا على التطبيق.

التنفيذ الناجح لنظام التصوير بناء على برمجة جهاز micromirror الرقمية (DMD) لمعالجة الضوء الرقمية. على الرغم من أن جهاز مرآة يمكن وضعها في واحدة من العدسات اثنين، ولكن أظهرت النتائج أن نظام التصوير يمكن تحقيق وظائف مختلفة، بما في ذلك مجموعة التصوير عالية ديناميكية، والكشف عن ميزة والتعرف على الأشياء. في يناقش الورقة النهائية كيف في مجال الرؤية من السيطرة دون استخدام أجزاء متحركة، واستخدام مجموعة مرآة صغيرة.

أوراق تحتوي على وصلة: https://www.researchgate.net/publication/4082198_Programmable_imaging_using_a_digital_micromirror_array

2003 أفضل ورقة

استخدام التعلم غير خاضعة للرقابة على نطاق ومستقل لتحقيق تحديد نوع الكائن

الاعتراض الاعتراف الدرجة التي كتبها بدون اشراف مقياس-قسما ثابتا التعلم

المحتوى الأساسي: وتقترح الورقة غير المسماة وسيلة من قبل على نطاق ثابتة (مقياس بطريقة ثابتة)، غير مقطع التعلم المشهد تشوش وطريقة التعرف على نماذج فئة الكائن. وعلى غرار هذه الكائنات على شكل سلسلة من عضو ومرونة. يستخدم التمثيل احتمالي لجميع جوانب التعرف على الأشياء، بما في ذلك الشكل والمظهر، والارتفاع النسبي للتغطية. ويستخدم للكشف عن ميزة أساس الكون ونسبة من مساحة الصورة لاختيار. في هذه العملية، ونموذج الكائن تقدر المعلمات نموذج ثابتة الحجم، يتم توفير ذلك عن طريق الحد الأقصى لاحتمال (الإعداد كحد أقصى احتمال) في تعظيم التوقعات (توقع-تعظيم) لإكمال. ويستند هذا النموذج على النظرية الافتراضية طريقة تصنيف الصور. من خلال سلسلة من القيود الهندسية (مثل الوجه، سيارة)، وكائن مرن (مثل الحيوانات) النتائج الممتازة التي تحققت على مجموعة البيانات يدل على مرونة نموذج.

أوراق تحتوي على وصلة: https://cs.nyu.edu/~fergus/papers/fergus03.pdf

2001 أفضل ورقة

فيديو، نموذج ثلاثي الأبعاد للتشويه

نماذج Morphable 3D من الفيديو

المحتوى الأساسي: وتعتبر حركة غير جامدة 2D التدفق الضوئي وهيكل 3D وجود مشكلة في مجال التحلل الموترة. بواسطة صاخبة طريقة تحويل تآلفي، كل من هذه المشاكل التي يمكن أن تصبح غير جامدة تكوين هيكل القوة، وبالتالي استخدام منظم حل أساليب تفكيك مصفوفة. ومع ذلك، فإن الضوضاء صورة وعيب البيانات يسبب لا يمكن أن تنشأ شرطا أساسيا لطريقة الى عوامل. وحتى مع ذلك، ما زلنا يمكن، القيد القاعدة وقيم الكثافة لحل هاتين المشكلتين صنف القيد، وبالتالي خلق حالة عدم اليقين لSVD، عدم اليقين، إلى عوامل غير جامدة وحلول جديدة فضاء جزئي تيارات الخفيفة. قد تكون حصلت أخيرا خوارزمية التكامل لإعادة الإعمار 3D وتتبع سطح غير جامدة وجود الملمس غرامة، مثل وجود جزء سطح أملس. "فيديو العثور على" من خلال مزيج من مواد ذات دقة منخفضة، ويمكن لهذه الطرق تعطي نتائج جيدة وتتبع وإعادة الإعمار 3D.

أوراق تحتوي على وصلة:

2000 أفضل ورقة

استخدام المتوسط الحسابي التحول تتبع في الوقت الحقيقي من الكائنات غير جامدة

في الوقت الحقيقي تتبع الأجسام غير الصلبة باستخدام التحول المتوسط الحسابي

المحتوى الأساسي: وتقترح الورقة طريقة جديدة لتتبع في الوقت الحقيقي من الكائنات غير جامدة من تحريك الكاميرا. وحدة الحوسبة المركزية يحسب المواقع المحتملة على أساس التحول يعني في الإطار الحالي والهدف. الفرق بين النموذج الهدف (توزيع اللون) والمرشح الهدف ممثلة في معامل باتاشاريا. طريقة النظري ليظهر التحليل أن ذلك يرتبط ارتباطا وثيقا مع إطار النظرية الافتراضية، مع توفير حلول عملية وسريعة وفعالة. تظهر النتائج للتعددية تسلسل الصور، التي تظهر طريقة لتتبع في الوقت الحقيقي، وانسداد جزئي، فوضى والقدرة على إحداث تغيير كبير في النسبة المستهدفة.

أوراق تحتوي على وصلة:

شبكة لى فنغ AI تكنولوجي ريفيو

"الشرطي العراب" الموت رينغو لام، من الأنهار والبحيرات لم تعد "الوضع"

سامسونج غالاكسي Note9 الكامل تفكيك الشكل خبز، يتم ترك S القلم خارج

"صوت نداء مجنون": لمحة داخل هذا القليل مخبأة

ومن "3.15" عين إلكترونية البرد السجائر بعد، مرة في السوق: الأوائل متجر صغير الركود الأعمال

الشكل (6) أن تعلن جيل جديد من MG: تغييرات كبيرة مماثلة لجراحة التجميل

يتم تضمين الهواء الأردن 1 منتج واحد الكلاسيكية في نفوسهم؟ ! هذا المحل محدود مهزوم أنت يضيء على الاطلاق!

على الرغم من أن الصين هي أكبر سوق للسيارات في العالم، ولكن بعض السيارات نشتري الحياة والموت

وي الايجابيات معلقة مفتوحة لأن الله كان غاضبا حتى يعود AO فرجينيا، العضو: LGD يسعى البطريرك حفظه!

تجدد حرب رئيس تنغ! متعدد فلاش أو تتطلب من المستخدم لتعديل اللقب بسبب الحظر، أكثر من تينسنت فلاش Pengci أو متعجرف؟

ستة البيانات إلى الأمام! SKT خمسة على التوالي الاستيلاء فاكر لا يزال الطريق، العضو: الأخ بالأسى لي

شانيل س س فاريل أديداس NMD جاهزة للبيع، جنبا إلى جنب مع التعرض الأحذية الأخرى!

تشونغ Chuxi التعرض قصة شبح النمذجة، تشانغ باى التمهيد فيلم جديد؛ يانغ مي ليو Kaiwei الطلاق | الترفيه ديك المادي