CVPR مقالات أضواء كاشفة: صفر سبيل المثال عندما تعلم شبكة البيانات لقاء

مذكرة لى فنغ شبكة AI تقنية مراجعة: هذه المادة من قبل قوة البقر ما بعد الدكتوراه الجامعة الأمريكية رايس AI تكنولوجي ريفيو عرضت المقالات الحصرية، ولا يجوز استنساخها دون إذن.

تصنيف الحبيبات غرامة مشكلة صعبة للغاية من المشاكل دون تصنيف. والتقليدي تصنيف الحبيبات الخشنة من مختلف التصنيفات الحبيبات غرامة لا يميز بين فئات مختلفة، ولكن التمييز بين الفئات التالية من فئات فرعية، مثل أنواع مختلفة من القطط. بسبب الخلافات بين مختلف فئات فرعية هي صغيرة جدا، لذلك الحبيبات غرامة أكبر تصنيف من تصنيف الحبيبات الخشنة صعوبة. وبالإضافة إلى ذلك، وجمع التدريب البيانات هو مهمة صعبة للغاية بالنسبة للغرامة الحبيبات، وذلك للأسباب التالية.

لأول مرة، وعدد كبير من الفئات الفرعية تميل إلى أن تكون الطبقة التالية. ووفقا للاحصاءات، 14000 نوعا من الطيور في العالم، من الصعب جمع بيانات التدريب كافية لكل نوع من الطيور. ثانيا، كتسمية فرعية تتطلب معرفة متخصصة. مثل وصفها أنواع مختلفة من الطيور تحتاج إلى معرفة تفاصيل محددة لكل نوع من الطيور، مثل الفم، وأجنحة، ولون شكل الذيل وهلم جرا. معظم الناس ليس لديهم هذه الخبرة، بذلك المتخصصين الحبيبات غرامة ملحوظ نادرة.

لأن جمع بيانات التدريب الصعب الحبيبات غرامة، متجهة للغاية أن يكون هناك الكثير من فئة فرعية لا تتوافق مع بيانات التدريب. في حالة عدم وجود تدريب البيانات من نوع ما، القائمة تركز البحث على مجالين: أولا، ضعف الرقابة من جمع البيانات، والتسمية هي بيانات غير دقيقة ، مثل الوصول من الإنترنت مجانا ولكن البيانات التسمية صاخبة (أشرف webly التعلم). ثانيا، مع فئات الدلالي للمعلومات، لم يتم وضع علامة نقل المعرفة من علامات أنواع البيانات لهذا النوع من البيانات، التعلم من الأمثلة مثل صفر (صفر التعلم شوت). ومع ذلك، ودراسات هذين المجالين لها سلبياتها الخاصة. على وجه التحديد، يتأثر التعلم القائم على شبكة الإنترنت عن طريق توزيع الاختلافات في البيانات بين التسمية وتدريب شبكة الضجيج والبيانات اختبار، ولكن سوء الأداء والتعلم الصفر من الأمثلة تجاهل كمية كبيرة من بيانات الشبكة متاحة بحرية. وبناء على الملاحظات الواردة أعلاه، ونحن نحاول معرفة البيانات على شبكة الإنترنت والصفر أمثلة التعلم الجمع بين لجعل تصنيف الحبيبات غرامة، والعمل نشرت في CVPR 2018 (دائرة الضوء): "الإشراف Webly التعلم يلتقي صفر شوت التعلم: نهج الهجين لغرامة الحبيبات تصنيف ".

نهجنا يلي، أولا تحديد جزء من فئة فرعية اليدوية العلامات، ثم الصور تحميلها من الإنترنت إلى بقية فرعية. للراحة من الوصف، وصفت فرعية تسمى فرعية الشرح، واستخدام الشبكة الصورة فرعية تسمى فرعية الشبكة يدويا. فرعية الشرح وشبكة فرعية تشكل كل من الفئات الفرعية. وذكرت بيانات الشبكة قبل أن تكون هناك مشكلة الفروق في توزيع البيانات الضوضاء والتسمية، وليس هناك من الشرح اليدوي فرعية هاتين المسألتين. من أجل حل مشكلتين تستند شبكات التعلم، وسيلتنا للفئات الدلالي المعلومات ونقل المعرفة من فئة فرعية الشرح إلى فئة فرعية الشبكة. معلومات الدلالي وهناك العديد من الفئات، بما في ذلك ميزة (سمة) وكلمة ناقلات (كلمة ناقلات) وما شابه ذلك. لأن الخصائص المطلوبة وصفها الخبراء، من الصعب الحصول عليها، لذلك نستخدم الويكي النص الحر تعلمت كلمة النواقل.

يتكون لدينا أسلوب الرسم البياني التالي، فئة معينة، نقوم بجمع دقيقة فرعية الشرح بيانات الشرح اليدوي، لشبكة المتبقية فرعية تحميل الصور من شبكة الإنترنت، ومن ثم الحصول على كلمة ناقلات جميع الفئات الفرعية. مع ناقلات كلمة، أنشأنا علاقة بين العلامة والفئات الفرعية شبكة فرعية، سوف يهاجر من فئة فرعية الشرح المعرفة لفئة فرعية الشبكة، من أجل حل التسمية الضوضاء وتوزيع البيانات شبكات فرعية التناقضات موجودة. كما استخدمنا اختبار صورة بدون تسميات في مرحلة التدريب، وتستخدم الشبكة لتقليل الاختلافات في تدريب الصور والصور الاختبار على توزيع البيانات. في الختام، لدينا نموذج الدراسة لجميع الفئات الفرعية للناقلات كلمة والفئات الفرعية الشرح، فرعية والخصائص البصرية للصور اختبار الشبكة كمدخل، صورة الأنواع اختبار الإخراج.

الخطوة الأولى: تعلم القاموس فرعية الشرح إلى (القاموس)

نصل الى تعلم القائم على القاموس القياسية شرح القاموس فرعية.

الخطوة الثانية: نقل المعرفة من الشبكة الشرح فرعية إلى فئة فرعية فئة فرعية تستخدم لحل مشاكل الشبكة

في التعبير أعلاه، فإن مصطلح الأول هو القاموس القياسي للتعلم، بحيث فرعية الثانية ومقرها القاموس وضع العلامات، وبناء القاموس شبكة مقربة فرعية، وهذا هو، ونقل فرعية الشرح المعرفة لفئة فرعية الشبكة، أول ثلاثة المطلوب مصفوفة كلمة ناقلات على مجموعة الاختبار مرتبة متدنية، وناقلات كلمة من نفس الفئة الفرعية كصورة اختبار يجب أن تكون مماثلة لبعضها البعض، ونظرا لرابع أوزان مختلفة في شبكة المدربين لإعادة الضيقة بيانات الصورة المرجح الوسط وشبكة المسافة بين مركز بيانات الاختبار، والتي هي للحد من الخلافات في الصورة والشبكة الصورة الاختبار على توزيع البيانات، والخامس هو نفس الوزن لحل مشكلة تسميات الضوضاء، علما بأن نستخدمها لاسو المجموعة تصنيف فقدان مصفوفة أجبرت الصفوف متفرق، وهو التصنيف الإلزامي لبعض الصورة شبكة من خسارة صغيرة. هذه التصنيفات خسارة صغيرة من الصورة شبكة يتوافق مع صورة دقيقة عن التسمية، فإن الوزن المقابلة ستكون أكبر، لأنها أكثر أهمية لتدريب المصنف قوي. في نفس الوقت، واضاف لدينا قيود الوزن، على أمل العثور الأمثل الأوزان، والتسمية يمكن اختيارها من توزيع اختبار صورة وصورة دقيقة لشبكة أقرب في ضيق المكان البحث. يمكن حل المشاكل المذكورة أعلاه بطريقة بالتناوب، والذي هو ثابت المتغيرات الأخرى، حل متغير واحد المتبقية. من خلال حل هذه المشاكل، يمكننا الحصول على بيانات المتجه اختبار كلمة. وأخيرا، فإن ناقلات كلمة كلمة ناقلات وفئة فرعية اختبار بيانات الاختبار للمقارنة، يمكننا الحصول على بيانات فرعية بطاقة الاختبار.

في الجزء التجريبي، استخدمنا مثال على التعلم الصفر تستخدم عادة ثلاث قواعد: كوبا، SUN والكلاب. لكل قاعدة بيانات، وجدنا فرعية (فئات رأيت)، وفئة فرعية التسمية، والفئات الفرعية رقم (فئات الغيب)، وشبكة فرعية والفئات الفرعية الاختبار. التعلم الصفر وأمثلة من والفرق هو أننا لم الشبكة الفئة الفرعية تحميل الصور من فليكر، توفر بيانات التدريب التي هي ضعف الرقابة ليست فرعية. لذلك يمكن رؤية لدينا نموذج التعلم كمثال على التعلم الصفر تحت إشراف ضعيف، والتعلم غير خاضعة للرقابة أو ضعيفة فرعية إضافية. هنا وضع التجريبية لدينا، والنتائج التجريبية. قارنا طريقة لاستخدام الفئات الفرعية الوحيدة شبكة (فئات فرعية على شبكة الإنترنت)، واستخدام ملحوظ فرعية فقط (الفئات الفرعية المسمى) الأسلوب، مزيج بسيط من الاثنين معا. وأظهرت النتائج أن نهجنا مقارنة البيانات المستندة إلى شبكة التعلم والتعلم الصفر من الأمثلة من مزيج بسيط، وأثر تحقيق تحسن كبير، كما تبين أن يستخدم في نقل المعرفة من فئة فرعية الشرح إلى فئة فرعية شبكة لحل الشبكة الحالية من مشكلة بيانات التدريب وسيلة فعالة.

بالإضافة إلى التحليل الكمي، ونحن نقدم أيضا بعض التحليل النوعي. في الخطوة الثانية نتذكر نموذج التعلم، قمنا تعيين أوزان مختلفة للصور التدريب الشبكة، حدد التسمية المطلوبة واختبار صورة دقيقة من شبكة التوزيع أقرب إلى الصورة. بعد ذلك، نحصل على الكلاب قاعدة بيانات على سبيل المثال، تحديد الحد الأقصى والحد الأدنى أوزان بعض الصور من الصورة التدريب شبكة (نضع يتم تعيين مجموعة الوزن في ). من هذا الرقم يمكن أن ينظر في منطقتنا عالية الترجيح طريقة اختيار الصور هي العلامات دقيقة، والكائن الاحتلال الغالبية العظمى من المنطقة الوسطى من الصورة، والتي تثبت أيضا فعالية نهجنا من زاوية أخرى. لمزيد من التفاصيل، يرجى الرجوع إلى ورقة

200،000 مشترك SUV، وهذا بالتأكيد 4 سخونة بيع!

"المعاصرة والت ديزني" ترك ديزني! انضم جون لاسيتر الرسوم المتحركة السماء الرقص

في الشوط الرئيسي الأول على التوالى بانخفاض 400 يوان الخصم، بالإضافة إلى الرفوف الانظار على 6T السوق المحلية!

تفسير المجتمع الحكمة هاير: ظهور حياة أفضل

مير: أتذكر عندما كنت خارجا من هذه القطعة لا تقدر بثمن من المعدات، خاصة التنين حلقة ما هو نوع؟

شراء شراء شراء | حزام تستخدم بشكل جيد، شقيقة الوقوف عليه!

تحولت أولا أي تشويق لكن الثانية إلى أن تكون ......: أحدث تصنيفات جديدة اكسبرس

ضمن 200000 الذي هو الأكثر شراء قيمتها؟ وCR-V دليل جديد للمقارنة

"أربعة الربيع" الدهون "لحظة دافئة" فتح تجميع في قطعة والإفراج دافئ يستمر لتسخين

ومن المتوقع للطي شاشة الهاتف سامسونج للافراج عن بعد يومين، ولكن أكملت المصنعين المحليين العرض الأول في العالم!

مير: حريق الأسطوري لسنوات عديدة، لماذا هو دائم؟ كامل من الذكريات

زيادة معدل أربع سيارات الدفع الرباعي المدهش أوصى لشراء سيارة لا يمكن تحمل تكاليف السكن