CVPR18 أفضل ورقة العرض: الروابط بين مهمة البحث هي أن تتعلم أن تفعل الحق في الهجرة الموقف

لى فنغ شبكة AI تقنية مراجعة من قبل: CVPR 2018 أفضل ورقة من هذا العام "Taskonomy: التعلم نقل تفكيك التشابك العمل" (التعلم مهمة: فصل دراسة الهجرة مهمة) درست موضوع جديد جدا، وهذا هو دراسة العلاقة بين مهمة البصرية، المستمدة من العلاقة يمكن أن تساعد في جعل التعلم للهجرة بين المهام المختلفة. مقارنة مع الدراسة كنا نبحث عن مجموعة متنوعة من المهام Shuafen، فإن هذه الورقة يمكن وصفها بأنها موجة الربيع مجال الرؤية الحاسوبية.

لى فنغ شبكة AI تقنية مراجعة تغطية حية خلال CVPR 2018 كما وسائل الإعلام فقط المعتمدة، كما حضر للاستماع إلى عرض حي لهذه الورقة. المتحدث هو المؤلف الأول من الورقة أمير R. زامير، كان زميل ما بعد الدكتوراه في جامعة ستانفورد وبيركلي UC. عندما كان في ذلك الوقت من القراءة أيضا مع ورقة الدكتور "الهيكلية، RNN: ديب التعلم على المكانية والزمانية الرسوم البيانية" ( CVPR 2016 حصل على جائزة أفضل ورقة الطالب.

وفيما يلي النص الكامل لخطاب للاستماع إلى الترجمة من الرسم.

أمير R. زامير: مرحبا صباح الجميع، وأنا أعرض ورقتنا "Taskonomy: تفكيك التشابك العمل التعلم نقل"، وهذا هو أطروحتي الكسندر ساكس، وليام شين، ليونيداس Guibas، جيتندرا مالك وسيلفيو سافيريس معا لإكمال.

علينا أولا طرح السؤال، ما هي العلاقة بين مهمة بصرية؟ أو أنهم مستقلون. على سبيل المثال، وعمق بين تقديرات سطح طبيعية والتوقعات، أو التعرف على الأشياء والتعرف على التصميم الداخلي، هناك ما تفعله. نعتقد أن الجواب نعم، هل هو من مساعدة من بعض حدسنا أو المعرفة. على سبيل المثال، ونحن نعلم سطح النماذج العادية التنبؤية، ونماذج تنبؤية، أو عمق من طراز الاعتراف كائن تخطيط الداخلية التي يمكن أن تحقق أي مساعدة صغيرة. لذا هو بالتأكيد هناك علاقة بين عدد من المهام.

وذلك ما تأثير لديك هذه العلاقات؟ ما هو الدور الذي يلتفتون ذلك؟ هذا هو ما أريد أن أقول للجميع اليوم.

أريد أن أعرض هذه النقاط الأربع:

  • العلاقة بين العمل هناك

  • ويمكن حساب هذه العلاقات عن طريق الحصول عليها، نحن لسنا بحاجة للمشاركة بصفة المعرفة الإنسانية

  • وهناك مجموعة متنوعة من المهام التي تنتمي إلى الهيكل المكاني، وليس بعض مفهوم مستقل

  • ويوفر نموذج موحد لدراسة الهجرة بالنسبة لنا

فقط أرني مثال واحد فقط من العديد من المهام البصرية عدة. اختياريا بعض المهام التي يمكننا أن نطرح هذا السؤال: هل هناك علاقة بينهما، ليس هناك الكثير للقيام به. للإجابة على هذه الأسئلة، ونحن نريد العلاقة بين المهام، والتكرار بين المهام لديهم فهم العالمية، ونحن بحاجة الى ان ننظر في هذه المهمة بصفة جماعية، بدلا من أن تكون المهام الفردية واحدة. نحن نستخدم العلاقة بينهما والتكرار لتحقيق أعلى كفاءة.

هناك مثيرة جدا للاهتمام كفاءة تحسين قيمتها هو رصد كفاءة ما نريد مع بيانات أقل المسمى لحل المشكلة، ونحن نركز فإن هذه الدراسة ستكون هنا. وناقش العديد من الأوراق البحثية وكيفية الحد من الطلب على العلامات نموذج البيانات، والآن هناك التعلم تحت إشراف الذاتي، والتعلم غير خاضعة للرقابة، الفوقية التعلم، وصقل للقيام على أساس أساليب التكيف المهمة، وكذلك في ImageNet الميزات المستفادة، الآن أصبح كل ذلك من الممارسات العرفية.

في الواقع، والسبب لدراسة الهجرة غير مجدية لأن هذه العلاقات بين المهام. يتحدث من مستوى عال من التجريد، اذا كنا نستطيع الهجرة أو ترجم الحالة الداخلية نموذجا المستفادة، التي يمكن أن تعلم حل المهام الأخرى للمساعدة - إذا كان هناك علاقة بين هذه المهام الكلمتين. واسمحوا لي أن أوضح هذا الجزء.

إلى السطح مهمة التنبؤ العادية (السطح العادي)، على سبيل المثال، قمنا بتدريب الطبيعي أن الطائرة من الشبكة العصبية في صورة التنبؤ، ويبدو أن تأثير جيد. إذا لم نستخدم سوى 2 من بيانات التدريب لتدريب الشبكة، وسوف تحصل على هذه النتيجة الزاوية اليسرى السفلى، من الواضح أننا يمكن تخمين النتائج ستكون سيئة للغاية.

ثم فعلنا الهجرة من اثنين من المهام الأخرى، صورة المصلح (reshading) وتقطيع الصورة (تجزئة) نموذج. عندما يتم تدريب الهجرة أن تفعل الشيء نفسه مع 2 فقط من البيانات على نسخة شبكة صغيرة.

يمكن أن ينظر إليه بعد أداء تقطيع الصورة الهجرة نموذج ليست جيدة، ولكن على سطح الطبيعي صورة نموذج الأداء التنبؤي إصلاح جيدة. وهذا يدل على أن العلاقة من تقسيم صورة وصورة يعيدون سطح طبيعية بين سطح طبيعية وعلاقة توقع بين تنبأ أقوى وأكثر ارتباطا وثيقا. حدسي هذا معقول جدا، وسوف نفعل ذلك المشهد، فمن وإعادة تنظيم لديهم الكثير من اتصال مع طبيعتها إلى الطائرة، التناقض بين تجزئة العادية والتنبؤية، وأنا لا يمكن التفكير في ما ستكون عليه العلاقة ، قد يكون حقا القيام به حيال ذلك. لذلك، لاحظنا أن ترتبط لهذه المهمة لبعضها البعض، كل ما نحتاجه هو القليل اضافية معلومات يمكن أن تساعد في نموذج مهمة لحل مهمة أخرى.

إذا كان لديك بعض الطرق لتحقيق الكثير للعلاقة بين أي مهمة معينة لقياس، يمكننا الحصول على صورة كاملة للهيكل. هذا ما يمكننا أن نتطلع إلى هذا النوع من فهم من التكرار نافذة العالمي بين المهام المختلفة. على سبيل المثال، يمكن أن تستفيد من التكرار بين المهام ذكرنا سابقا حل سلسلة من مهمة التعلم تحت الإشراف، يمكنك فقط وضع قليلا من مهمة الموارد القديمة من الهجرة إلى مهمة جديدة، أو حل مهمة جديدة، ونحن تقريبا لم يكن لديك هذا المهام المطلوبة البيانات التسمية. وحتى الآن تعلم حل مهمة جديدة يصبح لإضافة بعض المحتوى إلى الهيكل الأصلي، دون الحاجة إلى البدء من نقطة الصفر.

هذا هو موقفنا "Taskonomy" الأغراض، وهي طريقة تعتمد بالكامل على الحاسوب التي يمكن تحديد العلاقة بين عدد كبير من المهام الحاسوبية، اقترح هيكل موحد من بينها، وأعتبر بمثابة نموذج لدراسة الهجرة. ونحن نسميها "Taskonomy"، وهذا هو، تعيين المهمة والجمع بين taxonomony التصنيف من كلمتين، هو من المفترض أن تعلم نقطة التصنيفية نظر استراتيجية الترحيل.

على وجه التحديد، أننا نفعل ذلك. أولا، نجد مجموعة من ما مجموعه 26 المهام، بما في ذلك الدلالي، 2D، 2.5D، والمهام 3D. ونحن لم تختر أكثر شمولا وتفصيلا مجموعة متنوعة من المهام البصرية، مجموعة من هذه العينات ولكن علينا أن نظهر الأساليب المستخدمة، في وقت لاحق وسوف يأتي مرة أخرى لاختيار قائمة المهام المشتركة في العملية الحسابية. جمعنا حوالي 4 ملايين الصور من البنود في الأماكن المغلقة، ثم كل صورة هي أن كل من 26 نوعا من المهام القيام به لإعداد. هذه الصور كلها حقيقية، وليس ولدت، لمهمة البصرية 3D، ونحن نستخدم هيكل جهاز استشعار بصري بفحص بنية المشهد الداخلي المقابلة، حتى نتمكن من الحصول على أكثر سهولة القيم الحقيقية لهذه المهام.

نحن المقبل تم تدريب الشبكة العصبية 26 قائمة المهام مهمة محددة من هذه المهام 26، هذه الشاشات هي الناتج من المهام 26. المهام 3D مثل انحناء التوقعات والمهام الدلالي مثل التعرف على وجوه، وهناك بعض المهام الإشراف الذاتي، مثل تلوين.

لدينا نموذج التعلم مهمة ديه أربع خطوات رئيسية، فإن الخطوة الأولى هي لتدريب هذه المهام 26 شبكة خاصة، ومن ثم قفل الوزن إلى أسفل، وهذا الوقت كل مهمة لديها شبكة العصبية المخصصة للالتدريبية.

الخطوة التالية هي تحديد العلاقة بين المهام المختلفة. على سبيل المثال، لحساب تقديرات انحناء العادية وتقدر العلاقة بين، على سبيل المثال، فإننا تأمين نموذج تقدير الوزن العادي تدريب نسخة صغيرة من هذا النموذج، هذه المحاولات نموذج صغير لحساب انحناء من توصيف المقدرة للنموذج العادي. ثم نقيم أداء نماذج صغيرة مع بيانات الاختبار الجديد. ويستند هذا التقييم على أداء محددة من هذه العلاقة المباشرة بين اثنين من المهام الهجرة.

حسنا، تتضمن القائمة 26 بعثات، أي ما مجموعه 26 25 مجموعات في الطريقة التي نؤدي بها كل هذا التدريب والتقييم. وأدى ذلك إلى هيكل كامل الرسم البياني مهمة نريد. ومع ذلك، يحتاج القيم بين العقد أيضا إلى أن تكون موحدة، لأن هذه المهام هي ملك للفضاء إخراج مختلف لكل منهما، وهناك خصائص رياضية مختلفة. للحصول على وصف العلاقات، نجد تكوين كامل الجوار مصفوفة (الجوار المصفوفة) هذا، فإن النتائج يمكن رؤيتها بوضوح الأمر الذي يلعب دورا حاسما في المصفوفة. والسبب هو لأن هذه المهام موجودة في الفضاء الانتاج المختلفة، ونحن بحاجة إلى القيام التوحيد.

ونحن لم يسمى أسلوب مصفوفة موحدة عملية التحليل الهرمي (تحليلية Hiererchical Proess) طريقة ترتيبي. هنا أنا لن صفها بالتفصيل، ولكن ببساطة، نختار واحدة من عدة طرق من النظام، لأنه بالمقارنة مع بعض طريقة أخرى للتحليل، فمن المفترض أن الطبيعة الرياضية للإخراج لجعل الفضاء بالنسبة لنا أمر بالغ الأهمية. التفاصيل يمكن العثور عليها في ورقتنا.

لذلك، هذا الهيكل الرسم البياني الكامل تم كميا تماما، فإن المهمة لمدة تتراوح بين زوج واحد، قيمتها الهجرة المهمة التابعة. ومن الجدير بالذكر أنه لا أي اثنين من الهجرة بين المهام مفيدة، وهناك العديد من العلاقات بين المهام ضعيفة. ولكن بالطبع هناك بعض علاقة قوية جدا، ولكن هناك بعض أنماط واضحة.

نحن نريد أن تنسحب من هذه العلاقة متفرق من بناء مخطط كامل. بالنسبة لنا، لا يمكن للهيكل استخراج تساعد زيادة أداء المهمة الأصلية لدينا، ويخبرنا عن كيفية اختيار أفضل مصدر لمهام وظيفة جديدة، المهام التي يمكن ترحيل إلى مصدر إلى العديد من المهام، وكيفية ترحيل مهمة جديدة إلى قائمة المهام لا يتضمن ما يصل.

في هذه الخطوة القيام به هو مجرد إضفاء الطابع الرسمي نحن كخيار رسم بياني ثانوي. حددنا قائمة المهام، والمهمة التي تمثلها عقدة الرمادية وقد رأينا سابقا، لا ينظر إلى المهمة الجديدة في العقد الحمراء. ثم وضعنا بعض القيود، FIG الأمثل تحسب بطريقة ثنائي دون الاستخراج. يمكننا أن نرى تفاصيل الحساب من الورق أو ملصق، واضحة إلى حد ما.

أعطت النتائج التي تم الحصول عليها عن طريق استخراج subgraphs منا يريد أن يحل الربط اللازمة لكل مهمة، بما في ذلك المهام الجديدة، وكيفية استخدام الموارد المحدودة، لا يتجاوز حدود المعرفة من قبل المستخدم من الموارد لتحقيق أقصى قدر من أداء كل مهمة، و كمية الموارد قائمة المهام المعرفة أيضا يحدد فعلا كم مهمة مصدر العلبة. هذا هو هدفنا.

(تكنولوجي ريفيو شبكة AI لى فنغ ملاحظة: هناك ورقة أخرى مخطط العملية برمتها أدناه)

نقطة أخرى ليس لدي الوقت لبدء التحدث الهجرة المهمة العليا هي اثنين أو أكثر من المهام التي يمكن أن تستخدم تكاليف مهمة المصدر والمورد، وتحسب في إطار معا لدينا. حسنا، في الواقع كان أكبر بكثير مما لدينا مصفوفة الجوار من 26 25، لأن الوضع هناك العديد من واحد.

وقال التالية حول النتائج. لقوائم المهام 26 بعثات، أي ما مجموعه 3000 شبكة الهجرة المهمة، فإنه قضى 47829 ساعة من الوقت GPU. تدريب نموذج ربما يكلفنا 470 مليون $. أخذت الهجرة التدريب بيانات التدريب نموذج 1 فقط من الشبكات مهمة محددة.

وهذا مثال لنتائج تصنيف الوظائف. يتم تضمين هذا المثال قلت سابقا، هذه المهام 26، منها أربعة الهدف من هذه المهمة، وهذا يعني أنهم قليل جدا من البيانات، ونسخ البيانات الهجرة مجرد شبكة التدريب بما فيه الكفاية، ولكن ليس من التدريب الصفر شبكة جديدة. سوف تحقق من هذه المهام الربط بشكل حدسي يشعر هو الأمر كذلك، هناك صلات تشابه أقوى، وكذلك 2D و 3D المهام بين أدنى من المهام 3D وغيرها من المهام.

من أجل تقييم فعالية استراتيجية الترحيل لدينا، فإننا نقترح مؤشرين التقييم، وكسب والجودة النوعية. يشير كسبا للهجرة أداء الشبكة، مقارنة مع نفس كمية صغيرة من البيانات من الفوز الصفر التدريب الأداء؛ الشكل أعمق الأزرق يشير إلى وجود نسبة أعلى الفوز، وهذا هو القول تأثير الهجرة هو دائما أفضل. تشير جودة إلى الهجرة من الفوز في كل شبكة البيانات بالمقارنة مع مهمة تدريب شبكة خاصة، يمكننا أن نرى أن في كثير من الحالات هو الأبيض، أن أداء هذه النماذج قد تم ترحيل والشبكات مهمة محددة كمعيار الذهب الأداء أفضل تقريبا.

هذا هو مجرد مثال على التصنيف، ويمكنك كتابة التنفيذ الخاص بك، ولكن أفضل طريقة هي محاولة لدينا API على الانترنت في الوقت الحقيقي، taskonomy.vision/api، قد ترغب في تعيين المعلمات الخاصة بهم، وعرض التصنيف مهمة النتائج النوعية والكمية. ومن الجدير بالذكر أن نتائج التصنيف لدينا هي مناسبة للاستخدام مع ملامح ImageNet، كما هو الحال في الوقت الراهن الميزات الأكثر استخداما لل. كما فعلنا بعض التجارب وImageNet ذات الصلة، أرحب لرؤية أوراقنا.

وخلاصة القول:

  • ونحن ندرك مساحة مهمة البصري نحو الهدف اتخذت خطوة إيجابية؛

  • نكلف باعتباره مجموعة الفضاء منظم، بدلا من أن يكون مفهوم الفردية واحد لنظرة، وهنا يقوم هذا المخطط على العلاقة الكمية تعادل.

  • هذا هو محسوب تماما من الإطار؛

  • ويمكن أن تساعدنا على تعلم أن تفعل الهجرة، فإنه يمكن أن تساعدنا على إيجاد تصور مشترك للنموذج.

زيارة موقعنا على الانترنت ثم يمكنك أن ترى أيضا إدخال الفيديو يوتيوب. شكرا لك!

(النهاية)

في الواقع على موقع لديها ثروة من العروض البحوث والموارد، في الوقت الحقيقي العرض التجريبي، وتطويعه لمهمة الحوسبة API، والتصور من عملية الترحيل، قبل تدريبية نموذجية، مثل مجموعة من البيانات ليتم تحميلها والذوق. نفس كما يقول الكاتب، تريد المزيد من المعلومات يمكن قراءة الأوراق الأصلية وزيارة موقعه على الانترنت.

أوراق العنوان: http: //taskonomy.stanford.edu/taskonomy_CVPR2018.pdf

تقارير لى فنغ شبكة AI تقنية الاستعراض. المزيد AI الأكاديمية البقاء محتوى ضبطها.

استثمرت 5.0 مليار $ في جميع أنحاء العالم! طموحات مايكروسوفت في مجال تقنيات عمليات في وقت مبكر

اسمحوا لي أن اختيار سيارة نيابة عن لكزس، سأختار LC500h

هناك الموسيقى، والتلفزيون من قبل، بعد الدخن تشغل الهواتف، إعلانات مجانية المحتلة إلى حيلة جديدة!

القطب التكنولوجيا، باير، في المناطق الريفية بابا تاوباو التي تم اطلاقها "مخطط مزرعة المستقبل"

قطيعة مع التقليد والتمتع جودة الصوت يشي نظام المسرح النمل لخلق تجربة مشاهدة

جدي من أجل البقاء في معظم الأحداث المأساوية ولدت؟ "زوج من الأرجل" انتزاع الاضواء جميع المسابقات كأس مصير!

تحذير محاولة! سوف جمع قيمة من DMP حزمة AJ13 / 14 يكون رسميا على بيع هذا الاسبوع

بيانات الاختبار يخبرك: أيهما أفضل مع 205/55 R16 الإطارات

وجاءت هذه العلامة الفندقية هذا الاتجاه، ثم التعاون مع نيتياس، قد دخلت في تعاون مع QQ!

الابتكار اختراق! قسم تالون "المؤسسات الوطنية لحقوق الملكية الفكرية مظاهرة"

استراليا بدعوة: "03:00" وصلت إلى أستراليا، تأشيرة جود الانفرادي كنت لم أر! الله قد بديلا صديقته وي

الافراج عن مصر الأصلية أول هاتف ذكي، ولكن عملية الإنتاج التقلبات والمنعطفات غير طبيعية!