لحفظ CNN، CoordConv اوبر في موضع تساؤل، "الإحداثيات ترجمة تحتاج أيضا التدريب؟"

الكستناء مستديرة جمعت من blog.piekniewski.info

تقارير و qubit | عدد ملفه QbitAI

وقال قبل بضعة أيام، اوبر AI مختبر نشرت ورقة رائعة جدا الشبكة العصبية التلافيف (CNN) في بعض المهام بسيطة جدا وواضحة جدا والتي سوف تسقط.

على سبيل المثال، صورة بيضاء فوق نقطة سوداء. تغذية CNN إلى هذه النقطة (ط، ي) الإحداثيات، فإنه ليس من رسم الشكل في النص الأصلي.

وخلاصة القول، إشراف وتقديم وتصنيفها تحت إشراف تنسيق والإشراف على العودة، بل هو مشكلة كبيرة بالنسبة CNN.

لذلك، اقترح فريق CoordConv، لاسترداد هذه الأراضي تقع.

ولكن سرعان ما، ورقة، ولCNN حفظ بطل الرواية CoordConv، كان قليلا طويلة بوين "جثة" و.

وقال صاحب بلوق فيليب Piekniewski (اسم مؤقت فيفي) التي قام بها الى التشريح دراسة.

إضافة ميزة، فإنه

أولا، (بيضاء نقطة سوداء أعلاه) مشكلة الموقع، وجد فريق اوبر، CNN ليست جيدة في الإحداثيات الديكارتية  (I، J) هو في تحويل واحد الساخنة الفضاء بكسل  (واحد ساخنة بكسل الفضاء) في الموقف.

ذكر فيفي هيكل CNN من كونيهيكو فوكوشيما نيوكونييترون  بدأ (نيوكونييترون) العصر، المصممة أساسا بأنه " تجاهل الموقف "في.

وCoordConv القيام به، المدخلات فقط إلى الشبكة العصبية، زائد قناتين الإحداثيات A لي ي، AI اقول بوضوح ما هو الذي.

يجعل حقا شعور آه. ولكن ......

الشعور العام، مجرد شريك صغير في التطبيق العملي من الوقت، يمكن أن تكون مماثلة لCNN معالجة قليلا، وهذا هو، ميزة زائد ، فك شيء أكثر راحة.

وقال فيفي، هل الزملاء رؤية الكمبيوتر، لا أحد سوف تشعر إضافة العديد من الميزات هو شيء لا يصدق.

مملة

وعلى الرغم من ذلك، هناك نقاش الناري جدا الأكاديمية البحتة، هو أن بعض العلماء يعتقدون أن الجميع ينبغي فقط مع تلك الميزات علمت (ميزات المستفادة)، واقتصادية لارسال اللاعبين لا نوافق على ذلك.

من هذا المنظور، والآن هو الآن عمق دوائر التعلم، كما بدأ لتحديد ميزات المشروع  (ميزة الهندسة)، يمكنك يمكن يمكن.

تدريب النتائج، آه التي تحتاج أيضا إلى تدريب؟

إضافة طبقة من الإحداثيات بعد، اختبر فريق كان أداء الشبكة العصبية.

يستخدم جميلة هنا بيانات ودعا " ليست بهذه Clevr ".

تتمثل مهمته في استخدام تنسيق توليد صورة الحرارية وحدها ، ومع صورة الحرارية وحدها توليد تنسيق .

وأظهرت النتائج أن أداء الشبكات العصبية هو في الواقع أفضل من تلك التي لم تزد عند عدد لا بأس به.

ومع ذلك، إذا لم تحصل على السعادة هؤلاء الناس حتى، والجلوس وتهدئة، قد تلاحظ، مباشرة يمكنك أن تأخذ ديكارت تنسيق و الساخنة واحد تحويل الشفرة الشبكة العصبية آخر، لا مثل ذلك؟

فيفي ومع وضع هذا في الاعتبار، وكتب مجموعة من الرموز -

 1 استيراد  scipy.signal كما  س

 2 استيراد  نمباي كما  أرستها

 3 # إصلاح بعض أبعاد الصورة

 4 I_width = 100

 5 I_height = 70

 6 # توليد صورة المدخلات

 7 A = np.zeros ((I_height، I_width))

 8 # توليد موقف اختبار عشوائي

 9 pos_x = np.random.randint (0، I_width-1)

10 pos_y = np.random.randint (0، I_height-1)

11 # ضع بكسل في وضع اختبار عشوائي

12 A = 1

13 # إنشاء ماذا سيكون ميزات تنسيق

14 X = np.zeros_like (A)

15 Y = np.zeros_like (A)

16 # ملء قيمة X تنسيق

17 إلى  س في  مجموعة (I_width):

18 X = س

19 # ملء Y-تنسيق القيمة

20 إلى  ذ في  مجموعة (I_height):

21 Y  = Y

22 # عرف مشغلي التلافيف

23 OP1 = np.array (،

24 ،

25 >)

26 OPX = np.array (،

27 ،

28 >)

29 سخ = np.array (،

30 ،

31 >)

32 # لف للحصول على ميزة أول خريطة DY

33 CA0 = sp.convolve2d (A، سخ، ووضع = 'نفسه')

34 CY0 = sp.convolve2d (Y، OP1، ووضع = 'نفسه')

35 DY = CA0 + CY0

36 # لف للحصول على ميزة الثانية خريطة DX

37 CA1 = sp.convolve2d (A، OPX، ووضع = 'نفسه')

38 CX0 = sp.convolve2d (X، OP1، ووضع = 'نفسه')

39 DX = CA1 + CX0

40 # تطبيق نصف استقامة يعدل

41 DX = 0

42 DY = 0

43 # طرح من ثابت (طبقة إضافية مع وحدة التحيز)

44 result_y = I_height-DY.sum ()

45 result_x = I_width-DX.sum ()

46 # تحقق من نتيجة

47 ASSERT (Pos_x == الباحث (result_x))

48 ASSERT (Pos_y == الباحث (result_y))

49 طباعة  result_x

50 طباعة  result_y

وهناك طبقة الإلتواء، وتفعيل غير الخطية، زائد والطرح. لحسم القتال.

وقال ان هذا النوع من الشيء، لا تأخذ من الوقت للتدريب.

100 GPU

بعد نهاية الورقة الرئيسية، بدأ إيجابية.

الملحق الداخل، لا يوجد مثل هذا النموذج.

اوبر فريق تأخذ بها إحداثيات ميزة على ImageNet بها قليلا.

في الممارسة العملية، تطبيق الطبقة الأولى إلى ResNet-50.

فيفي أعتقد أن هذه المسرحية يجب أن تكون هناك X، لأن ImageNet في هذه الفئة، وليس وظيفة الموقع . حتى بداية التحيز من هذا القبيل، والتدريب، والتضخيم البيانات تمحوها.

والمثير للدهشة، استخدم الباحثون 100 GPU لتدريب الشبكة العصبية وراء هذا التحسن.

ونتيجة لذلك، إلى عشري المركز الثالث لأنهم وصلوا أخيرا جائزة ترضية باهتة.

وقال فيفي أنه إذا كان هناك مليون وحدة GPU، وربما يمكن استخدامها ل، وجمال لا حصر له في شيء رائع.

حقا أن الخندق، ثم، لا نريد أن نفعل ذلك نقاط التدريب أكثر وضوحا؟

فتوجه مع العروض الخاصة بك

ذابت فيليس المفارقة في كلمة -

هذا النوع من العمل، وهناك أشخاص صفق، محزن حقا.

لذلك، كيف ترى؟

- كامل  -

المتدرب

العمليات و qubit المتدرب هو تجنيد الأنشطة والتخطيط لتنفيذ الأنشطة في إطار نجمة AI الرئيس التنفيذي للشركة، وكبار المديرين التنفيذيين الآخرين تشارك في الانترنت / حاليا، لدينا الفرصة للتواصل مباشرة مع الماشية الكبيرة صناعة AI. مقرها في تشونغ قوان تسون في بكين. تسليم استئناف مرحبا بكم في quxin@qbitai.com

تفاصيل محددة، يرجى و qubit عدد الجمهور (QbitAI) واجهة الحوار والرد "المتدرب" في الاسم.

و qubit QbitAI عناوين على التوقيع

' " تتبع تقنيات AI دينامية جديدة والمنتجات

جدي البقاء على قيد الحياة لماذا تراجعت لاعبين من 3،800،000 إلى 300،000؟ العالم من علب اللاعبين القدامى يقولون ست كلمات

8000000 لامبورغيني اليدين والقدمين السلبي، في الليل الجسم مثل العديد من الشقوق متشابكة، وسيم قصفت؟

مرتين في الموسم، وكان عليه أن مواجهة الموت في وجهه، وهذا في الحقيقة ليست لجعله

أقوى هجوم مضاد! هزمت هذه اللعبة، بعد ثماني سنوات لكن لم يحصل على أكبر مفاجأة من أيدي السنة

أفضل لاعب في الدور نصف النهائي صدر للتو، من Shierjiangsai معظم فريق ملهمة

عاصفة ثلجية كيفية محاربة؟ وقد بشرت اللعبة ألمع في تحديث كبير! العالم من علب لاعبين لالغاء الكبد

رئيس SUV، 35 دخول انيوان، رفض المبيعات ثواني الفضاء Q3 X1، تكوين ما يكفي للعب سنة واحدة

AFC أحدث الهدافين: زعيم العضلات، الغربية ثلاثة أبطال، سامبا المساعدات الخارجية تعادل على المركز الثاني

هذا العام الأكثر فشل اللعبة مرساة، ولكن الآن وقد وضعت عليه أخت الأحمر، أود أن التسلل الى الترفيه الكورية؟

اختفى 800000 عجلة القيادة بهدوء بعد عودة اللص المنزل الذي فات منغوليا: لا يمكن 1 كومة واحدة على زر قراءة

"غوغل تعترف سوى المال! آلة التعلم 20 عاما أي تقدم"، والباحثين جامعة كارنيجي ميلون أولا انتقد صانع AI

الطعام: تنس الطاولة العاب ذلك لدي فهم ومشاعر جديدة!