الكستناء مستديرة جمعت من blog.piekniewski.info
تقارير و qubit | عدد ملفه QbitAI
وقال قبل بضعة أيام، اوبر AI مختبر نشرت ورقة رائعة جدا الشبكة العصبية التلافيف (CNN) في بعض المهام بسيطة جدا وواضحة جدا والتي سوف تسقط.
على سبيل المثال، صورة بيضاء فوق نقطة سوداء. تغذية CNN إلى هذه النقطة (ط، ي) الإحداثيات، فإنه ليس من رسم الشكل في النص الأصلي.
وخلاصة القول، إشراف وتقديم وتصنيفها تحت إشراف تنسيق والإشراف على العودة، بل هو مشكلة كبيرة بالنسبة CNN.
لذلك، اقترح فريق CoordConv، لاسترداد هذه الأراضي تقع.
ولكن سرعان ما، ورقة، ولCNN حفظ بطل الرواية CoordConv، كان قليلا طويلة بوين "جثة" و.
وقال صاحب بلوق فيليب Piekniewski (اسم مؤقت فيفي) التي قام بها الى التشريح دراسة.
إضافة ميزة، فإنه
أولا، (بيضاء نقطة سوداء أعلاه) مشكلة الموقع، وجد فريق اوبر، CNN ليست جيدة في الإحداثيات الديكارتية (I، J) هو في تحويل واحد الساخنة الفضاء بكسل (واحد ساخنة بكسل الفضاء) في الموقف.
ذكر فيفي هيكل CNN من كونيهيكو فوكوشيما نيوكونييترون بدأ (نيوكونييترون) العصر، المصممة أساسا بأنه " تجاهل الموقف "في.
وCoordConv القيام به، المدخلات فقط إلى الشبكة العصبية، زائد قناتين الإحداثيات A لي ي، AI اقول بوضوح ما هو الذي.
يجعل حقا شعور آه. ولكن ......
الشعور العام، مجرد شريك صغير في التطبيق العملي من الوقت، يمكن أن تكون مماثلة لCNN معالجة قليلا، وهذا هو، ميزة زائد ، فك شيء أكثر راحة.
وقال فيفي، هل الزملاء رؤية الكمبيوتر، لا أحد سوف تشعر إضافة العديد من الميزات هو شيء لا يصدق.
مملة
وعلى الرغم من ذلك، هناك نقاش الناري جدا الأكاديمية البحتة، هو أن بعض العلماء يعتقدون أن الجميع ينبغي فقط مع تلك الميزات علمت (ميزات المستفادة)، واقتصادية لارسال اللاعبين لا نوافق على ذلك.
من هذا المنظور، والآن هو الآن عمق دوائر التعلم، كما بدأ لتحديد ميزات المشروع (ميزة الهندسة)، يمكنك يمكن يمكن.
تدريب النتائج، آه التي تحتاج أيضا إلى تدريب؟
إضافة طبقة من الإحداثيات بعد، اختبر فريق كان أداء الشبكة العصبية.
يستخدم جميلة هنا بيانات ودعا " ليست بهذه Clevr ".
تتمثل مهمته في استخدام تنسيق توليد صورة الحرارية وحدها ، ومع صورة الحرارية وحدها توليد تنسيق .
وأظهرت النتائج أن أداء الشبكات العصبية هو في الواقع أفضل من تلك التي لم تزد عند عدد لا بأس به.
ومع ذلك، إذا لم تحصل على السعادة هؤلاء الناس حتى، والجلوس وتهدئة، قد تلاحظ، مباشرة يمكنك أن تأخذ ديكارت تنسيق و الساخنة واحد تحويل الشفرة الشبكة العصبية آخر، لا مثل ذلك؟
فيفي ومع وضع هذا في الاعتبار، وكتب مجموعة من الرموز -
1 استيراد scipy.signal كما س
2 استيراد نمباي كما أرستها
3 # إصلاح بعض أبعاد الصورة
4 I_width = 100
5 I_height = 70
6 # توليد صورة المدخلات
7 A = np.zeros ((I_height، I_width))
8 # توليد موقف اختبار عشوائي
9 pos_x = np.random.randint (0، I_width-1)
10 pos_y = np.random.randint (0، I_height-1)
11 # ضع بكسل في وضع اختبار عشوائي
12 A = 1
13 # إنشاء ماذا سيكون ميزات تنسيق
14 X = np.zeros_like (A)
15 Y = np.zeros_like (A)
16 # ملء قيمة X تنسيق
17 إلى س في مجموعة (I_width):
18 X = س
19 # ملء Y-تنسيق القيمة
20 إلى ذ في مجموعة (I_height):
21 Y = Y
22 # عرف مشغلي التلافيف
23 OP1 = np.array (،
24 ،
25 >)
26 OPX = np.array (،
27 ،
28 >)
29 سخ = np.array (،
30 ،
31 >)
32 # لف للحصول على ميزة أول خريطة DY
33 CA0 = sp.convolve2d (A، سخ، ووضع = 'نفسه')
34 CY0 = sp.convolve2d (Y، OP1، ووضع = 'نفسه')
35 DY = CA0 + CY0
36 # لف للحصول على ميزة الثانية خريطة DX
37 CA1 = sp.convolve2d (A، OPX، ووضع = 'نفسه')
38 CX0 = sp.convolve2d (X، OP1، ووضع = 'نفسه')
39 DX = CA1 + CX0
40 # تطبيق نصف استقامة يعدل
41 DX = 0
42 DY = 0
43 # طرح من ثابت (طبقة إضافية مع وحدة التحيز)
44 result_y = I_height-DY.sum ()
45 result_x = I_width-DX.sum ()
46 # تحقق من نتيجة
47 ASSERT (Pos_x == الباحث (result_x))
48 ASSERT (Pos_y == الباحث (result_y))
49 طباعة result_x
50 طباعة result_y
وهناك طبقة الإلتواء، وتفعيل غير الخطية، زائد والطرح. لحسم القتال.
وقال ان هذا النوع من الشيء، لا تأخذ من الوقت للتدريب.
100 GPU
بعد نهاية الورقة الرئيسية، بدأ إيجابية.
الملحق الداخل، لا يوجد مثل هذا النموذج.
اوبر فريق تأخذ بها إحداثيات ميزة على ImageNet بها قليلا.
في الممارسة العملية، تطبيق الطبقة الأولى إلى ResNet-50.
فيفي أعتقد أن هذه المسرحية يجب أن تكون هناك X، لأن ImageNet في هذه الفئة، وليس وظيفة الموقع . حتى بداية التحيز من هذا القبيل، والتدريب، والتضخيم البيانات تمحوها.
والمثير للدهشة، استخدم الباحثون 100 GPU لتدريب الشبكة العصبية وراء هذا التحسن.
ونتيجة لذلك، إلى عشري المركز الثالث لأنهم وصلوا أخيرا جائزة ترضية باهتة.
وقال فيفي أنه إذا كان هناك مليون وحدة GPU، وربما يمكن استخدامها ل، وجمال لا حصر له في شيء رائع.
حقا أن الخندق، ثم، لا نريد أن نفعل ذلك نقاط التدريب أكثر وضوحا؟
فتوجه مع العروض الخاصة بك
ذابت فيليس المفارقة في كلمة -
هذا النوع من العمل، وهناك أشخاص صفق، محزن حقا.
لذلك، كيف ترى؟
- كامل -
المتدرب
العمليات و qubit المتدرب هو تجنيد الأنشطة والتخطيط لتنفيذ الأنشطة في إطار نجمة AI الرئيس التنفيذي للشركة، وكبار المديرين التنفيذيين الآخرين تشارك في الانترنت / حاليا، لدينا الفرصة للتواصل مباشرة مع الماشية الكبيرة صناعة AI. مقرها في تشونغ قوان تسون في بكين. تسليم استئناف مرحبا بكم في quxin@qbitai.com
تفاصيل محددة، يرجى و qubit عدد الجمهور (QbitAI) واجهة الحوار والرد "المتدرب" في الاسم.
و qubit QbitAI عناوين على التوقيع
' " تتبع تقنيات AI دينامية جديدة والمنتجات