يجوز DeepMind برمجة المنطق التفاضلي، جنبا إلى جنب مع مزايا البرمجة رمزية دراسة متعمقة

الصيف B التي تم تجميعها من DeepMind مدونة

إنتاج و qubit | عدد ملفه QbitAI

قوة الشبكات العصبية ليراها الجميع، ولكن في كثير من الأحيان يتطلب الكثير من بيانات التدريب ومناطق توزيع البيانات اختبار موضوعي مماثلة؛ والاستقرائي برمجة المنطق حقل رمز سوى كمية صغيرة من البيانات، ولكن لا يمكن محاربة البيانات الضوضاء، ومجال التطبيق أيضا ضيقة جدا.

DeepMind في ورقة نشرت مؤخرا المقترحة للتفاضل حثي ILP برمجة المنطق، أن عناوين نوع رمز المهمة التقليدية الخبرات برمجة المنطق الاستقرائي، ولكن أيضا البيانات الضوضاء، ومجموعة التدريب لديها بعض التسامح للخطأ، يمكنك تدرب على يد أصل التدرج.

ماذا عن؟ ونحن نلقي نظرة DeepMind تفسير هذا النهج على بلوق الرسمية:

تخيل اللعب مشهد كرة القدم، الكرة لقدميك، أن تقرر نقله إلى المهاجم لا أحد رجل علامة. هذا العمل تبدو بسيطة، تتطلب طريقتين مختلفتين في التفكير.

أولا وقبل كل شيء، عليك أن تدرك أن قدميك لها الكرة، الأمر الذي يتطلب أن التفكير العاطفي بديهية - كنت ببساطة لا يمكن أن تصف كيف تعرف أن هناك كرة القدم.

ثانيا، عليك أن تقرر لتمرير الكرة إلى المهاجم محددة. يتطلب هذا القرار التفكير النظري، قرارك يعتمد على السبب - السبب تحصل على الكرة إلى المهاجم، وهو ليس رجل علامة لها.

هذا التمييز مهم للغاية بالنسبة لنا، لأن هذين النوعين من تتوافق التفكير لاثنين من مختلف وسائل التعلم الآلي: دراسة متعمقة من الرموز وتركيبية (تكوين البرنامج الرمزي).

وركزت دراسة متعمقة في التفكير العاطفي وبديهية، وإجراءات تركيب رمزية، والتفكير النظري القائم على الحكم في التركيز عليها. كل من هذين النظامين لديها ميزة ذلك، يمكن أن تطبق على عمق نظام التعلم على البيانات الضوضاء، ولكن من الصعب أن أشرح، ولكن أيضا يتطلب كمية كبيرة من البيانات التدريب؛ والرموز أسهل لتفسير، ولكن أيضا تتطلب بيانات التدريب أقل، واجه البيانات الضوضاء ولكن يموت.

الإدراك البشري هذه الطرق المختلفة جدا للتفكير اثنين معا بسلاسة، ولكن أريد أن أضع هذا بالتزامن مع نسخة لنظام AI، نحن لا نعرف تماما ما إذا كان من الممكن، وكيفية القيام به.

نشرنا مؤخرا في مجلة "يائير" (مجلة البحوث AI) أوراق تدل على أن النظام يمكن أن يكون التفكير الإدراك الحسي والمفاهيمية بديهية يمكن أن يفسر المنطق معا. ILP وصفنا (برمجة المنطق الاستقرائي للاختلاف، اختلاف وحثي المنطق البرمجة) نظام لديه الخصائص التالية: مكافحة الضوضاء، والبيانات الاقتصادية، لإنتاج قاعدة التأويل.

نحن نستخدم مهمة لإثبات تحريض أعمال ILP:

وبالنظر إلى الصورة الرقمية تمثل، وفقا لنظام يحتاج إلى الصورة اليسرى أصغر من عدد الرقمي على يمين الصورة، والتسمية الناتج من 0 أو 1، كما هو مبين أدناه:

الحل لهذه المشكلة يتضمن طريقتان للتفكير. من صورة رقمية لندرك الحاجة التفكير العاطفي بديهية، لفهم كامل "أقل من" العلاقة، مطلوب التفكير النظري.

في الواقع، إذا كان نموذج التعلم عمق قياسي (مثل شبكة التفاف العصبية مع MLP) لتوفير بيانات التدريب الكافي، فإنها يمكن أن نتعلم أن حل هذه المشكلة بفعالية، بعد الانتهاء من التدريب لإعطائه صورة جديدة من زوج واحد لم يسبق له مثيل من قبل، فإنه يمكن أيضا أن تصنف بشكل صحيح.

ولكن في الواقع، فقط كل عينة الرقمية التي أعطاها أكثر مما يمكن التعميم بشكل صحيح. هذا النموذج هو جيدة في تعميم البصرية، على سبيل المثال، كل مجموعة اختبار الأرقام التي شهدت صورة جديدة لتعميمها، فمن السهل (انظر أدناه المربع الأخضر). ولكنه لا ينطبق على رمز التعميم، تقول انها لا يمكن تعميمها على أرقام لم يسبق له مثيل من قبل (انظر الشكل أدناه المربع الأزرق).

ماركوس (غاري ماركوس)، جويل الكركي المؤلف وغيره من الباحثين قد أشارت مؤخرا من ذلك.

وخلافا للشبكة العصبية القياسية، ILP يمكن تعميمها رمز، علامة والإجراءات القياسية ليست هي نفسها، قد تكون معممة بصريا. ILP تعلم قراءة من العينة، تفسير، يمكن التحقق منها، إجراءات واضحة. (أي النتيجة المتوقعة، النتائج المرجوة في الشكل التالي) جزء من العينة هو معروف، يمكن ILP إنشاء برنامج لتلبية الطلب. ذلك الإجراء أصل التدرج من فضاء البحث، وإخراج إشارة إذا كانت البيانات خرج البرنامج يتطلب الصراع، ونظام تعديل البرنامج لأفضل تطابق البيانات.

عملية التدريب ILP كما هو مبين أدناه:

ILP تعميم رمزي لا يمكن أن يؤديها، فمن بما فيه الكفاية إلى x < ذ، ذ < ض، س < عينة من ض، يمكن أن تأخذ في الاعتبار "أقل من" العلاقة قد متعدية. بمجرد أن يتقن هذه القاعدة العامة، يمكنك تطبيقه على رقم جديد لم يسبق له مثيل على الذهاب.

يلخص هذا الرقم لدينا "أقل من" التجربة: يمثل المنحنى الأزرق عمق معيار الشبكات العصبية، لا يمكن تعميمها على الرقم الصحيح للم يسبق له مثيل، مقارنة مع 40 فقط في حالة الرقمية تدريب المقبل، ويمثل منحنى الأخضر ILP لا يزال قادرا على الحفاظ على انخفاض الاختبارات الخطأ. وهذا يشير إلى أن ILP يمكن تعميمها رمزي.

ونحن نعتقد أنه إذا كانت المشكلة لا يمكن أن يتحقق رمزية تعميم عمق الشبكة العصبية، نظامنا قادر على ان يعطي جوابا إلى حد ما. في المستقبل، ونحن نخطط للاندماج في نظام مماثل كيل التعلم ILP تعزيز وعمق أكبر من وحدات التعلم، وإعطاء نظام المنطق، والقدرة على الرد.

طريق الحرير

يجوز DeepMind برمجة المنطق التفاضلي، جنبا إلى جنب مع مزايا البرمجة رمزية دراسة متعمقة

الحب من النظرة الأولى متر فقط 10! تشانغ CS85 COUPE اقول لكم ما حقل غاز

البالغ من العمر 42 عاما لا يزال كاواغوشي "على قيد الحياة" لا يزال كابتن الفريق J3 دوري

الكرة Hengda 1 صيحات الاستهجان في كل مكان، الحقل شيه وتحية المشجعين داليان كلمة واحدة، جعلت وقت متأخر من الليل للرد على مقال طويل

شركة اللعبة الأكثر فوضى؟ شراء IP مقابل الكثير من المال ولكن دون تغيير المحرك لمدة 10 سنوات ، وعدم دفع مدفوعات نهاية الخدمة

عمق الربط ماراثون تشانجان السيارات استخدام "الحد" "القيود" اختراق

النرويج ثقة الإمبراطور الدوري لاول مرة هذا الشوط، روزنبورغ الصيادين ناجحة كنز تأوه

أصدقاء S8 الكورية على الحضور؟ لعبت عوزي التصفيات، أرسل تحطم ذكرت رأسه!

عندما اللاعبين إلى "ضابط تجربة"، وتابع 2019 سويفت "عودة"!

أفضل المشجعين المعروفين ليفربول بدا دربي ميرسيسايد

داليان الشيطان في الداخل فاز ثيرافادا بالجائزة الأولى! سوبر جولة الجامعة 3 عدد الحضور: Suning الثانية والخامسة تشونغتشينغ

ملك معظم النفايات بطل المجيدة، كل الاوقات لتعزيز اليوم لا يمكن حفظ الولايات المتحدة! S13 استقل فعلا المذبح

القادة الصينيين AI | حوار ما Weiying: تكنولوجيا ينبغي أن تكون الرعاية أكثر إنسانية

6 سنوات، السيف! أعلنت فولكس واجن نهاية العلامة التجارية الثالثة، "جيتا" سيجعل السيارات للشباب - FAW

الفقرة الأخيرة بعنوان "العالم من علب القاتل" لعبة! التمييز ضد الأشخاص والآن تبرد تماما انقطاع

لي تاي الحديد قبضة ادارة الجيش! رافائيل الأولى غرفة خلع الملابس، وكتابة رسالة اعتذار، اعتذار اثنين من لاعبي الأحمر

NVIDIA AI تخطيط صناعة ديناميكية: تشارك بالفعل في صناعة النفط والطاقة

بعد القيادة عن العمل لبضعة أيام في يي جديد Ruize 5 مريح، وأنا فعلا "ننسى السيارة"، و

داليان هنغ جي الجناح من الصعب جدا! لماذا تسد المشجعين داليان؟ بعد المباراة مرتين صخبا تسليط الضوء على الأخوة!

بالإضافة إلى ميدلسبره "باب الحديد" وراء فالديس هناك "أبواب"

BOSS صناعة لعبة معروفة، والاستيلاء على الأميرة لمدة 30 عاما، والآن فعلا بوحشية أم سحرية لتغيير!

ما يقرب من 7000 أوامر لمدة خمس دقائق! نماذج المسمار من 150000 يوان، جي يجيا ما قبل إطلاق المناسبة

العلم الاسباني في أول نجم كأس العالم أفريقيا هو الآن مدرب الدوري الهولندي

الأحكام ذات الصلة