الصيف B التي تم تجميعها من DeepMind مدونة
إنتاج و qubit | عدد ملفه QbitAI
قوة الشبكات العصبية ليراها الجميع، ولكن في كثير من الأحيان يتطلب الكثير من بيانات التدريب ومناطق توزيع البيانات اختبار موضوعي مماثلة؛ والاستقرائي برمجة المنطق حقل رمز سوى كمية صغيرة من البيانات، ولكن لا يمكن محاربة البيانات الضوضاء، ومجال التطبيق أيضا ضيقة جدا.
DeepMind في ورقة نشرت مؤخرا المقترحة للتفاضل حثي ILP برمجة المنطق، أن عناوين نوع رمز المهمة التقليدية الخبرات برمجة المنطق الاستقرائي، ولكن أيضا البيانات الضوضاء، ومجموعة التدريب لديها بعض التسامح للخطأ، يمكنك تدرب على يد أصل التدرج.
ماذا عن؟ ونحن نلقي نظرة DeepMind تفسير هذا النهج على بلوق الرسمية:
تخيل اللعب مشهد كرة القدم، الكرة لقدميك، أن تقرر نقله إلى المهاجم لا أحد رجل علامة. هذا العمل تبدو بسيطة، تتطلب طريقتين مختلفتين في التفكير.
أولا وقبل كل شيء، عليك أن تدرك أن قدميك لها الكرة، الأمر الذي يتطلب أن التفكير العاطفي بديهية - كنت ببساطة لا يمكن أن تصف كيف تعرف أن هناك كرة القدم.
ثانيا، عليك أن تقرر لتمرير الكرة إلى المهاجم محددة. يتطلب هذا القرار التفكير النظري، قرارك يعتمد على السبب - السبب تحصل على الكرة إلى المهاجم، وهو ليس رجل علامة لها.
هذا التمييز مهم للغاية بالنسبة لنا، لأن هذين النوعين من تتوافق التفكير لاثنين من مختلف وسائل التعلم الآلي: دراسة متعمقة من الرموز وتركيبية (تكوين البرنامج الرمزي).
وركزت دراسة متعمقة في التفكير العاطفي وبديهية، وإجراءات تركيب رمزية، والتفكير النظري القائم على الحكم في التركيز عليها. كل من هذين النظامين لديها ميزة ذلك، يمكن أن تطبق على عمق نظام التعلم على البيانات الضوضاء، ولكن من الصعب أن أشرح، ولكن أيضا يتطلب كمية كبيرة من البيانات التدريب؛ والرموز أسهل لتفسير، ولكن أيضا تتطلب بيانات التدريب أقل، واجه البيانات الضوضاء ولكن يموت.
الإدراك البشري هذه الطرق المختلفة جدا للتفكير اثنين معا بسلاسة، ولكن أريد أن أضع هذا بالتزامن مع نسخة لنظام AI، نحن لا نعرف تماما ما إذا كان من الممكن، وكيفية القيام به.
نشرنا مؤخرا في مجلة "يائير" (مجلة البحوث AI) أوراق تدل على أن النظام يمكن أن يكون التفكير الإدراك الحسي والمفاهيمية بديهية يمكن أن يفسر المنطق معا. ILP وصفنا (برمجة المنطق الاستقرائي للاختلاف، اختلاف وحثي المنطق البرمجة) نظام لديه الخصائص التالية: مكافحة الضوضاء، والبيانات الاقتصادية، لإنتاج قاعدة التأويل.
نحن نستخدم مهمة لإثبات تحريض أعمال ILP:
وبالنظر إلى الصورة الرقمية تمثل، وفقا لنظام يحتاج إلى الصورة اليسرى أصغر من عدد الرقمي على يمين الصورة، والتسمية الناتج من 0 أو 1، كما هو مبين أدناه:
الحل لهذه المشكلة يتضمن طريقتان للتفكير. من صورة رقمية لندرك الحاجة التفكير العاطفي بديهية، لفهم كامل "أقل من" العلاقة، مطلوب التفكير النظري.
في الواقع، إذا كان نموذج التعلم عمق قياسي (مثل شبكة التفاف العصبية مع MLP) لتوفير بيانات التدريب الكافي، فإنها يمكن أن نتعلم أن حل هذه المشكلة بفعالية، بعد الانتهاء من التدريب لإعطائه صورة جديدة من زوج واحد لم يسبق له مثيل من قبل، فإنه يمكن أيضا أن تصنف بشكل صحيح.
ولكن في الواقع، فقط كل عينة الرقمية التي أعطاها أكثر مما يمكن التعميم بشكل صحيح. هذا النموذج هو جيدة في تعميم البصرية، على سبيل المثال، كل مجموعة اختبار الأرقام التي شهدت صورة جديدة لتعميمها، فمن السهل (انظر أدناه المربع الأخضر). ولكنه لا ينطبق على رمز التعميم، تقول انها لا يمكن تعميمها على أرقام لم يسبق له مثيل من قبل (انظر الشكل أدناه المربع الأزرق).
ماركوس (غاري ماركوس)، جويل الكركي المؤلف وغيره من الباحثين قد أشارت مؤخرا من ذلك.
وخلافا للشبكة العصبية القياسية، ILP يمكن تعميمها رمز، علامة والإجراءات القياسية ليست هي نفسها، قد تكون معممة بصريا. ILP تعلم قراءة من العينة، تفسير، يمكن التحقق منها، إجراءات واضحة. (أي النتيجة المتوقعة، النتائج المرجوة في الشكل التالي) جزء من العينة هو معروف، يمكن ILP إنشاء برنامج لتلبية الطلب. ذلك الإجراء أصل التدرج من فضاء البحث، وإخراج إشارة إذا كانت البيانات خرج البرنامج يتطلب الصراع، ونظام تعديل البرنامج لأفضل تطابق البيانات.
عملية التدريب ILP كما هو مبين أدناه:
ILP تعميم رمزي لا يمكن أن يؤديها، فمن بما فيه الكفاية إلى x < ذ، ذ < ض، س < عينة من ض، يمكن أن تأخذ في الاعتبار "أقل من" العلاقة قد متعدية. بمجرد أن يتقن هذه القاعدة العامة، يمكنك تطبيقه على رقم جديد لم يسبق له مثيل على الذهاب.
يلخص هذا الرقم لدينا "أقل من" التجربة: يمثل المنحنى الأزرق عمق معيار الشبكات العصبية، لا يمكن تعميمها على الرقم الصحيح للم يسبق له مثيل، مقارنة مع 40 فقط في حالة الرقمية تدريب المقبل، ويمثل منحنى الأخضر ILP لا يزال قادرا على الحفاظ على انخفاض الاختبارات الخطأ. وهذا يشير إلى أن ILP يمكن تعميمها رمزي.
ونحن نعتقد أنه إذا كانت المشكلة لا يمكن أن يتحقق رمزية تعميم عمق الشبكة العصبية، نظامنا قادر على ان يعطي جوابا إلى حد ما. في المستقبل، ونحن نخطط للاندماج في نظام مماثل كيل التعلم ILP تعزيز وعمق أكبر من وحدات التعلم، وإعطاء نظام المنطق، والقدرة على الرد.
مقالات ذات صلة:
قواعد تفسيرية التعلم من بيانات صاخبة
ريتشارد إيفانز، إدوارد Grefenstette
العنوان الأصلي:
https://deepmind.com/blog/learning-explanatory-rules-noisy-data/
- انتهى -
التوظيف الصادق
المكدسة تقوم بتجنيد محرر / مراسل، ومقرها في تشونغ قوان تسون في بكين. نتوقع الموهوبين والطلاب المتحمسين للانضمام إلينا! مزيد من التفاصيل، يرجى و qubit عدد الجمهور (QbitAI) واجهة الحوار والرد "تجنيد" كلمة.
و qubit QbitAI عناوين على التوقيع
' " تتبع تقنيات AI دينامية جديدة والمنتجات