AI اختراق: DeepMind بناء نظرية العقل الشبكة العصبية بحيث آلة فهم بعضهم البعض

 الأنفس جي تجميع جديد

المصدر: DeepMind

ترجمة: مارفن

[استعراض فاز جي الجديدة أحدث الأبحاث التي نشرت اقترحت مؤخرا DeepMind "نظرية آلة العقل" (آلة نظرية العقل)، "نظرية العقل" مستوحاة من الباحثين علم النفس بناء الشبكة العصبية ToMnet نظرية العقل، ومن خلال سلسلة من التجارب لإثبات أن لديها القدرات العقلية. هذا هو تطوير نظم AI متعدد وكيل وصناعة الآلات - خطوة هامة في سطاء التكنولوجيا التفاعل بين الإنسان والحاسوب، وكذلك لتعزيز تنمية تفسير AI.

نظرية العقل (توم، Premack وودروف، 1978) يشير إلى قدرة الإنسان على فهم حالة ذهنية من تلقاء نفسها والآخرين، وتشمل هذه الحالات النفسية الرغبات، والمعتقدات، والنوايا وما شابه ذلك. حاول الباحثون DeepMind لتدريب الجهاز لبناء مثل هذا النموذج. صمموا نظرية الشبكة العصبية للعقل (نظرية العقل الشبكة العصبية) - ToMnet، تستخدم شبكة الفوقية تعلم إنشاء عامل نموذج (وكيل) من خلال مراقبة سلوكها واجهتها. من خلال هذه العملية، اكتسبت ToMnet على نموذج مسبق قوي للسلوك وكيل، وسوف استخدام عدد قليل فقط سوف تكون قادرة على إجراء المراقبة أكثر اتساعا والخصائص النفسية وتتوقع هيئة الاستخبارات الدولة. تطبيق وكيل الباحثين ToMnet في بيئة شبكة بسيطة، وأنه يمكن تعلم خوارزمية شبه عشوائي وعمق من مجموعات مختلفة من وكيل تعزيز التعلم، واجتازوا الاختبار الكلاسيكية المهام توم، مثل "اختبار سالي آن" (فيمر وبيرنر، 1983؛ بارون كوهين وآخرون، 1985.). ويعتقد الباحثون هذا النظام - وكيل مستقل لمعرفة كيفية محاكاة عوامل أخرى في العالم - هو تطوير أنظمة AI متعدد وكيل وبناء الإنسان والحاسوب وسطاء تكنولوجيا التفاعل، وكذلك لتعزيز تقدم AI يمكن أن يفسر خطوة هامة.

مستوحاة من نظرية العقل البشري "نظرية آلة العقل"

حاليا، وعمق التعلم والتقدم المحرز في عمق تعزيز التعلم، على الرغم من إثارة، ولكن بعض الناس يشعرون بالقلق من ان فهمنا لهذه الأنظمة ليست كافية. موصوفة الشبكات العصبية عموما مبهمة الصندوق الأسود، غير المبررة. حتى إذا كان لدينا وزن وصفه كاملة، فمن الصعب معرفة أنها تستخدم هذا النموذج، وحيث يمكنك الذهاب الخطأ. مع AI أكثر وأكثر في عالم البشر، فهم احتياجاتهم ينمو أيضا.

توقف دعونا ونسأل: لكيلا، و "فهم" وكيل آخر ما يعني ذلك؟ كبشر، نحن في مواجهة هذا التحدي كل يوم، لأننا جميعا الاتصالات البشرية ميزات أخرى محتملة، والوضع وعملية حساب المحتملة تماما تقريبا اليوم لا يمكن الوصول إليها. لكننا "فهم" الآخر اللافت جدا. يمكننا التنبؤ بسلوك المستقبل من الغرباء، واستنتاج المعرفة للعالم، ونحن يمكن أن خطة للتفاعل مع الآخرين، وإقامة اتصالات فعالة.

وهناك عامل آخر "فهم" وهناك ميزة هامة هي أن البنية الأساسية من صحيح بغض عامل تقريبا من المرجعية. نحن البشر عادة لا محاولة لتقدير النشاط الآخرين الخلايا العصبية، واستنتاج كيفية توصيل قشرة الفص الجبهي، أو خطة للذهاب للتفاعل مع غيرها من خريطة الحصين الإنسان. نقطة مهمة نظر علم النفس المعرفي هو أن لدينا المنطق الاجتماعي يعتمد على نموذج رفيع المستوى الآخرين (جوبنيك ويلمان، 1992)، والتي لا تنطوي على تجريدات نماذج تفصيلية الآليات الفعلية على أساس وصف السلوك الملاحظ، والعكس، نحن فهم أن الحالة النفسية للآخرين، مثل رغباتهم والمعتقدات والنيات. غالبا ما يوصف هذه القدرة باسم نظرية العقلية (نظرية العقل).

في هذه الورقة، وحصلنا على الإلهام من نظرية العقل من الناس في محاولة لبناء نظام تعلم النمذجة وكيل آخر. سنقوم بشرح أنها "نظرية آلة العقل" (آلة نظرية العقل) . هدفنا ليس لتوليد السلوك وكيل النموذج المقترح وعكس خوارزمية. بدلا من ذلك، ونحن نركز على كيفية استخدام التعلم الذاتي مراقب بيانات محدودة عن وكيل النمذجة الآخرين. وهذا يتيح لنا العمل مع دراسات سابقة مختلفة، تعتمد على الدراسات السابقة الاصطناعي نموذج جهاز المخابرات، على سبيل المثال باستخدام RL العكسي، بايزي الاستدلال، نظرية بيز العقل أو لعبة نظرية. بدلا من ذلك، ونحن نعلم نموذج وكيل، وكيف أنهم المنطق من الصفر من قبل الفوقية التعلم.

بناء الغنية ومرنة وعالية الأداء آلة لنظرية AI العقل يشكل تحديا كبيرا. والنقطة الرئيسية في هذه الورقة هي أن الغالبية العظمى من التحديات الأولية لبناء توم قد ينظر إليها على أنها بسيطة مشاكل في التعلم، لأنها ممثلة في الصيغة. عملنا هنا هو ممارسة حساب هذه الصيغ بسيطة.

هذا العمل العديد من التطبيقات المحتملة. ونموذج التعلم الغنية وفي تحسين العديد من المهام المتعددة وكيل معقدة من (صنع القرار)، وخاصة في حالة التخطيط القائم على الاحتياجات ونموذج الخيال صنع القرار. هذه النماذج هي أيضا مهمة للتعديلات القيمة والتعاون المرن، ومن المرجح أن يكون جزءا من مستقبل آلة صنع القرار الأخلاقية. هم أيضا مهم جدا للتواصل والتعليم، قد تلعب دورا رئيسيا في التفاعل بين الإنسان والحاسوب. هذه القدرة على توليد شروط البحث تكشف أيضا عن أصل القدرات البشرية. وأخيرا، قد تكون هذه النماذج أصبحت وسيلة هامة لفهم الإنسان من الذكاء الاصطناعي.

وأخيرا، والدافع لدينا هو جعل الذكاء الاصطناعي القوي يمكن تفسير كبشر. نحن هنا لمحاولة مقاربة جديدة: محاولة لبناء نظام وسيط من أجل الحد من البعد السلوك الفضاء، وتبين لهم في شكل أكثر قابلية للفهم، بدلا من تعديل وكيل بحيث يتعرض الهيكل الداخلي للدولة إلى أشكال التأويل الإنسان. في هذا المنظور، والسعي للآلة توم هو إنشاء قلة التفاعل بين الأجهزة والبشرية المتوقعة (واجهة مفقود).

الطرق: التجريبية مهمة التعلم الفوقية

ونحن نعتبر أن بناء كنظرية للعقل الفوقية التعلم المشكلة. في الاختبار، ونأمل أن تكون قادرة على تلبية وكيل الجديد الذي لم يسبق له مثيل من قبل، ولديهم معرفة مسبقة قوية وغنية عن سلوكهم. وبالإضافة إلى ذلك، عندما نرى وكيل وقت عملها في العالم، ونحن نأمل أن تكون قادرة على جمع بيانات عن معالمه المحتملة والحالة النفسية (أي بعد تشكيل الخلفي)، والتي سوف تسمح لنا لتحسين التنبؤات سلوكهم المستقبل.

تحقيقا لهذه الغاية، وضعنا مهمة للتعلم الفوقية. نحن شيد مراقب (المراقب)، فإنه يمكن رؤية مجموعة جديدة من السلوكيات في كل وكيل آثار حلقة في. الهدف المراقب هو التنبؤ وكيل السلوك المستقبل. خلال التدريب، ويجب أن المراقب تشكيل بسرعة التنبؤ عن عامل جديد من بيانات محدودة. هذا العامل الجديد على "التعلم" هو ما نسميه الفوقية التعلم. من خلال هذه العملية، ينبغي المراقب أيضا يتعلم السلوك مسبق عامل فعال والمعرفة يلتقط ضمنا المشتركة بين وكيل السكان التدريب.

ونحن نقدم مفهومين لوصف مكونات شبكة المراقبة والأدوار الوظيفية. نحن نميز بين النظرية العامة للعقل - تعلم الأوزان الشبكة، والذي يتضمن توقعات حول سلوك شائع تدريب كل مجموعة من وكيل، وتحديدا وكيل لنظرية العقل - من خلال مراقبة تشكيل "التضمين وكيل" في الاختبار، وأنه يحتوي على ما الذي يجعل ملامح وكيل وتختلف الحالة النفسية من وكيل آخر. هذه تتوافق مع السلوك وكيل سابق والخلفي.

هيكل من هذه الورقة هو عبارة عن سلسلة من التجارب التي تزيد تدريجيا في التعقيد من أجل "نظرية آلة العقل"، وشبكة (ToMnet). هذه التجارب تظهر الأفكار ToMnet، فضلا عن قدرته على التعلم وكيل آخر النماذج الغنية، وهذه النماذج يجمع بين المظاهر التقليدية لنظرية العقل البشري، مثل فهم الاعتقاد الخاطئ.

مساهمة: ToMnet تعلم التنبؤ وشرح العقائد

في هذه الدراسة، والمساهمات على النحو التالي:

  • في 3.1، وتبين لنا لوكيل العشوائية البسيطة، وعلم ToMnet لتقريب خصائص عامل أساس النظرية الافتراضية للمستوى الأمثل للاستدلال.

  • في 3.2، وتبين لنا ToMnet علمت أن الهدف الاستدلال وكلاء حسابي من (قلة شوت عكس التنفيذ الفعال لتعزيز التعلم)، وكيف توازن بين التكاليف والعوائد.

  • في القسم 3.3، وتبين لنا عميق وكيل تعزيز التعلم لوصف أنواع مختلفة من ToMnet تعلم لالتقاط عاملا رئيسيا في الاختلاف إجمالي عدد السكان، وتشكيل الذكاء المجرد جزءا لا يتجزأ من هذه الهيئات. وتبين لنا أيضا أنه يمكن ToMnet اكتشاف الفضاء الجديد السلوكي المجرد.

  • في 3.4، وتبين لنا أنه عندما يتم تدريب ToMnet في عامل POMDPs عمل عمق RL، فإنه يعرف ضمنا وكيل قد عقد المعتقدات الخاطئة حول العالم. هذا هو العنصر الأساسي لنظرية العقل البشري.

  • في 3.5، نثبت ToMnet يمكن تدريبهم على توقع حالة المعتقدات الوكيل، ويكشف بوضوح المعتقدات الخاطئة من وكيل. وتبين لنا أيضا أن ToMnet يمكن الاستدلال على سلوكهم فقط من محتوى وكيل مختلفة يمكن أن ينظر إليها، وأنها تميل إلى الاعتقاد على أساس هذا المحتوى.

العمارة الشكل 1. ToMnet

الشكل 2. وكيل عشوائي يعمل من الأمثلة الشبكة العالمية

الشكل 3. التدريب على العشوائية وكيل ToMnet

الرقم 13. الإشراف يكون التنبؤ الإيمان

لمزيد من التفاصيل يرجى الرجوع إلى الرسالة الأصلية: الشبكي: //arxiv.org/pdf/1802.07740.pdf

[] تاريخ المجتمع

جي وون AI صناعة التكنولوجيا + تجنيد المجتمع الجديد، رحب هبطت طلاب + AI صناعة تكنولوجيا الفائدة، بالإضافة إلى ليتل مساعد مايكرو إشارة: aiera2015_1 في المجموعة، وإذا سيدعى في المجموعة المعتمدة، تأكد من تعديل المجموعة بعد الانضمام إلى المجتمع الملاحظات (الاسم - الشركة - فرص العمل، مجموعة المهنية للمراجعة أكثر صرامة، يرجى فهم).

بالإضافة إلى ذلك، AI التكنولوجيا + يوان تشى الصناعات المجتمعات الجديدة (السيارات الذكية، والتعلم الآلي، والتعلم العميق، والشبكات العصبية، وغيرها) للمهندسين وتشارك الباحثين في المجالات ذات الصلة من التوظيف.

جي وون أضاف منصة جديدة مفتوحة المجتمع التقني للمشاركة AI +

زراعة الملفوف العضوية التكنولوجيات الجديدة - العائمة الحضانة مفصل

لتولي السوبر ماركت أو متجر الالتفات إلى ما القضايا؟

"تذكير" ملاحظة: لوحات السيارات "سيف الخلفي"، مضاءة "المرحاض" رمز، يكون في حالة تأهب!

حار التجزئة أسبوع واحد | لمحاربة الكثير في السوق، والنزاعات حقوق وهمية، جائع، ما الحرب الوجبات الجاهزة بعثة الولايات المتحدة

المدينة المحرمة معا، والاستماع ببطء على صوت تساقط الثلوج

هل سبق لك أن رأيت الناس يبكون في مترو الأنفاق ذلك؟

IBM كمبيوتر الكم الهيكل الداخلي للتعرض الأول 2018 التنبؤ الحرب الكم الهيمنة

تحت السويسري لحسن الحظ، وحتى ضربة مزدوجة من القهوة، وتباع ستاربكس خارج السوق "تسوية"؟

القيام برحلة سياحية فاخرة هو ما التجربة؟

[الجاف] عمق عملية التعلم وتوفير الحلول التجريبية PyTorch

المقلية هي العاصمة وأي متجر منفذ العملاقة، فإنه سيتم يدم طويلا؟

الليتشي جيدة لديها مبيعات جيدة - ليتشي زهرة قوية والفواكه تكسير أحدث التقنيات