AlphaGo الرئيسي باحث Qinshou! 1010 PPT العرض تعزيز تعلم القاعدة الذهبية!

المصدر: نيو جي وون

هذه الأطروحة أنحاء الخريطة، أوصى القراءة 10 دقيقة.

حصة ديف الفضة 10 نقطة تلخيصها في كلمة ألقاها الأنشطة ديب التعلم المؤتمر التشاوري في تعزيز التعلم تولي اهتماما للك.

في الآونة الأخيرة، وتعزيز جوجل DeepMind تعلم قائد فريق البحث، المشروع الرئيسية AlphaGo محقق ديف الفضة في كلمته لخص أنشطة ديب التعلم المؤتمر التشاوري وتجدر الإشارة إلى 10 نقطة في تعزيز التعلم. نلقي نظرة، وربما أقل قدرة على السير في طرق بديلة.

في الآونة الأخيرة، على عمق التعلم المؤتمر التشاوري الذي عقد في ستيلينبوش، الحدث جنوب أفريقيا، وتعزيز جوجل DeepMind تعلم قائد فريق البحث، المشروع لخص الباحث الرئيسي AlphaGo ديف الفضة 10 نقاط لتعزيز التعلم أن يكون لاحظت في خطابه الرئيسي.

ومنظمي الحدث عروضا ديف الفضة PPT في لقطات وعناصر النص على تويتر، أدت إلى مناقشة مستفيضة.

يحتوي على 10 نقاط خطاب الفضة مركز تعزيز التعلم المقترحة أفكار وتوصيات خوارزمية تقييم ومراقبة الدولة، وظائف النمذجة، وما إلى ذلك، هو المطورين التعلم تستحق وهواة تعلم الآلة المرجعية. نلقي نظرة على كيف قال ذلك!

1، تحقيق تقدم في التقييم

الهدف، التقدير الكمي سيكون التقدم، واختيار الاتجاه ستحدد تقييم حجم التقدم. وربما هذا هو معظم القرارات الهامة التي قدمت خلال هذا المشروع.

البحث يحركها هدف: هي معايير الاعتراف والتقييم ترتبط ارتباطا وثيقا الهدف النهائي. تجنب تقييم شخصي

فرضية يحركها البحث: فرضية، تحقق من توافر الشروط في ظل افتراضات واسعة، مقارنة مع نتائج مماثلة، ولكن ليس مقارنة مع النتائج الأكثر تقدما. من المهم أن نفهم النتائج، بدلا من السعي التصنيف العالمي.

2، قرار قابلية الخوارزمية ناجحة

تشير قابلية للخوارزمية التدرج مع أداء الموارد. الموارد هنا قد يكون الحوسبة والتخزين والبيانات. تحدد قابلية الخوارزمية ما إذا كان نجاح المشروع، هو دائما تقريبا أكثر أهمية من نقطة الانطلاق من الخوارزمية. في النهاية، وهي جيدة خوارزمية دائما الحل الأمثل في ظل ظروف من موارد غير محدودة.

3، مستقرة براعة خوارزمية

يشير الخوارزمية العامة لخوارزمية على أعماق مختلفة تعلم أداء البيئة. تجنب الإفراط في تركيب لهذه المهمة في متناول اليد. بنشاط تسعى الخوارزمية يمكن تطبيقها على بيئة المستقبل المجهول.

والخلاصة: أن التحقق من صحة على نطاق واسع، تعيين واقعية بيئة تعلم الآلة.

4. تجربة الثقة وكيل

تشير تجربة (بما في ذلك المراقبة، والعمل، ومكافأة) لتعلم عمق البيانات. ثق هذه التجارب على أنها المصدر الوحيد للمعرفة. وعلى الرغم من هذه التجارب على ما يبدو ليس للتعلم، ولكن في نهاية المطاف على المدى الطويل، فإن تجربة النجاح في نهاية المطاف.

5، والدولة هي ذاتية

وينبغي أن يستند عامل على خبرة لإقامة دولة خاصة بهم، وكيل الدولة هو على وظيفة السابقة للدولة وبيانات رصد جديدة. لا تحدد أي وقت الدولة "الحقيقية" في ظل ظروف معينة.

تدفق 6، بيانات التحكم

البيانات الكبيرة تتدفق كيل جهاز استشعار في البيئة، والسلوك سيتسبب البيانات تيارات وكيل النفوذ.

يتميز التحكم - تدفق بيانات التحكم - التحكم في المستقبل - لتعظيم أي عودة.

7، وقيمة وظيفة يمكن أن تكون على غرار العالم

وظيفة قيمة للمستقبل تحريض كفاءة وذاكرة التخزين المؤقت. العثور على مزيد من الاهتمام ثابتة فترة من الزمن، وليس بشكل كبير إلى الأمام. ويمكن أن يحسب بشكل مستقل والتعلم. باستخدام وظيفة متعددة القيم يمكن أن يكون، لجميع جوانب كفاءة العالم النمذجة في أطر زمنية مختلفة.

تجنب استخدام خطوة الوقت الأصلي من العالم النمذجة.

8، والتعلم من تجربة من الخيال

تخيل ماذا سيحدث بعد ذلك، والتعلم من تجربة من الخيال، في حين تشعر بالقلق إزاء القيمة المقدرة للوظيفة في الوقت الحالي.

9، وتعزيز وظيفة مقراب

الاختلافات في بنية الشبكة هو أداة قوية التي يمكن استخدامها: لإثراء طريقة تمثيل تخزين الدولة لتحقيق التمايز، والتخطيط والتمايز، والسيطرة الهرمية.

تعقيد الخوارزمية في هندسة الشبكات يمكن أن تقلل من تعقيد الخوارزمية، لزيادة التعبير من هندسة الشبكات.

10، لمعرفة "كيفية التعلم"

تاريخ تطور الذكاء الاصطناعي تظهر سياق التنمية واضح.

الجيل الأول: "جيد" الذكاء الاصطناعي من الطراز القديم. السيطرة توقعات اليدوي، لا تعلم أي شيء.

الجيل الثاني: التعلم الضحلة. حيث والتحكم اليدوي، والتعلم التنبؤ.

الجيل الثالث: عمق التعلم. دليل خوارزمية التحكم (محسن، والأهداف، والهندسة المعمارية)، وخصائص التعلم ونهاية إلى التنبؤ.

الجيل الرابع: دراسة ميتا. لا علاقة اليدوية، والخوارزميات، وميزات، والتعلم نهاية إلى التنبؤ بها.

مرجع الارتباط: الشبكي: //twitter.com/DeepIndaba/status/1040234486250782721

الحب لقتل واحد! وقد اتهم بايرن ميونيخ 80 مليون مساعدات جديدة مع العنف المنزلي، والآن تريد أن تذهب إلى ألمانيا مع زوجته

الخير للشر! Shukuluofu أمل Hengda تخفيف العقوبة، وي شيهاو ملاحظات أكثر تقشعر لها الأبدان

إحصاءات: من يناير إلى أكتوبر، ومعدل سوق العقارات وطني النمو الإجمالي انخفاضا طفيفا

اللاعبين الدراسات الدجاج صورة: ألف اللاعبين، ألف أسلوب الدجاج (تقرير)

! نادر مقاطع داوننغ ستريت شنقا الفوانيس للاحتفال بالسنة القمرية الصينية الجديدة

أعلن مدافع يوفنتوس البالغ من العمر 24 عاما لمدة أربع سنوات العقد، ومثير صديقة له لا تأتي إلى الدوري الممتاز

تبادل لاطلاق النار دونغهو العالم الذي لم أر، "شرق بحيرة" أفلام الحضرية مكشطة "ووهان دائرة من الأصدقاء."

حمل شياو يوان: "أغاني تسعة" - نظام الجيل التلقائي استنادا إلى دراسة متعمقة من الشعر الكلاسيكي الصيني

ركض واحد؟ تشنغدو جودينج الديكور زيادة انتشار مليون للمشاريع التي عليها متأخرات، صاحب فقدت الاتصال!

حصريا | بتدريبك على تنظيم مشروع العلوم البيانات! (مع الكود)

صنع الدوري الإسباني - ديولوفو هدفين ، برشلونة 2-0 ، تمريرة بيل ، شويي يصبغ الأحمر ريال مدريد 3-0.

"تقنية MIT مراجعة" 2017 أعلى قائمة عشرة من التكنولوجيات المتقدمة