100 مرات طالما فروع شنقا، وسوف تكون قادرة على اختبار 100 نقطة

أصدقاء الفقراء، هل سمعت مشاركة دوتا 2 الايجابيات الديندي هو openAI خص قصة الفوز؟

بالإضافة إلى دوتا 2، يتم التقاط حتى هذه اللعبة القديمة من العودة أيضا منظمة العفو الدولية. . .

في الواقع، AI عندما لعب دوتا 2 وغيرها من الألعاب يمكن أن تكون وسيلة ناجحة من الحساب، مثل مهارات الباليستية زمن الرحلة، وحجم الاصطدام، وهلم جرا.

ولكن واقع الحياة في مشاهد معقدة المستخدمة في منظمة العفو الدولية، مثل التعرف على الصور وهلم جرا، في الواقع، تعتمد على عينات زائد وهناك الكثير من التجربة والخطأ تدريب.

حتى على الأنبوب الرئيسي وكتب كود رصاصة لمنظمة العفو الدولية في محاولة للتغلب على "أصعب لعبة في العالم" يدعى.

الفرق بين هذه اللعبة وبعض الأصدقاء قد تلعب أيضا، طالما

الغرض من اللعبة هو بسيط جدا، وذلك باستخدام لوحة المفاتيح لمعالجة مربع أحمر، فإنه ذهب إلى يمين المنطقة الخضراء من الجهة اليسرى للمنطقة الخضراء، وضرب الكرة الزرقاء حتى فقدت.

يبدو أن الرقم الصعب، بدء التشغيل الفعلي هو غاية الشعر المقلية، لأن الساحة الحمراء بطيء.

وهذا مجرد أول عقبة، كما ترقية مستويات صعوبة يمكن أن يرتفع إلى هذا

يتطلب المستوى الفردي أيضا لاعب لتشغيل مربع، وتناول الكرة الصفراء الصغيرة في الزاوية اليمنى السفلى كما هو موضح أدناه، ثم ذهب إلى قطع تعتبر إزالة الأخضر.

إذا كانت منظمة العفو الدولية أن تفعل؟

من أجل تدريب AI، نحتاج أولا إلى بناء مشهد.

هذا السيناريو هو بسيط جدا، وهذا هو مجموعة من الخطوط والألوان.

بالإضافة إلى بعض ذهابا وإيابا الحركة على الكرة الصغيرة الزرقاء.

وأخيرا إضافة مربع، تعيين حول الوجهة.

وسوف تجد قطعة حمراء وزرقاء مباشرة من خلال الجدار للوصول إلى نقطة النهاية، وهي مهمة جيدة لإكمال.

اه، ولكن هذا ليس معناه: لا قواعد اللعبة اللعبة كاملة دون لعب.

القاعدة رقم واحد: قطع حمراء لا يمكن تشغيل من الخط الأسود.

لذا هامش العطاء بالإضافة إلى منطق "التصادم".

القاعدة رقم اثنين: قطع الحمراء لقاء كرة السلة يعتبر الفشل.

التالي هو الحدث الرئيسي، وكيفية تدريب AI.

والفكرة الأساسية هي هذه: دعونا مربع، على مسافة في اتجاه عشوائي، وإذا كان ميتا، ثم في المرة التالية التي لا يمكن تتبع نفس المسار.

أولا وقبل كل شيء، حتى أن كل لاعب AI تليفون 100 من أجل كفاءة القطار، وإطلاق 500 لاعب AI كرر تلعب هذه اللعبة، "ميتة" ضوء استبدال الجولة، و تجنب تعمل على خطأ.

ولكن اللعب لفترة طويلة تفتقر إلى التقدم، سوى عدد قليل محظوظا أن أهرب قليلا.

وضع علامة على أفضل أداء من المربعات الصغيرة في الأخضر

هذا AI تعلمت فقط لتجنب الخطأ، لا يوجد أي تقدم، فإنه لا يمكن اعتبار في الدراسة.

لذلك، لتحسينه:

1. ابتداء مجرد السماح AI نقل 10 مرات.

2. بعد 10 مرات، مباشر "قتل" لاعب لا تصل إلى طريق مسدود.

3. كل 5 جولات، ومنظمة العفو الدولية تعطي الفرصة للتحرك خمس مرات، وهذا هو 6--10 عجلة يمكن نقل 15 مرة، ويمكن 11--15 العجلات تتحرك 20 مرة.

ونتيجة لذلك، فإن منظمة العفو الدولية لم تصل فقط النقطة الزرقاء لتجنب الطريق، ولكن أيضا لتجنب إنفاق أكثر عدد من طريق المحمول.

كما تقدمات التدريب، يمكنك ان ترى معظم كتلة حمراء يمكن تشغيلها من نقطة البداية -

بعد ما يقرب من 50 تكرارات، كتلة حمراء انتهت في نهاية المطاف من الدور الاول. . .

مع طريقة مماثلة، يمكن للمستويات أكثر صعوبة أيضا الحصول على المشي غنج ~

"الفشل أم النجاح" سوف تكون فكرة المركزية في هذه العملية التدريبية. . .

في الواقع، وهذا ليس AI صحيح.

اللاعبين الكمبيوتر التي تسيطر عليها فقط تذكر الطريق البشر لا تشبه فهم القواعد في اللعب.

ومع ذلك، هذا التدريب تحيط استفادة كاملة من ذاكرة الكمبيوتر جيدة، وليس خائفا من التعب وهلم جرا.

في هذه الدعوة فإننا الطريق آلة التعلم ، لا يبدو ذلك "ذكية"، في الواقع، يتم تدريب معظم التطبيقات AI في الحياة لذلك.

في الواقع، ليست معقدة المبدأ الكامن وراء التكنولوجيا الفائقة.

طريق الحرير

100 مرات طالما فروع شنقا، وسوف تكون قادرة على اختبار 100 نقطة

المياه العميقة P2P، وبالتالي فإن الدراما لم يجرؤ على كتابة آه!

أقراط هذا اختيار أفضل من قطع العظام وجهه!

العلماء المسيل للدموع قوة كيف الرهيبة؟ الشعر يخدع ذهب!

هذا الصيف الصنادل اللباس + لارتداء هذا، أن لا شيء هو نفسه!

"" عرض S "إلى الانخراط في الأشياء التي تحرق الدماغ الترويجي حلقة! أخي نورس لاخراج النجوم قليلا أصدقاء اللغز

هذه الدائرة التحديث الصغير من الأصدقاء، الذين ربما هو روح مرسومة باليد الوجهة النهائية

2018 هذا 5 = شورت طويل القامة طويل القامة، رقيقة، رقيقة الولايات المتحدة، والولايات المتحدة، والولايات المتحدة الولايات المتحدة في الصيف!

هذا الصيف على هذه الأنواع من مصبوغ لون الشعر، جميلة جدا!

أعمال التركيب تكييف الهواء هو "قوية بيع" الهاتف GREE، والوقوف B لUP مورد للكهرباء في توفير الخدمات

مساهمة بارزة لموظفي الاصلاح والانفتاح: الإصلاح تحية والانفتاح على خلق فرص عمل جديدة رائعة

الأكثر شعبية 2018 الأحذية المسطحة الصيف هي ......

هذه الأطباق لا شطف مع الماء مباشرة، وأكثر غسل أكثر القذرة ~

في أوائل الصيف أجمل أربعة تنورة 18، والثاني هو الولايات المتحدة الذي هو من ارتداء!

اشتريت هذا أستون مارتن، وأنا جاسوس 007!

دونغ لي هوانغ تينغ تينغ تلو الآخر في سلة "الصورة تظهر" لماذا ترك النجوم على استعداد لفضح وزن الجسم؟

بعد 95 طالبات الجامعات، لتطوير مقاطعة أغنى رجل يانغ كون، وهذا الصغير إعلان إلكتروني شبح!

لا ارتداء زوج من الجوارب! 2018 معظم الجينز شعبية، شوطا طويلا!

فستان + حذاء، الصيف هو 18 معظم المد المباراة الأكثر إلحاحا!

هو جين تاو يونيو جين تشن "الأب وابنته ملف" لعب دور البطولة في "ليتل العشاق"، سمعت "الأسرة الدراما حرب التجسس"

الصيف ارتداء اللون الأبيض ومزاجه أهم!

ارتفاع 40 عاما منحت 30 عالما عنوان "الإصلاح رائدة"

مدى شعبية الممثلة الوثب الثلاثي؟ يوان شانشان "بظلاله على القمة" حوالي الترفيه النجاح إجباري

الأحكام ذات الصلة