أصدقاء الفقراء، هل سمعت مشاركة دوتا 2 الايجابيات الديندي هو openAI خص قصة الفوز؟
بالإضافة إلى دوتا 2، يتم التقاط حتى هذه اللعبة القديمة من العودة أيضا منظمة العفو الدولية. . .
في الواقع، AI عندما لعب دوتا 2 وغيرها من الألعاب يمكن أن تكون وسيلة ناجحة من الحساب، مثل مهارات الباليستية زمن الرحلة، وحجم الاصطدام، وهلم جرا.
ولكن واقع الحياة في مشاهد معقدة المستخدمة في منظمة العفو الدولية، مثل التعرف على الصور وهلم جرا، في الواقع، تعتمد على عينات زائد وهناك الكثير من التجربة والخطأ تدريب.
حتى على الأنبوب الرئيسي وكتب كود رصاصة لمنظمة العفو الدولية في محاولة للتغلب على "أصعب لعبة في العالم" يدعى.
الفرق بين هذه اللعبة وبعض الأصدقاء قد تلعب أيضا، طالما
الغرض من اللعبة هو بسيط جدا، وذلك باستخدام لوحة المفاتيح لمعالجة مربع أحمر، فإنه ذهب إلى يمين المنطقة الخضراء من الجهة اليسرى للمنطقة الخضراء، وضرب الكرة الزرقاء حتى فقدت.
يبدو أن الرقم الصعب، بدء التشغيل الفعلي هو غاية الشعر المقلية، لأن الساحة الحمراء بطيء.
وهذا مجرد أول عقبة، كما ترقية مستويات صعوبة يمكن أن يرتفع إلى هذا
يتطلب المستوى الفردي أيضا لاعب لتشغيل مربع، وتناول الكرة الصفراء الصغيرة في الزاوية اليمنى السفلى كما هو موضح أدناه، ثم ذهب إلى قطع تعتبر إزالة الأخضر.
إذا كانت منظمة العفو الدولية أن تفعل؟
من أجل تدريب AI، نحتاج أولا إلى بناء مشهد.
هذا السيناريو هو بسيط جدا، وهذا هو مجموعة من الخطوط والألوان.
بالإضافة إلى بعض ذهابا وإيابا الحركة على الكرة الصغيرة الزرقاء.
وأخيرا إضافة مربع، تعيين حول الوجهة.
وسوف تجد قطعة حمراء وزرقاء مباشرة من خلال الجدار للوصول إلى نقطة النهاية، وهي مهمة جيدة لإكمال.
اه، ولكن هذا ليس معناه: لا قواعد اللعبة اللعبة كاملة دون لعب.
القاعدة رقم واحد: قطع حمراء لا يمكن تشغيل من الخط الأسود.
لذا هامش العطاء بالإضافة إلى منطق "التصادم".
القاعدة رقم اثنين: قطع الحمراء لقاء كرة السلة يعتبر الفشل.
التالي هو الحدث الرئيسي، وكيفية تدريب AI.
والفكرة الأساسية هي هذه: دعونا مربع، على مسافة في اتجاه عشوائي، وإذا كان ميتا، ثم في المرة التالية التي لا يمكن تتبع نفس المسار.
أولا وقبل كل شيء، حتى أن كل لاعب AI تليفون 100 من أجل كفاءة القطار، وإطلاق 500 لاعب AI كرر تلعب هذه اللعبة، "ميتة" ضوء استبدال الجولة، و تجنب تعمل على خطأ.
ولكن اللعب لفترة طويلة تفتقر إلى التقدم، سوى عدد قليل محظوظا أن أهرب قليلا.
وضع علامة على أفضل أداء من المربعات الصغيرة في الأخضر
هذا AI تعلمت فقط لتجنب الخطأ، لا يوجد أي تقدم، فإنه لا يمكن اعتبار في الدراسة.
لذلك، لتحسينه:
1. ابتداء مجرد السماح AI نقل 10 مرات.
2. بعد 10 مرات، مباشر "قتل" لاعب لا تصل إلى طريق مسدود.
3. كل 5 جولات، ومنظمة العفو الدولية تعطي الفرصة للتحرك خمس مرات، وهذا هو 6--10 عجلة يمكن نقل 15 مرة، ويمكن 11--15 العجلات تتحرك 20 مرة.
ونتيجة لذلك، فإن منظمة العفو الدولية لم تصل فقط النقطة الزرقاء لتجنب الطريق، ولكن أيضا لتجنب إنفاق أكثر عدد من طريق المحمول.
كما تقدمات التدريب، يمكنك ان ترى معظم كتلة حمراء يمكن تشغيلها من نقطة البداية -
بعد ما يقرب من 50 تكرارات، كتلة حمراء انتهت في نهاية المطاف من الدور الاول. . .
مع طريقة مماثلة، يمكن للمستويات أكثر صعوبة أيضا الحصول على المشي غنج ~
"الفشل أم النجاح" سوف تكون فكرة المركزية في هذه العملية التدريبية. . .
في الواقع، وهذا ليس AI صحيح.
اللاعبين الكمبيوتر التي تسيطر عليها فقط تذكر الطريق البشر لا تشبه فهم القواعد في اللعب.
ومع ذلك، هذا التدريب تحيط استفادة كاملة من ذاكرة الكمبيوتر جيدة، وليس خائفا من التعب وهلم جرا.
في هذه الدعوة فإننا الطريق آلة التعلم ، لا يبدو ذلك "ذكية"، في الواقع، يتم تدريب معظم التطبيقات AI في الحياة لذلك.
في الواقع، ليست معقدة المبدأ الكامن وراء التكنولوجيا الفائقة.