تحولت أقوى AlphaGo خارج، والتخلص من الإنسان الذاتي ثلاثة أيام، 100: 0 الهزيمة "كلب كبير في السن"

الرد الحوار "نص الساخن" عرض "تخطيط الاقتصادي الصيني"

المصدر: وول ستريت المعرفة (الجزئي إلكتروني ID: wallstreetcn)، المؤلف: يو شيانغ قليلا. للحصول على معلومات أكثر إثارة، يرجى زيارة wallstreetcn.com، أو تحميل وول ستريت المعرفة APP.

رحبت منظمة العفو الدولية معلما.

بكين الساعة 01:00 على 19، أعلنت شركة جوجل فريق من شركة الذكاء الاصطناعي DeepMind أقوى نسخة AlphaGo، التي أطلق عليها اسم AlphaGo صفر.

بقعة مشرقة هي أن، AlphaGo صفر يمكن التخلص من المعرفة البشرية "العصاميين" دون توجيه البشري يمكن أن تسمح لنفسها ان تكون معلمهم.

أول شخص في العالم لكه العودة نظيفة بشكل أكثر وضوحا، وهذا هو الأقوى AlphaGo، لAlphago من حيث التحسين الذاتي، وأكثر من ذلك بكثير من الإنسان.

1

حتى الآن أقوى AlphaGo: لا تستخدم المعرفة الإنسانية

في مايو من هذا العام إلى 3: كه جي بعد اللاعبين الصينيين للفوز في النتيجة 0، أعلن AlphaGo تقاعده، ولكن لم DeepMind لا البحوث إيقاف.

اليوم، في ورقة بحثية نشرت في المجلات الأكاديمية الدولية "الطبيعة" (نيتشر) في، Deepmind عن النسخة الجديدة من برنامج AlphaGo صفر: لنتعلم من دولة فارغة، دون أي شروط مدخلات الإنسان والتي بموجبها الذاتي العودة بسرعة، و 100: 0 سجل هزيمة "كبار السن".

DeepMind هذه الورقة أحدث الطبيعة، هناك عنوان بسيط - "لا تستخدم المعرفة البشرية إلى السيطرة على العودة".

أفضل اللاعبين في العالم لتطوير وغالبا ما يستغرق عقودا من التدريب، وشحذ. لكن AlphaGo صفر إنشاء سجل: 3 أيام.

ثلاثة أيام فقط، AlphaGo صفر الخاصة الشطرنج سيد ترجل، اخترع أيضا خطوة أفضل. خلال هذه الفترة، بالإضافة إلى القواعد الأساسية للعبة الشطرنج وقيل أنه من أصل البيانات الرجل الكبير، وليس للحصول على مساعدة الإنسان أو الشطرنج البشري.

AlphaGo صفر العودة المعرفة المكتسبة (المصدر: ورقة DeepMind)

بعد ثلاثة أيام فقط من التدريب الذاتي، AlphaGo صفر لهزيمة إرث قوي لانتصار السابق على لي شيشي AlphaGo، سجل 100: 0.

بعد 21 يوما من التدريب الذاتي، وصلت AlphaGo صفر مستوى AlphaGo ماستر.

"ماستر" لقد هزم لاعبين أعلى الشطرنج في العالم، بما في ذلك رقم واحد في العالم وحتى كه جي.

في وقت لاحق بعد 40 يوما، AlphaGo صفر يحصل بالفعل 90 في المئة نسبة الفوز في جميع إصدارات أخرى من AlphaGo في لعبة الشطرنج.

وقال AlphaGo الباحثين ديفيد سيلفا (ديفيد فضية)، "لأنه لم يتم إدخال البيانات إلى لاعبين الإنسان، AlphaGo صفر قوة من الإصدار السابق، أزلنا حدود المعرفة البشرية، فإنه يمكن خلق المعرفة الخاصة بهم."

2

AlphaGo صفر جدا "منخفض الكربون"، فقط 4 TPU

ومن الجدير بالذكر أن AlphaGo صفر أيضا للغاية "منخفض الكربون"، يستخدم الجهاز فقط واحد وأربعة TPU (جوجل خصيصا لDNN لتسريع البحث والتطوير من الحوسبة رقائق الطاقة)، تحقيق وفورات كبيرة في الموارد.

AlphaGo الإصدار السابق، قبل الانتصار على خبراء متخصصين العودة البشري، والتي بعد عدة أشهر من التدريب، والاعتماد على آلات متعددة و48 TPU.

ووفقا للتقارير، يستخدم AlphaGo صفر طريقة تعزيز التعلم الجديد، من الشبكة العصبية لا يعرف قواعد اللعبة بدأت في الذهاب، ثم الشبكة العصبية عن طريق الجمع بين خوارزمية البحث قوية، ثم يمكنك تحقيق الشطرنج الذاتي. في سياق هذا التدريب، يتم تحديث الشبكات العصبية وتعديلها واستخدامها للتنبؤ الخطوة التالية Lazi والفوز النهائي أو الخسارة.

بعد هذا التحديث سوف مرة أخرى بالبحث عن خوارزمية الشبكة العصبية جنبا إلى جنب مع هذه العملية المتكررة لإنشاء نسخة جديدة، أكثر قوة من AlphaGo صفر. في كل التكرار والأداء وجودة هذا النظام هي لعبة الشطرنج النفس يمكن أن تحسن بعض.

ما يسمى ب "يوم اللدود جندي، وليس تانغ التبرع العمل"، والشبكات العصبية النهائية أكثر وأكثر دقة، أصبح AlphaGo صفر أقوى وأكثر كفاءة في استهلاك الطاقة.

3

العودة هو مجرد بداية، ومستقبل AlphaGo صفر

ظهور AlphaGo صفر ليس فقط النجاح نفسه على الذهاب، وهذا علامات تنمية معلما طالبة تنمية عالمية AI.

بالإضافة إلى لعب الشطرنج وون الإنسان، يمكن عالمية AI بذل المزيد من الأشياء. منذ AlphaGo صفر لتحقيق الذات علم من الجاهلين، والآن هذه الموهبة يمكن أن تأتي في متناول اليدين في كثير من المسائل العملية.

حاليا التعلم العميق يتطلب الكثير من البيانات، والبيانات التي حصلت عليها التكلفة العالية وصعوبة كبيرة جدا، والعمق مع هذه التكنولوجيا، بشرية في المستقبل سيكون من الممكن للتحديات أكبر عنوان لحياة الإنسان أحدثت تغييرات جوهرية.

ديميس حاسابيز DeepMind الرئيس التنفيذي اعترف التي تستخدم بالفعل هذه التكنولوجيا في حل العديد من المشاكل في الحياة الحقيقية. قد تشمل مجموعة وشكل جزيئات البروتين متوقعا، ومن المتوقع أن تصبح انفراجة كبيرة في اكتشاف الأدوية، ومواد جديدة، ويمكن أيضا أن تكون مصممة لنمذجة المناخ.

Hassabis أنه في السنوات العشر القادمة، سوف AlphaGo تكرار المنتجات أصبح العلماء والخبراء الطبيين الذين يعملون جنبا إلى جنب مع البشر، سيكون من الممكن لإنتاج تأثير جوهري على حياتنا.

يرجى الرد على طبع أذن لعرض تعليمات

شيانغ يو، مدير المركز الإعلامي الجديد

وول ستريت المعرفة الدقيقة الرسالة الرسمية (ID: wallstreetcn)

أحببت هذا المقال هي موضع ترحيب لالأمام، واعترض دعم المعرفة يونيو

المعرفة وول ستريت قمة الاستثمار العالمي كبيرة قهوة تشكيلة أطلب منك أن مجموعة!

تسلا شنغهاي لتوليد الطاقة الكهربائية دعم الأمامية من سبتمبر

يشوبه من الرجال والنساء الوجه لا داعي للذعر! "الصغيرة مرهم، نمط القضاء بعد 2 أسابيع، كل يوم الحكمة

امرأة الأكثر أهمية هو اختيار مناسب لأحمر الشفاه الخاص بك، بحيث يمكنك أن تصبح ثواني براقة

كل من الرجل والمرأة: ليلة بعد لمحو مرهم قليلا، أسابيع، الجلد ودسم، مع الناس الذكية بهدوء

لا يقل عن سبعة مخازن على النار! وول مارت دعوى قضائية ضد تسلا

ليس سيئا المال، وامرأة، لديك لشراء هذه الأنواع من منتجات العناية بالبشرة، أقسام هي القوة، وأفضل من الأسماء الكبيرة

ما التجاعيد على وجهه الذعر! "مرهم الصغيرة أسابيع قليلة لاحق نمط القضاء، والمرأة الجميلة هي بهدوء مع

بعد الانتصار، المجنسين لكرة القدم لاعبين في الناس عمل القلب الدافئ

كيم Aeran "الصيف الخارجي": رسم خريطة الوضع الراهن الاجتماعي، ولكن أيضا الحياة "مشكال"

هذا هو التوافق وول ستريت: انها حقا فقاعة! جولدمان ساكس: اسمحوا يطير الرصاص مرة أخرى لفترة من الوقت

لا داعي للذعر إذا كانت خطوط على وجهه بعد ليلة هذا القليل مرهم فرك أو أسابيع، وليس العامية، والعطاء وبشرة بيضاء