"2017 أفضل ورقة تعلم الآلة" الأكثر إرضاء AlphaGo صفر

 الأنفس جي عمود جديد

الكاتب: تانغ كان

[استعراض فاز جي الجديدة عام 2017، هل قراءة الأكثر إثارة للاهتمام، ومعظم تعلم الآلة قيمة / AI أطروحة هي، لماذا؟ الدكتور نائب الرئيس الروبوت جامعة كارنيجي ميلون كلية علوم الحاسب الآلي معهد كان دنغ، 2017 افتتح عمود جديد في جي وون، وتفكيك العديد من الصحف. من له معظم ارضاء، القيمة الأكثر عملية وإمكانات هذا معظم الاتجاهات عدة، ويعطي جوابه.

وقبل بضعة أيام مع المعلم يانغ جينغ والمعلم ليو جيانغ، عام 2017 لمناقشة التقدم المحرز في الذكاء الاصطناعي عندما، في عام 2017 لم يكن لدينا الوقت لنقول الصحف الأكثر قراءة.

"ما هو معظم ورقة بقيمة القراءة"، هذا الموضوع عيني الناظر يرى الحكمة الحكمة.

الآن، وأنا شخصيا أعتقد أن أكبر حديث عن أطروحة الحصاد لهذا العام:

  • أكثر ارضاء: اتقان لعبة من العودة دون معرفة الإنسان

  • أكثر قيمة العملية: الاهتمام هو كل ما تحتاج واحد نموذج لمعرفة كل منهم

  • معظم الإمكانات البحثية: فوق طاقة البشر AI لرؤساء متابعة بلا حدود لعبة البوكر: Libratus يدق كبار المهنيين

أكثر رقة ارضاء

اتقان لعبة من العودة دون معرفة الإنسان هي ورقة فريق DeepMind على AlphaGo الصفر، التي نشرت في دورية نيتشر العلمية.

عند قراءة هذه الورقة، لشرح DeepMind سابقا AlphaGo من ورقة أخرى، وقراءة جنبا إلى جنب. تلك الورقة موضوع، اتقان لعبة الذهاب مع الشبكات العصبية العميقة وشجرة البحث .

قارن هذه الورقتين، وإصدار خوارزمية AlphaGo من AlphaGo صفر من السابق، أكثر دقة، ولكن أكثر قوة. وأوراق AlphaGo صفر، كتب أكثر إثارة. وخاصة من قبل لعبة AlphaGo صفر يصف نفسه، وقضيت عدة ساعات وجدت العودة-مجموعة. استغرق الأمر الشطرنج أيام كثيرة، قد هزم AlphaGo صفر فان هوى ولي سي دول وهلم جرا.

ممارسة أوراق الأكثر قيمة (اثنين)

الانتباه هو كل ما تحتاج واحد نموذج لمعرفة كل منهم الصحيفتان هي عمل فريق Google الدماغ، وجميع شفرة المصدر مفتوحة المصدر، وسهلة الاستخدام.

واحد نموذج لتعلم كل منهم أوراق الصور

إذا كان عمق التعلم، وخاصة الأكاذيب قيمة CNN في استخدام خوارزمية الإلتواء لاستخراج تلقائيا الميزات من البيانات الخام، بدلا من أن تكون عن طريق اصطناعية لاستخراج يتميز كما كان من قبل. الاهتمام ثم قيمة هذا انعكاس الإلتواء. الإلتواء ليست الطريقة الوحيدة لاستخراج الميزات، ولكن ليس بالضرورة أفضل وسيلة. يعتقد فريق Google الدماغ، الاهتمام في معظم الحالات، قد يكون أكثر فعالية من الالتواء.

وحتى الآن، الاهتمام الخطية خوارزمية تقدير على أساس الأغلبية من التشابه. وأعتقد أن بداية العام المقبل، سيكون هناك المزيد من الأبحاث، تركز الاهتمام على التحول من الخوارزمية، حاول التشابه غير الخطية، وحتى أبعد من التشابه، وتبحث عن وسيلة أكثر تركيزا.

معظم اتجاهات البحوث واعدة

فوق طاقة البشر AI لرؤساء متابعة بلا حدود لعبة البوكر: Libratus يدق كبار المهنيين وجامعة كارنيجي ميلون فريق حول نظام الذكاء الاصطناعي Libratus ألمانيا رفرفة من الأبحاث المنشورة في مجلة ساينس العلمية.

ألمانيا تقريع ومكافحة الغش تواجه مشكلتين المعلومات الخفية أقرب إلى لعبة في العالم الحقيقي من لعبة الداما.

حديد التسليح AlphaGo التعلم مع العمق، والحل الأمثل لمشكلة الشطرنج. المعلق المقبل، هو عمق تعزيز التعلم يمكن أن تحل مشكلتين المعلومات الضمنية والاحتيال. ومن المثير للاهتمام، Libratus أي تعزيز التعلم مع العمق، ولكن لا يحل بدلا بدقة المشاكل على حد سواء. العام المقبل التشويق والزملاء DeepMind، والقدرة على تجاوز Libratus مع عمق تعزيز التعلم؟

ملاحظة المحرر

2017 أفضل ورقة تقرأ ما هو؟ نرحب الرسائل، يمكننا مناقشة -

مربع مزيد من القراءة: قراءة النص القهوة كبيرة سلسلة أوراق

  • [اقرأ المقال] خوارزمية AlphaGo صفر العامية مونت كارلو شجرة البحث وResNet

  • [ما هو] بعد قراءة مقال AlphaGo تقريع الذكاء الاصطناعي للعب ألمانيا

  • [اقرأ المقال] مجموعة دراسة Bengio آخر ورقة خريطة شبكة الاهتمام GAT، كمدخل لتعيين عمق تعلم أن تفعل

  • تفسير Bengio ملاحظة: مع نموذج العميق التعلم، تفكيك وإعادة بناء العقل البشري

  • DeepMind تقنيات آلة NLP لفهم استنساخ النص وتحليل

  • حيث عمق تعزيز التعلم "العميق" في؟

  • الأب، عار عليك!

    نص للقراءة، ما هو OKR

    قد لاوس عدت للتو واقول لكم لاوس الحقيقية!

    الشرطة زي النار حاسم سكين (الفيتو) رجل، وتستحق هذه العملية موجة في جميع أنحاء البلاد!

    2019، أكبر مجموعة عرقية تعرف باسم شباب المدينة

    الرئيس التنفيذي لشركة علي تشانغ يونغ: منذ 6 سنوات، وقدم لي ما ثمانية بالكلام، واسمح لي ما يكفي جيدة حتى الآن

    9 احزاني "المعدة الأسرة،" أريد أن أشتري على الفور تذكرة العودة إلى المنزل!

    الصغرى قناة فتح البوابة برنامج صغير، وكيفية الاستفادة من التجزئة الجديدة؟

    التسويف الذاتي الخلاص: من ثلاث دقائق في اليوم لبدء

    99 من الناس تفوت لأن هوكايدو! اليابان الجلوس الذي لا يقهر على الثلج، وهو مظهر مذهل عدد لا يحصى من الناس

    اعتقلت الشرطة قوانغشى تجار المخدرات الهارب امرأة الفيتنامية

    "بعد عصر قناة الصغرى فرشاة تحديد الوجه" صور داخل لماذا لا يمكن أن الكراك وجه النظام