القوة فقط يمكن ان يوفر المشغلين على نطاق واسع AI؟ تعزيز والد التعلم مقابل أستاذ أكسفورد تقلع الجدل

آن تجف من الجزء السفلي من العطلة المنتجة غير معبد و qubit | العامة رقم QbitAI

70 عاما، والناس في مجال AI "لقد كان صنع المستمر نفس الخطأ ".

هذا هو "تعزيز التعلم" الأب ريتشارد ساتون (ريتشارد S. ساتون) النظير جيل الشباب الذين دقت ناقوس الخطر.

له آخر مقالة نشرت على بلوق " الدرس المرير "(الدرس المر)، ويلخص تاريخ دورة تطوير AI:

حاولنا باستمرار لزرع معارفهم وطريقة التفكير في منظمة العفو الدولية، مثل تعليم الشطرنج منظمة العفو الدولية مع التفكير البشري، وفقا لمنظمة العفو الدولية الإنسان سيجعل ملخص الأفكار لتحديد صورة وهلم جرا. ويمكن لهذه الممارسات تجلب تعزيز الأداء مؤقت، على المدى الطويل سوف تعيق تقدم البحوث الجارية.

اختراق حقيقي، دائما من الاتجاه المعاكس. التخلي عن المعرفة الإنسانية في منطقة معينة، واستخدام واسع أسلوب القوة الحساب دائما الحصول على النصر النهائي.

الاعتماد على المهارات الشطرنج العودة-هدأ النفس AlphaGo، استنادا إلى الأساليب الإحصائية، خوارزمية التعلم عميقة للاعتراف الصوت، الصورة، مرارا وتكرارا بضرب تلك المركزة سابقا المعرفة البشرية من منظمة العفو الدولية، حتى الرجل نفسه.

بحث والتعلم والاستفادة الكاملة من حساب القوة الهائل هو الملك. القدرة على استخدام المعرفة الإنسانية في مجالات محددة لتحسين عامل AI، هي في الطرق الالتفافية.

وقال ساتون: "إن منظمة العفو الدولية وبناء على فهمنا لطريقته في التفكير، لن العمل."

OpenAI كبير العلماء ايليا Sutskever لخص ببراعة عن الأفكار الأساسية للساتون: عدد القوة المنتصرة.

أصدر ورقة، فإنه أثار مناقشات ساخنة، OpenAI CTO جريج بروكمان، تسلا AI مدير أندريه Karpathy، الذين كانوا على حد سواء في إعارة إلى الأمام.

أستاذ جامعة DeepMind وآلة التعلم قائد فريق أكسفورد ناندو دي فريتاس حتى يطلق عليه "عطلة نهاية الأسبوع لا بد منه للقراءة".

ومع ذلك، هناك أصوات معارضة.

أستاذ علوم الحاسب في جامعة أكسفورد شمعون Huaite سين (شمعون Whiteson) 13 رشقات نارية من تويتر لدحض نقطة ساتون وجهة نظر، وهو ما يعني "لا أوافق بشدة" ، كما تلقى الكثير من الدعم.

يعتقد Huaite سين أن بناء AI تحتاج بالتأكيد إلى الاندماج في المعرفة الإنسانية، والسؤال الوحيد هو متى وكيف وماذا المعرفة إلى.

AI هو عملية تاريخية للاندماج في انتصار المعرفة الإنسانية. العلماء يحاولون على نطاق واسع، فشلت في التخلي عن 99، وترك مفيدة واحد في المئة. هذه 1، والكثير من الموارد الحاسوبية احترام ساتون بقدر أهمية نجاح خوارزميات الذكاء الاصطناعي الحديثة.

أخذ النقاش ، لذلك يبدأ.

نقرأ أولا "في نهاية هذا الاسبوع لا بد من قراءة" ساتون بوين، نلقي نظرة على وجهة نظر مربع.

الدرس المرير

وفيما يلي النص الكامل ساتون بلوق، ترجمة و qubit التشطيب:

AI البحوث العودة 70 عاما، وهو أكبر التعادل الخبرة، وطريقة عامة لاستخدام قوة الحوسبة لنهائي هو دائما الأكثر فعالية ومتقدما بفارق كبير.

السبب النهائي لذلك هو أن قانون مور، أو نقطة واسعة، وتعتبر تكلفة الوحدة من السلطة تستمر في الانخفاض بشكل كبير.

هم أكثر البحوث AI متاح في قوة ثابتة عدد الجثث ذكية فرضية أنه في هذه الحالة، فإن الطريقة الوحيدة لتحسين أداء المعرفة الإنسانية قد تكون ذات فائدة. ومع ذلك، فإن تتطلع أكثر مشروع بحثي طويل الأمد من فترة نموذجية من الوقت، وسوف تجد يجب أن يكون هناك أكثر المتاحة لحساب القوات التي تحدث.

من أجل الحصول على تحسن ملحوظ على المدى القصير، فإن الباحثين استخدام المعرفة الإنسانية في هذا المجال، ولكن في المدى الطويل، والقوة هي الشيء المهم فقط لاستخدام العد.

ولكن على الرغم من أن اثنين على ما يبدو متضاربة ضروري، ولكن في واقع الأمر أنها غالبا ما تكون متناقضة.

الوقت الذي يقضيه في اتجاه واحد، وسوف لا محالة ليس أن تنفق في اتجاه آخر. لطريقة معينة للاستثمار سيجلب التزام النفسي.

وفي الوقت نفسه، مع المعرفة الإنسانية لتحسين AI سوف تميل إلى تعقيد هذه العملية، بحيث أن استخدام للأغراض العامة الحوسبة أسلوب القوة حساب يصبح أقل المعمول بها.

العديد من الباحثين AI فهم مزايا وعيوب هذا "الدرس المرير". استعراض بعض من أهم منها هو مفيد للغاية.

في مجال لعبة الشطرنج، في عام 1997، هزم بطل الشطرنج غاري كاسباروف أزرق، ويستند على عمق بحث واسعة النطاق.

في ذلك الوقت، فإن معظم الباحثين الشطرنج الكمبيوتر لننظر في الأمر في الإحباط، وسعيها لتحقيق الفوز مع فهمنا لبنية خاصة لعبة الشطرنج.

عندما أكثر بساطة، وهناك نعمة خاصة من الأجهزة والبرمجيات القائمة على طريقة البحث ثبت أن تكون أكثر فعالية، يفقد هؤلاء الباحثين الشطرنج البشري القائم على المعرفة على الإطلاق "مخجل". يقولون هذا " بالقوة الغاشمة "إن البحث قد يفوز هذه المرة، ولكن هذا هو بعد كل شيء لا سياسة مشتركة، على أية حال ليست هذه هي الطريقة البشر لعب الشطرنج.

إنهم يريدون إدخال البشري استنادا إلى طريقة الفوز، لكنه لم يكن كذلك، تاركة بخيبة أمل.

الذهاب مجال تقدم البحوث الكمبيوتر اتبعت نفس النمط، 20 عاما فقط في وقت متأخر من لعبة الشطرنج. الجهود الأولية الكثيرين في هذا المجال، هي استخدام المعرفة الإنسانية أو الخصائص المميزة للعبة لتجنب البحث، ومع ذلك، هو بحث واسعة النطاق عن التطبيق الفعال، أصبحت هذه الجهود لا صلة لها بالموضوع، أو ما هو أسوأ.

استخدام الذات من الألعاب لمعرفة وظيفة هامة مثل (في العديد من الألعاب الأخرى، حتى في لعبة الشطرنج، أيضا، على الرغم من أن لم يلعب دورا هاما في المشروع الأزرق 1997 الظلام). تعلم عن طريق الشطرنج الذاتي، والتعلم نفسها، وفي الواقع كل نفس البحث، وجعل على نطاق واسع الحوسبة حيز اللعب.

بحث والتعلم هي اثنين من أهم واسعة النطاق بحوث الحوسبة تكنولوجيا الطاقة في التطبيقات AI.

في لعبة الشطرنج الكمبيوتر ومشروع العودة، اتجاه الجهود الأولية من الباحثين هو كيفية استخدام التفاهم بين البشر (بحيث لا تحتاج إلى الكثير من البحث)، في وقت لاحق من ذلك بكثير، وقد احتضنت من خلال البحث والتعلم حققت نجاحا أكبر.

في مجال التعرف على الكلام، قبل فترة طويلة كان هناك منافسة في عام 1970 برعاية DARPA.

في هذه اللعبة، واستخدام بعض المشاركين هذه الأساليب تتطلب معرفة خاصة الإنسان (كلمة المعرفة، والمعرفة فونيمي، ومعرفة الجهاز الصوتي البشري، وما إلى ذلك). هناك بعض الناس لإنهاء المباراة بناء على نماذج ماركوف المخفية (HMMs). عن إحصاءات عن طبيعة هذا جوهر الطريقة الجديدة، كما يتطلب المزيد من الحساب.

كما هو متوقع، والنصر النهائي على الأساليب الإحصائية تستند إلى المعرفة الإنسانية.

هذه اللعبة هي كل اللغات الطبيعية جلبت معالجة المهام تغيرات هائلة في العقود، والاحصاءات السابقة وحساب قوة تهيمن تدريجيا.

لم ارتفاع التعرف على الكلام لا تأخذ التعلم العميق لفترة طويلة، ولكن أيضا أحدث خطوة في هذا الاتجاه خطوة. عمق تعلم المعرفة البشرية يتوقف حتى أقل، واستخدام المزيد من القوة العد. من خلال دراسة على مجموعة تدريب كبير للحصول على أفضل نظام التعرف على الصوت.

كما هو الحال في لعبة متنها، والباحثين يحاولون جعل عمل نظام طريقة التفكير في أذهانهم من البشر، في محاولة لوضع هذه المعرفة في نظام الكمبيوتر. ولكن في النهاية، عندما جلبت قانون مور المشغلين على نطاق واسع القوة، في حين وجد آخرون وسيلة ملائمة لاستخدامها، وسوف تجد الأصلي إلى نتائج عكسية، مضيعة كبيرة من الوقت للباحثين.

في مجال الرؤية الحاسوبية، لدينا نمط مماثل. طرق المبكرة، يتم التفكير في كونها عاملا بحث البصرية، واسطوانات المعمم أو خوارزمية فرزت لخصائص القبض عليه. ولكن الآن، وقد تم التخلي عن هذه الأساليب. الشبكات العصبية التعلم العميق الحديثة، فقط بعض من ثبات للالتفاف والمفاهيم، ولكن النتيجة هي أفضل بكثير.

هذه الدروس تخبرنا، (AI) في هذا المجال، ونحن ما زلنا لا نفهم تماما، ونحن نبذل باستمرار نفس الخطأ.

من أجل فهم الوضع، ومنع الأخطاء على نحو فعال، يجب علينا أن نفهم أن هذه الأخطاء لها جاذبية قليلة.

لدينا هذا "الدرس المر" لمعرفة: وعلى المدى الطويل، فإن منظمة العفو الدولية بناء على فهمنا لطريقته في التفكير لا يعمل.

  • "الدرس المر" من هذه الملاحظات التاريخية:
  • كثيرا ما حاول الباحثون الذكاء الاصطناعي لمعرفة "جزءا لا يتجزأ" في أجسامهم الذكية،
  • على المدى القصير هو في كثير من الأحيان مفيدة، بحيث إحساس الباحث نفسه من الارتياح،
  • ولكن في المدى الطويل، وهذا سوف تبطئ، أو حتى منع مزيد من تطوير البحث،

سوف اختراق النهائي تأتي من الاتجاه المعاكس تماما: يتم حساب جدول يقوم على البحث والتعلم.

النجاح النهائي دائما يجلب القليل من الاستياء، عادة ليست مفهومة تماما، لأنه يتجاوز النهج الحالي شعبية، محورها الإنسان.

من دروس التاريخ، يمكننا أن نتعلم شيئين.

أولا، طريقة للأغراض العامة قوية. حتى إذا أصبح حساب الطاقة المتاحة كبيرة جدا، وهذه الأساليب يمكن أن تستمر في التوسع، وزيادة استخدام العد القوة. هناك طريقتان يبدو أن يكون وفقا لأي تمديد لهذه الطريقة: بحث و تعلم .

ثانيا، المحتوى الفعلي للمجمع إلى مخيف جدا يعتقد ميؤوس منها. نحن لا يجب ان نحاول ايجاد وسيلة بسيطة للتفكير في محتوياته، على سبيل المثال، طريقة بسيطة للتفكير في الفضاء، والكائنات، متعدد وكيل أو التماثل.

هذه هي حرية، في جوهرها، وهي جزء معقد للغاية من كل العالم الخارجي. لا ينبغي أن يبنى في أي وكيل AI لأنها معقدة للغاية إلى ما لا نهاية. بدلا من ذلك، ينبغي أن نبني قادرة على العثور والاستيلاء على تعقيد هذه الطريقة عنصر التعسفي فقط.

جوهر هذا النهج هو القدرة على العثور على تقريب جيدة. ومع ذلك، وتبحث عن عمل ينبغي أن تترك لنهجنا، بدلا من عاداتنا وتقاليدنا.

ما نحتاج إليه هو وكيل AI مثلنا ويمكن الاطلاع، بدلا من التي تحتوي على AI ما وجدناه، بما في ذلك.

أنشئت منظمة العفو الدولية على أساس النتائج التي توصلنا إليها، ونحن سوف تجد أنه من الصعب أن نرى كيف تتم عملية الخروج.

الرابط الأصلي:

"الدرس الحلو"

بقوة نختلف يعتقد المعلمين رأي ساتون Huaite سين أن بناء AI تحتاج بالتأكيد إلى الاندماج في المعرفة الإنسانية، والسؤال الوحيد هو متى وكيف وماذا المعرفة إلى. هناك "الدرس الحلو" (الدرس الحلو)، ونحن نحاول العثور على معرفة مسبقة الصحيحة لهذه العملية، وتعزيز التقدم المحرز في منظمة العفو الدولية تاريخ منظمة العفو الدولية.

عرض وساتون لخص على النحو التالي: "AI التاريخ يقول لنا ان في نهاية المطاف استخدام القوة يعتبر دائما للتغلب على استخدام المعرفة الإنسانية."

وفيما يلي ترجمة لمحتوى الانتهاء Huaite سين تويتر:

وأعتقد أن هذا هو تفسير خاص من التاريخ. في الواقع، تم التخلي عن الكثير من الجهود للاندماج في المعرفة البشرية من منظمة العفو الدولية، جنبا إلى جنب مع الموارد الأخرى (وليس فقط القدرة الحاسوبية، بما في ذلك التخزين والطاقة والبيانات أيضا) غنية، ولكن أيضا التخلي عن أكثر من ذلك.

ومع ذلك، فإن نجاح طريقة الناتجة لا يمكن إلا أن يعزى إلى هذه الموارد الغنية، بما في ذلك تلك المعرفة البشرية لم المهجورة ساهم أيضا.

إذا تريد أن تترك التفاف، LSTM، ReLU، دفعة تطبيع (batchnorm)، وهكذا تفعل عمق التعلم، وأتمنى لكم حظا سعيدا. إذا جانبا "العودة هو ثابت، محصلتها صفر، لاحظ تماما،" هذه المعرفة السابقة، لمجرد الحصول على هذه اللعبة، وأتمنى لكم حظا سعيدا.

لذلك، لا متكاملة AI في القصة من تاريخ المعرفة البشرية قد فشلت. على العكس من ذلك، يتم دمجها في انتصار المعرفة الإنسانية، بل هو أيضا طريق لتحقيق متسقة تماما مع ممارسة استراتيجية بحث: حاول العديد من الطرق، والتخلي عن فشل 99.

1 المتبقية أمر بالغ الأهمية لنجاح الذكاء الاصطناعي الحديث، AI وهلم جرا إلى كمية كبيرة من موارد الحوسبة كمفتاح.

وقال ساتون التعقيد الكامن في العالم أننا لا ينبغي أن يكون لديهم معرفة مسبقة في النظام. ولكن في رأيي العكس: هو هذا التعقيد التي جعلته البحث احترام وتعلم طريقة غير معقدة للغاية.

فقط مع معرفة مسبقة المناسبة، تحريض التحيز الصحيح (التحيزات الاستقرائي)، يمكننا السيطرة على هذه التعقيد.

وقال: "الشبكات العصبية التعلم العميق الحديثة، فقط بعض من ثبات للالتفاف ومفهوم، ولكن أفضل من ذلك بكثير." كلمة "فقط" لتسليط الضوء على الطبيعة التعسفية لهذا الزعم.

وبدون هذه التفاف ثابتة وعمق التعلم لا تكون ناجحة، ولكن كان ينظر على أنها صغيرة، ومرنة بما فيه الكفاية ليكون مقبولا.

مثل هذا "الدرس المر" لتجنب القضية الرئيسية، وهي ليست مشكلة وجود أو عدم إدخال المعرفة الإنسانية (لأن الجواب الواضح نعم)، ولكن هذه المعرفة هو أن نسأل ما ، أي في عندما ، كيف استخدامها.

وقال ساتون، "ما نحتاجه هو وكيل AI مثلنا ويمكن الاطلاع، بدلا من التي تحتوي على AI ما وجدناه، بما في ذلك". بطبيعة الحال. ولكننا نعرف كيفية اكتشاف بالضبط لأننا نولد مع التحيز الاستقرائي الصحيح.

"الدرس الحلو" على التاريخ AI هو هذا: على الرغم من العثور على التحيز الاستقرائي المناسب أمر صعب، ولكن كان عملية البحث عن التقدم الهائل مشكلة مستعصية على الحل.

الرابط الأصلي:

https://twitter.com/shimon8282/status/1106534185693532160

النقاش الجانبين

اتخاذ الجانبين في هذا النقاش، وهما "لتعزيز والد التعلم،" ساتون استاذ علوم الكومبيوتر في جامعة أكسفورد وشمعون Huaite السناتور ويدرس العلماء لتعزيز مجال الرؤية هو عكس ذلك.

تعزيز التعلم الأب: ساتون

ساتون، يعتبر واحدا من مؤسسي الحوسبة الحديثة تقوي التعلم من أجل تعزيز التعلم جعلت العديد من المساهمات، مثل "التعلم الزمني الاختلاف" (الزماني الفرق التعلم) و "أسلوب التدرج السياسة" (أساليب التدرج السياسة)، وهلم جرا.

في عام 1978، تلقى ساتون درجة البكالوريوس في علم النفس من جامعة ستانفورد، بعد أن تحولت إلى الدكتوراه علوم الكمبيوتر في جامعة ماساتشوستس أمهرست الامن.

"مقدمة لتعزيز التعلم"، بالاشتراك مع معلمه أندرو بارتو، أصبح كتاب الأساس لتعزيز مجال تعلم القراءة البحثية.

حاليا، يعلم ساتون في جامعة ألبرتا، وهو أستاذ في قسم علوم الحاسوب وICORE الرئيس، وتعزيز التعلم القيادة ومختبر الذكاء الاصطناعي.

يونيو 2017، انضم ساتون Deepmind، وشارك في قيادة المكتب الكندي يقع في ادمونتون، مع الحفاظ على عمله كأستاذ في جامعة ألبرتا.

منذ عام 2001، وكان سوتون زميل AAAI، منحت الجمعية الدولية لجائزة الشبكات العصبية الرئيس في عام 2003، وحصل على الإنجاز المتميز الصادر جائزة من جامعة ماساتشوستس أمهرست في عام 2013.

المعارضين من جامعة أكسفورد: Huaite سين

شمعون Huaite سين، وهو أستاذ في قسم جامعة أكسفورد الحاسب الآلي، وتخصصت في مجال الذكاء الاصطناعي وتعلم الآلة. تعزيز التعلم، بحيث عامل الموضوع هو التعلم لمتابعة عرض بحثه.

في عام 2007 حصل على شهادة الدكتوراه في جامعة الكمبيوتر تكساس في أوستن، ثم بقي على القيام به فترة ما بعد الدكتوراه من الزمن، ثم درس في جامعة أمستردام، الدنمارك.

2015 أصبح Huaite سين وهو أستاذ مشارك في جامعة أكسفورد، عام 2018 أصبح أستاذا.

أخذ النقاش الذي تؤيد؟

بالإضافة إلى Huaite سين، هناك الكثير من الناس على نقطة وساتون وجهة نظر أنهم لا يمكن أن نوافق تماما.

مثل يعتقد ناندو دي فريتاس الفقرة الأخيرة ساتون بوين صحيحة، يشحذ الفكر:

ما نحتاج إليه هو وكيل AI مثلنا ويمكن الاطلاع، بدلا من التي تحتوي على AI ما وجدناه، بما في ذلك. أنشئت منظمة العفو الدولية على أساس النتائج التي توصلنا إليها، ونحن سوف تجد أنه من الصعب أن نرى كيف تتم عملية الخروج.

لكنه كان أيضا وجهة نظر Huaite سين وجهة نظر، إلى الحديث عن بعض من أفكاره:

  • قوة مشغلي مهمة جدا، خاصة بالنسبة للعامل تعزيز التعلم. ومع ذلك، والالتواء، LSTM لا اخترع هذه المفاهيم في دراسة عملية واسعة النطاق.
  • المخلوقات الأخرى، ولنا البشر لديهم قوة المشغل قوية، الذين يعيشون في بيئة البيانات نفسها، لكنها لا تنوي السفر إلى المريخ.

أستاذ كلية امبريال في DeepMind كبير الباحثين موراي شاناهان على الرغم من معرفة مسبقة لا يمكن أن تدعم الكتابة اليدوية مناطق محددة من العمل، ولكن لا تزال تعتبر "مفيدة للسماح لمنظمة العفو الدولية أن تبحث لتعلم المعرفة المسبقة على هذه الأنواع من الهندسة المعمارية."

وقال البروفيسور المساعد في جامعة تكساس في أوستن سكوت Niekum وافق عموما برصيد نقطة وساتون وجهة نظر، ولكن هناك أيضا مفتوحة على سؤال، مثل العلم هو أبدا في خط مستقيم، فإن العديد من معظم الاكتشافات الهامة، قد تأتي من المساعدات محددة بنيت مجال المعرفة ليست كافية لدراسة تلك النموذج العام.

السؤال، كيف تنظرون؟

- كامل  -

التوظيف الصادق

المكدسة تقوم بتجنيد محرر / مراسل، ومقرها في تشونغ قوان تسون في بكين. نتوقع الموهوبين والطلاب المتحمسين للانضمام إلينا! مزيد من التفاصيل، يرجى و qubit عدد الجمهور (QbitAI) واجهة الحوار والرد "تجنيد" كلمة.

و qubit QbitAI عناوين على التوقيع

' " تتبع تقنيات AI دينامية جديدة والمنتجات

وعند النظر إلى لوحة المفاتيح مقسمة إلى فصول، LOL أربعة صورة حقيقية! اللاعبين: والله العظيم هو مع CRTL الصحافة النخيل!

أمس أوساكا لاعبي كرة القدم PK برشلونة الشاب خسر أمام انهيار الدموع، ولكن الحقيقة أن اليابان أصبحت شابا قويا

Sicong كيفية محاربة للشطرنج ذاتية؟ يشاع صديقته على الرغم من كل شيء، والبقاء مستيقظين طوال الليل والتكنولوجيا الصعبة عملت!

Yayunnanzu اللعبة أعلنت ثلاثة المنتخب الصيني الترتيب النهائي، وهو أعلى مستوى منذ 12 عاما على أفضل النتائج

دورة الألعاب الآسيوية للنساء منافسات كرة القدم زميله الجديد نيمار سجل ثلاثة أهداف، ومن المتوقع ميدالية ذهبية كرة القدم في الصين المرأة في مرة أخرى بعد انقطاع دام 20 عاما

أكثر الشركات اللعبة وقح؟ بعد مطرقة انفجار المفاخرة لاعب، لديه العين على الله ل275 من وسائل الإعلام

تجربة CBA الموسم فريق ملخص العشاء، لماذا العميق تقسيم السحرية اتهم محتوى الوسائط مع

علي الإفراج مكافحة التحرش الهاتف التكنولوجيا AI! السماح للروبوت للتعامل مع الروبوتات

ودورة الألعاب الآسيوية لكرة القدم بالميدالية الذهبية لنرى كرة القدم النسائية، خمسة أهداف الفوز على غريمه القوات انضم لكرة القدم الدور نصف النهائي امرأتين الصينية

ببساطة لمس! الدجاج ألعاب الأطفال يلعبون، والآباء لأن اللعبة ليست عادلة، والشكاوى مطوري!

ارتجاج هذا الموسم، وقد اجتاحت السحر شنتشن لا يزال يخرج، وزوجين من العمر قد لا يتحدثون مع بعضهم وداعا

مضايقة المكالمات الهاتفية لتخصيص 4 مليارات، 600 مليون مستخدم تسرب الخصوصية، 315 CCTV التعرض AI الجانب الظلام