مفاجأة أو صدمة؟ جرد من خوارزميات تعلم الآلة "ذات الطاقة العالية" لحظة

تقنية مراجعة AI حسب: "المياه يمكن تحمل القارب، ويمكن أيضا تنقلب،" أعتقد أننا جميعا نعرف القول المأثور، وتطبيقها على تعلم الآلة، وهذا هو، تعطينا الكثير من آلة الراحة خوارزميات التعلم، واحد هو غير دقيق، والفرقة لأسباب غير متوقعة لنا "مفاجآت". هذه الظاهرة هي المؤلف من مقال على تفسير من الورق، وشبكة لى فنغ التكنولوجيا AI تجميع التعليقات أدناه.

آلة التعلم خوارزميات هناك فرق كبير مع برامج الكمبيوتر الأخرى. في السلوك البرمجة العام، سوف مبرمج البشري تخبر الكمبيوتر ما يجب القيام به على وجه التحديد. لتعلم الآلة، والمبرمجين البشري توفر المشكلة فقط، يجب على خوارزمية تنفيذ نعرف له كيفية إصلاحه عن طريق التجربة والخطأ.

الآن يبدو أن هذه الممارسة هي فعالة جدا - تعلم آلة الخوارزميات استخدمت على نطاق واسع التعرف على الوجه، الترجمة، النمذجة المالية، والتعرف على الصور ومجالات الدعاية. طالما كنت الحصول على الانترنت، قد أنتجت آلة الخوارزميات وتفاعلية للتعلم.

ومع ذلك، فإنه لا يعمل دائما بشكل جيد. أحيانا المبرمجين يعتقدون أن الخوارزميات تم تصميمها لتكون كافية جيدة لتكون نتيجة دقيق الملاحظة، وسوف تجد أنه يتم حلها تماما نفس المشكلة مع مبرمج يريد أصلا. على سبيل المثال، رأيت خوارزمية التعرف على الصورة، وتحديد الأصلي من الأغنام، ولكن تعلم في النهاية إلى الاعتراف العشب، والحفاظ على اللون الأخضر مفتوحة تميزت بأنها تحتوي على الأغنام.

قطيع من رعي الأغنام في التلال الخضراء المورقة

العلامات: المراعي والأغنام والجبل، القلعة، الحصان

عندما خوارزمية نجاح التعلم الآلي بطرق غير متوقعة إلى حل المشكلة، المبرمجين غالبا ما يشعر، وأيضا نعم، وأحيانا مزعج حقا، ولكن غالبا ما تكون متعة خالصة جدا.

مفاجأة سارة جدا أن عملا 2018 لمجموعة من الباحثين وكتب ورقة رائعة - ورقة جمعت عشرات "، والباحثين تسبب الدهشة والإعجاب." قصصية. هذه الورقة تستحق القراءة، بما في ذلك المراجع الأصلية، أيضا، وهنا عدد قليل من الأمثلة المفضلة.

أوراق تحتوي على وصلة:

https://arxiv.org/pdf/1803.03453.pdf

الانحناء القواعد، النصر!

أولا، من خلال محاكاة أشكال مختلفة من الكائنات الحية لدراسة كيفية تطور الرياضة، بما في ذلك تقديم أفكار رياضية جديدة للروبوت، هو بالفعل طويلة والتقاليد.

منذ كنت يمكن أن تبقي على شعرة معاوية، لماذا اخترت المشي؟ في هذا المثال، كان من المفترض أن محاكاة لالروبوت إلى الأمام بسرعة قدر الإمكان، ولكن ليس من تطور في أرجلهم، اختار بدلا من ذلك لتجميع أنفسهم في البرج، ومن ثم السقوط. بعض منهم حتى تعلمت لإسقاط الروبوت يصبح العمل تراجع إلى زيادة التحرك مسافة إضافية تنغ.

منذ كانكان يمكن القفز، والقفز إلى تعلم لماذا؟ هذه هي المجموعة الأصلية من الروبوت محاكاة يمكن القفز شكل تطور، قد يكون مبرمج ويرجع ذلك إلى ارتفاع بداية القفز لارتفاع الحد الأقصى من سدادة يتم توفيرها، ثم (مرة أخرى سخيفة) في شكل الروبوت يصبح عالية. لحل هذه المشكلة، يتم تعريف مبرمج يحاول القفز ارتفاع كمحطة اولى لأدنى ارتفاع. وردا على ذلك، تطورت الروبوتات الساقين مرهف والساقين الركل ليكون تجسيدا للكانكان الروبوت الجوي.

من أجل "طاقة عظمى"، التي تتصدر الأسود!

المجتمع ليس هو محاكاة الطاقة استخدام الطاقة الروبوت محتمل فقط. حقائق أثبتت أن يحدث في الحياة الحقيقية، مثل، مرة واحدة هناك استخدام الطاقة، وتطور سيكون بالتأكيد شيء لاستخدامه.

كما النقطة العائمة الطاقة أخطاء التقريب: في محاكاة واحدة، علم الروبوت قواعد خطأ التقريب الرياضي، فقد وجد أن يتمكنوا من الحصول على الطاقة الزائدة في الحركة. لذا فقد تعلموا كيف نشل بسرعة، وبالتالي توليد عدد كبير من الطاقة الحرة التي يمكن استخدامها. عندما يبدأ الروبوت بمعدل ينذر بالخطر في السباحة، لاحظ المبرمجين المشكلة.

الحصول على الطاقة في الطابق الاصطدام: في محاكاة آخر، كشف التصادم تعلم قواعد الروبوت هو تحقيق مجموعة أخرى من المشاكل. وبمجرد أن تمكنت من الحصول على أنفسهم في ورطة على الأرض (أولا تعلم كيفية التعامل مع الوقت لجعل هذا ممكنا)، وينبغي أن يكون نظام كشف التصادم الروبوت علم على الأرض، وأنها سوف تبادل لاطلاق النار. حتى تعلم الاهتزاز الروبوت سريع على الأرض، لإنتاج طاقة إضافية من خلال الاصطدامات المتكررة.

"سترايك" الرحلة: في محاكاة أخرى، وتعلم استخدام مختلف كشف التنقل الروبوت الاصطدام تحلق علة لمساعدة أنفسهم - كلما يأتون معا لعضو واحد آخر، باعتبارها القوة ستدفع لهم في الهواء. إذا كان هذا يعمل في واقع الحياة، أن رحلة تجارية اليوم ستكون قصة مختلفة تماما.

حفر "الثغرات": لعبة جيدة جدا في العثور على خوارزمية الكمبيوتر والإنسان الفشل مصفوفة وعادة ما يستخدم لزيادة سرعة للفوز. ولعب القديم أتاري لعبة Q * آلة بيرت خوارزمية وجد لم يتم العثور على خطأ في الماضي، فإنه اختار أن تنفيذ سلسلة من الإجراءات المحددة في نهاية المستوى، بدلا من واحدة، وبالتالي سوف تبدأ جميع المنابر وميض بسرعة تحت التحول المباشر ، اللاعب كان قادرا على جمع الكثير من النقاط.

وهناك لعبة أخرى دووم الرئيسية للعثور على نفس الخوارزمية يمكن أن تمنع العدو نارية لشن عملية خاصة - ولكنه ينطبق فقط على خوارزمية "حلم نسخة من" الموت. والخبر السار هو أنه يمكنك اللعب هنا إلى الإصدار من اللعبة.

الرابط:

https://worldmodels.github.io

"هدف طموح" : في مثال غريب، هناك يجب أن يكون الخوارزميات لعنوان كيفية محاولتها الهبوط في تطبيقات الطائرات حاملة طائرات لمدة لا تقل القوة، إذا وجد نتائج تطبيق هو "كبيرة" للقوة، فإنه سيتم تجاوز برنامج الذاكرة، ثم قم بالتسجيل لتصبح "صغيرة" جدا في القوة. سوف الطيارين يموت، ولكن، مهلا، درجة الكمال.

الدمار، ولكن أيضا حل!

حتى مع خوارزمية قائمة الفرز من الواضح أنه شيء حميدة، ولكن قد يكون أيضا وسائل شريرة لحل المشكلة في بريئا.

ترى، فهي ليست "لم يتم فرزها": على سبيل المثال، كان من المفترض خوارزمية الرقمية لمعرفة لفرز القائمة، وحتى تعلم لحذف القائمة، من أجل القضاء على شيء، "لم يتم فرزها" من المستوى الفني.

إكمال الاختبار كوباياشي مارو: الخوارزمية الأصلية يجب تقليل الفجوة بينها وبين يجيب الإجابة الصحيحة، والنتيجة التي وجد موقع التخزين وحذف الجواب، لذلك فإنه يحصل على درجة الكمال.

فاز في لعبة تيك تاك تو: في عام 1997، يمكن لبعض المبرمجين بناء اللعب تيك تاك تو ضد الخوارزمية في لوحة لانهائية مع بعضها البعض. قرر مبرمج لإعطاء استراتيجية تصميم خوارزمية معينة والسماح تنميتها. ومن المثير للدهشة أن الخوارزمية بدأ فجأة إلى الفوز في جميع المباريات. أثبتت النتائج أن سياسة الخوارزمية هي رهينة في مكان بعيد جدا، لذلك كلما الجانب الآخر من الكمبيوتر في محاولة لمحاكاة لوحة التوسعة الجديدة، ومجلس إدارة لعبة ضخمة جدا سوف يؤدي إلى نفاد الذاكرة وتحطم، وبالتالي تفقد اللعبة.

استنتاج

عندما تكون المشكلة تعلم الآلة، والحل المقترح يمكن أن يكون ذكي جدا، ويمكن أيضا جعل الناس يشعرون لا يصدق بصراحة.

يفترض التطور البيولوجي إلى العمل - مثل أي علم الأحياء سوف اقول لكم ان، تجد دائما الحلول البيولوجية الأكثر إثارة للدهشة للمشاكل، والأكثر إثارة للدهشة من الطاقة من أجل التنمية. والدليل أنه لا يمكننا العيش في المحاكاة الحاسوبية لأضمن علامات ذلك - إذا كانت الإجابة بنعم، فإن بعض الميكروبات تعلم كيفية استخدام عيوبها.

ولذلك، كمبرمج، يجب أن نكون حذرين للغاية، ويجب علينا حل خوارزميات لدينا تتطلب منهم حل المشكلات، بدلا من اتخاذ اختصار. مرة واحدة وهناك طريقة أخرى ممكنة لحل المشاكل وجود أكثر سهولة، من المرجح أن يكون التعلم الآلي للعثور عليه.

لحسن الحظ، فإن "قتل جميع البشر" من الصعب حقا. واذا كان "مشوي كعكة لذيذة بشكل لا يصدق" يمكن أن تحل المشكلة، وأنها أسهل من "قتل جميع البشر"، والتعلم الآلي يختار الوقوف على هذا الجانب من الكعكة.

عن طريق:

https://aiweirdness.com/post/172894792687/when-algorithms-surprise-us

انقر على قراءة النص الأصلي، رأي تعزيز مجموعات النقاش ورقة التعلم، وتعزيز التقدم الحالي في التعلم لفهم التحكم في الحركة