الأكاديمية | والمعرفة أعلى سلسلة: ICLR 2018 و 2018 ICLRA

تقنية مراجعة AI حسب: "سوف ينظر إلى أعلى في السلسلة، وسمعت." Benpian تنتمي إلى هذا العدد الكبير من سنة رائعة من مؤتمر التعلم المخابرات / آلة اصطناعية، لم يذهب الى مكان الحادث من الأشياء الطبيعية وللأسف، فإن الموقع هو أيضا من السهل رؤية. ثم نلقي نظرة على ملخص بعد ذلك بالمعلومات من باحثين آخرين، قد يكون هناك موسم الحصاد الجديد عليه.

أليكس Irpan تخرج في علوم الكمبيوتر في بيركلي UC، بيركلي في معهد بحوث الذكاء الاصطناعي AI (بير) قيام تصميم الدراسات العليا، والمعلم لبيتر Abbeel، تليها إضافة جوجل الدماغ من فريق الروبوت للقيام مهندس البرمجيات. أليكس Irpan الاهتمامات البحثية الخاصة تميل إلى تعزيز عمق التعلم للسيطرة على الروبوت. استغرق التالية في العام الماضي المشاركة في خطط التنفيذ الوطنية عام 2017، اليكس Irpan شاركت هذا العام أيضا في ICLR 2018 و ICLRA عام 2018، وكتب معرفته من المشاركين. مؤتمر لتعزيز منظور الأبحاث التعلم والتطبيق المهندسين ما هي أبرز نقطة الأخدود؟ لى فنغ شبكة AI تكنولوجي ريفيو النص الكامل لهذا المقال جمعت بلوق الشخصية التالية.

في وقت أقل من شهر، وشاركت بشكل مستمر في ICLR 2018 و 2018 ICLRA اجتماعين. الأول هو مؤتمر التعلم العميق، وهو مؤتمر الروبوتات. هناك العديد من الاختلافات بينهما، وأعتقد أنه سيكون من المفيد إجراء مقارنة.

ICLR 2018

من القيام جهة نظر بحثية، بل هو كلام موجز ICLR تعلم المواجهة لا تزال قضية هامة .

قاعة ICLR من أهم المواضيع هي الصيغة ضد شبكة (GANS). ولكن هنا أريد أن استخدام هذه الكلمة تحتوي على "عينة المواجهة" و "مع بيئة وكيل المتنافسة" يعني على حد سواء في نفس الوقت. حقا، لا يمكن لأحد أن يكتب

الحد الأقصى والحد الأدنى شكل من أشكال الحل الأمثل بالنسبة لي هو مشاكل في التعلم المواجهة.

لست متأكدا من هذه المسألة ليست حقا أن النار، فإنه قد يكون مجرد ذاكرتي كان هناك انحياز في الاختيار، لأن هذه الأساليب تجعل لي حقا يشعر مثيرة للاهتمام بشكل خاص. أعطوني شعور قوي جدا. فهم GAN هو أن تتعلم مولد، ولكنه يستخدم تعلمت ظيفة خسارة ضمنية، بدلا من تعريف الإنسان. وهذا سوف يسمح مولد لديه قدرة أكبر على التكيف، ويمكن أن تساعدك على تحديد اصطناعية لا من المستحيل تقريبا أن تبدأ مع وظيفة الخسارة.

والواقع أن هذا النهج يجعل لكم السؤال يصبح أكثر تعقيدا. ولكن إذا كان لديك ما يكفي من أدوات التحسين قوية وقدرات النمذجة، هذه علمت فقدان وظيفة الضمنية يمكن أن يحقق أقوى من أي طريقة أخرى لصورة لك. وبالإضافة إلى ذلك، جزء من النظام الخاص بك إلى مثل هذا التجمع علمت له ميزة أخرى، وهذا هو التكنولوجي الأمثل التقدم والنمذجة جوانب من المزيد من الجهود لمساعدة أفضل على حل المشكلة. تم تحسين فقدان القدرة على التعلم وظيفة من النماذج لجعل هذه القدرات في حين خسائر الحد . في نهاية المطاف سوف تأتي إلى نقطة تحول، وقبل كل هذا العمل الشاق سوف تدفع أكثر مكافأة.

من وجهة نظر أكثر تجريدا من رأي، وهذا النهج يعني مهارات عالية، لتحسين وظيفة السلطة من الأسرة، والشبكة العصبية مثال على ذلك. الحد الأدنى والحد الأقصى الأمثل هو ليس الأسلوب الجديد، الذي تم في وجود لفترة طويلة. حقا شيء جديد هنا هو أن التعلم العميق يسمح لك لتعلم النمذجة معقدة وفقدان وظائف في البيانات الأبعاد عالية. في رأيي أماكن مثيرة للاهتمام GANS من توليد في الصورة نفسها، لكنه يؤكد على جدوى هذا المفهوم في البيانات المعقدة مثل الصور. في الواقع، لم أي جزء من إطار هذا النموذج لا تتطلب منك استخدام بيانات الصورة.

هذه العملية التعلم، وهناك أيضا يمكن استبدال بعض الأجزاء الأخرى مع أساليب علم المعرفة من قبل الإنسان، وعمق التعلم هي واحدة من الأدوات التي يمكن أن تختار. ثم اختر عمق تعلم مناسبة؟ حسنا، ربما. والمشكلة هنا هي أن تستبدل كلما كنت ترغب في السماح حقا كل جزء يمكن أن يتعلم كلما ازدادت صعوبة. إذا كان لديك تتراكم السلحفاة، وقد تم مكدسة إلى عدم الاستقرار، فمن السهل أن تتحول إلى حد ما، في الواقع، وربما كنت لا ينبغي كومة من ذلك بكثير.

هناك في الآونة الأخيرة على المادة كوانتا، أعربت دراسة متعمقة جوديا بيرل السخط خطيرة، معتبرا أن هذا هو أهمية التعلم ومنحنى التعلم المناسب، فإنه لا يزال بعيدا عن "الذكية" بعيدا جدا. وأنا أتفق معه، ولكن أود أن أقول كلمة عن التعلم العميق، وإذا وضعت الشبكة العصبية سوبر القيت داخل وعاء كبير بما فيه الكفاية لأساليب يغلي الأمثل، هل تعلم أن الأمور سوف والسببية المنطق يبدو تماما مثل، أو ما إذا كنت وضعت ما يسمى الحكمة، وهذا سوف تغلي من شيء تماما مثل ذلك. يبدو الفلسفة أن أقول أكثر من ذلك، أتوقف الآن.

من وجهة نظر المشاركين العاديين، جوانب كثيرة من ورقة ICLR ملصق أحببت. هذه هي المرة الأولى التي ICLR الوقت، كان تعلم مؤتمر آلة آخر مرة ذهبت خطط التنفيذ الوطنية، يستأصل المقياس هو ببساطة كبيرة جدا من قبيل المبالغة. إذا تم قراءة NIPS نريد من كل ورقة، وأنها بالتأكيد لا. كل ICLR ملصق يريدون فرصة لإلقاء نظرة، على الرغم من أنه لم يكن بالضرورة على استعداد للقيام بذلك.

نقطة I أخرى مثل هو المشهد حتى مضحك في التوظيف للشركات على عكس خطط التنفيذ الوطنية. على NIPS بعض الشركات سوف نحول الذي يرسل من الناس الحصول على أعلى بالضيق، وكذلك الجوارب الإرسال، بل فريدة من نوعها، ولكن لأن الشركات لديها عقولهم من أجل التوصل إلى بعض الهدايا التذكارية فريدة من نوعها لتجنب التعرض للدفن، والنتيجة النهائية أشياء غريبة حصلت. على ICLR حصلت الأغرب أنها مجرد زوج من الجوارب فقط، وليس شائعة، ولكن على الأقل ليس بتهور.

لقد لاحظت هذه الأوراق والخطط لنلقي نظرة فاحصة في وقت لاحق

الدوافع الذاتية والمناهج التلقائي عبر المتناظر الذاتي اللعب

(Https://openreview.net/forum؟id=SkT5Yg-RZ)

تعلم المكافآت قوية مع Adverserial معكوس التسليح التعلم

(Https://openreview.net/forum؟id=rkHywl-A-)

سياسة الأمثل من قبل التقطير الوراثية

(Https://openreview.net/forum؟id=ByOnmlWC-)

قياس الذاتية البعد من الهدف المناظر الطبيعية

(Https://openreview.net/forum؟id=ryup8-WCW،AI تكنولوجي ريفيو ملاحظة: اوبر AI مختبرات هذه الورقة لديها شريط فيديو تفسير حية، والذي قمنا به في الترجمة، الرجاء الضغط الفيديو المطبوخة فيديو | العصب قياس شبكة من الصعب حقا أن تفعل؟ اوبر القول بالضرورة)

Eigenoption ديسكفري من خلال التمثيل خليفة العميق

(Https://openreview.net/forum؟id=Bk8ZcAxR-)

الذاتي Ensembling ل Visual التكيف المجال

(Https://openreview.net/forum؟id=rkpoTaxA-)

TD أم لا TD: تحليل دور الزمني يفرق في أعماق التسليح التعلم

(Https://openreview.net/forum؟id=HyiAuyb0b)

التعلم عبر الإنترنت تقييم التكيف مع Hypergradient النسب

(Https://openreview.net/forum؟id=BkrsAzWAb)

المستكشفة دورا: إخراج الأيكان التسليح العمل-اختيار

(Https://openreview.net/forum؟id=ry1arUgCW)

تعلم متعدد المهام من قبل أخذ العينات النشطة

(Https://openreview.net/forum؟id=B1nZ1weCZ)

ICRA 2018

ICRA 2018 هي المرة الأولى التي ذهبت إلى الاجتماع على الروبوت. أنا لا أعرف ماذا نتوقع أن نرى في الاجتماع. بدأت في إجراء البحوث عندما يكون الجهاز هو تعلم القيام به، وبعد ذلك بدأت الأمور تراجع والروبوتات الجانب، لذلك اهتمامي هو أقرب إلى "تعلم كيفية السيطرة عليها" بدلا من "جعل الروبوت الجديد". إعداد بيئة مثالية التجريبية بلدي هو الأجهزة في العالم الحقيقي التجريد كمجموعة للتعامل معها. (ظننت أنني سمعت أحد الروبوتات الخبراء Dunzaiqiangjiao البكاء)

خلفيتي الفنية يقترن مع بلدي للشخص العادي فهم نظرية التحكم مثل، وهذا يعني أنني لا كيف تتعرف على الاجتماع العديد من القضايا. ولكن على الورق أو مع الكثير لنتعلمه، وأنا سعيد لأنني ذهبت إلى المشاركين.

في هذه الدراسات، أستطيع أن أفهم أين أنا مندهش أن هناك ورقة دراسة مكثفة الكثيرين. أن نكون صادقين، لنرى أين رقة صغيرة مع تعزيز التعلم بحتة خالية من النموذج، لذلك شعرت قليلا مضحك. ICRA لديه ميزة أنه إذا تم تشغيل الخوارزمية الخاصة بك على الروبوت في العالم الحقيقي، ثم احتمال من هذه الورقة سيتم قبول تلبية الكثير أعلى. هذه القوى التي للنظر في كفاءة البيانات، لذلك عند اختيار وسيلة للسماح للتعزيز التعلم خالية من النموذج النقي في عيب كبير السوبر. عندما كنت أمشي في ضوء المكان، أستطيع أن أسمع من وقت لآخر "نحن الجمع بين تعزيز التعلم خالية من نموذج وX 'هذا هو الحال، وهذا X هو إما تعزيز التعلم القائم على النموذج، سواء من مظاهرة الإنسان تعلم، إما التعلم من التحكم في الحركة، على أي حال، ليس هناك أي مساعدة لنموذج عملية لاستكشاف الأشياء.

من منظور أوسع، وهذا الاجتماع هو قيمة عملية للغاية. وبطبيعة الحال مؤتمر البحوث، التي لديها أيضا الكثير من المحتوى لا يزال محاولة قيمتها إلى معرفة، ولكن في نفس الوقت سوف تشعر، ونحن نقبل كيندا اتجاه حل تضييق جدا ودقيق للمشكلة واحدة أو اثنتين. وأعتقد أن هذا هو نتيجة أخرى لأنك تريد أن استخدام الأجهزة حقيقي يجلب. إذا كنت ترغب في تشغيل نموذج في الوقت الحقيقي، ثم لا يمكن تجاهل المنطق كيف منذ فترة طويلة، وإذا جمع البيانات من الروبوت الحقيقي، فإنك لا يمكن تجاهل كفاءة البيانات. الأجهزة الفعلية لا يهمني ما عليك اجهت مشاكل.

وهذا يذكرني حقيقتين في RFC 1925 على تصميم النظام

1. يجب أن تكون صالحة.

2. مهما الاحتياجات الخاصة بك عالية، أنت مهما كنت الأولوية، لم تكن قد زادت سرعة طريقة خفيفة.

وآلة التعلم أن تفعل الكثير من الناس وأنا دردشة مع نستغرب هذا، ولكن الناس في مجال تكنولوجيا الروبوت أيضا لا تشارك في الناس NIPS، ICLR، ICML كما تعلم الآلة تبنت بالكامل، ويرجع ذلك جزئيا من آلة التعلم ليس دائما وهو فعال. تعلم الآلة هو الحل، ولكنها غير مضمونة أن تكون معقولة. شعوري هو أن ICRA حقا يشبه إلى حد كبير جدا لرؤية الجهاز النشطة أساليب التعلم فشل شخصا، قليلون جدا. لا تزال معظم الناس يستخدمون آلة التعلم كل شيء طيب، طالما أن الجهاز أساليب التعلم لإثبات نفسه. في بعض المناطق، والتعلم الآلي أثبتت نفسها. ينظر كل واحد أرى على ورقة مع نوع معين من CNN. ولكن تعلم أن تفعل مع عمق سيطرة أقل بكثير من الناس، لأن هناك الكثير من الأمور غير مؤكد. كثير من الناس يعتقدون أن التعلم العميق شعبية لبعض الوقت، على الرغم من أنني لا أتفق معهم، ولكن شيء واحد لسماع وجهات نظر مختلفة في هذا المجال هو جيد جدا.

وICLR، وهناك أيضا العديد من الشركات في مجال التوظيف، أو القيام ببعض موقف، وICLR يست هي نفسها، ومضمون بوث تبدو أكثر إثارة للاهتمام. ومعظم الشركات تجلب الروبوتات على القيام عدة عروض، ويراقب أداء الروبوت، بعد كل شيء، دائما ممتعة الناس شيء جسديا وعقليا، من الاستماع إلى رتابة الدعاية تجنيد قوية لا تعرف إلى أين تذهب.

في NIPS العام الماضي، وتعلم آلة الشركات تقف قليلا قطعة يذكرني حرم تجنيد جامعة كاليفورنيا في بيركلي، ويعتقدون أن ليست جيدة. كل شركات التكنولوجيا ترغب في توظيف جامعة كاليفورنيا في بيركلي توظيف الخريجين سوف تصبح مثل سباق تسلح، ونحن جميعا الأجر أكثر من أي شخص آخر في ارتفاع المفتوح، الذي يبدو والمرطبات اللذيذة. يبدو، والهدف من كل الأعمال التجارية هو السماح لهم تبدو باردة قدر الإمكان، ولكن في نفس الوقت لا تذهب في النهاية أقول لكم خدعة لجعل ما تفعله. إلى جانب تعلم الآلة، أعمالهم، التعبئة والتغليف النفس التي تبحث بار صالة كبيرة للقيام الحزب أكثر وأكثر تطورا. لم تبالغ في مجال المشاريع الروبوتات إلى هذا الحد، على الرغم من أنها زادت أيضا، ولكن ليس الكثير من الرغوة.

لقد استمعت إلى العديد من العروض ورشة عمل، والحديث عن الروبوتات العالم الحقيقي تستخدم للقيام، وهذا يبدو مثيرا للاهتمام. يميل البحوث إلى التركيز على الاجتماع ومناقشة شبكات البحوث النظرية، وغالبا ما ينسى الناس أن يمكن البحث في واقع الأمر قيمة اقتصادية واضحة وفورية. روبوت أن الزراعة هناك خطاب، يتحدث عن كيفية العثور على الأعشاب الضارة باستخدام الرؤية الحاسوبية، ثم رش مبيدات الأعشاب فقط على الأعشاب في أذني مثالية. مع الأعشاب هو أيضا أقل الأضرار التي لحقت المحاصيل والصغيرة، وأيضا إبطاء سرعة الحشائش المقاومة للمبيدات الأعشاب.

وقال الروبوتات الشهيرة خطابا عظيما رودني بروكس هي أيضا على نفس المنوال بضعة أشياء لتكنولوجيا الروبوتات في المنتجات الاستهلاكية وتجدر الإشارة، ذكر مثال على ذلك هو رومبا تنظيف الروبوت. ووفقا له، في تصميم رومبا عندما الاعتبار الأول هو السعر، ثم جميع وظائف الروبوت مصممة لتكون متسقة مع هذا السعر. ثم اكتشفوا أن سعر بضع مئات من الدولارات اليسار في استشعار المنتج وقوية الأجهزة الحاسوبية غرفة ميزانية صغيرة جدا، ويمكن وضعها على الجهاز للقيام المنطق حساب كان أيضا قيودا صارمة جدا.

(وكما انتقد بصوت عال في مجال البحوث خطابه في التفاعل الروبوت البشري، على الرغم من أنه قد يبدو لا علاقة لها وموضوع الخطاب، ولكنها تبدو مثيرة للاهتمام حقا. أنت تتحدث إلى حسنا مهتما، اشتكى أننا قد استخدمت عمدا العديد من الصيغ الرياضية المعقدة لا تبدو، في الواقع، فإن جوهر فكرة بسيطة، وقال انه من وضع فكرة كبيرة إلى الأمام في ورقة، ولكن حجم العينة ليست كافية لدعم هذه الأفكار التجريبية، وهناك من الباحثين ونمذجة السلوك والبشرية توقعات عندما يتعارض اللوم سلوك الإنسان غير عقلاني. ليس لدي أي فهم التفاعل بين الإنسان والحاسوب، لذلك لن أعلق على)

من وجهة نظر اجتماعات تنظيمية، وأعتقد أن ICRA القيام به بشكل جيد جدا. مركز المؤتمرات المجاور حيث تطبع هناك، لذلك عندما سجلت في الاجتماع، وموظفي يسأل هل لديكم في البريد الإلكتروني الخاص بك المحدد تاريخ ملصق PDF أرسلت أكثر، وبعد ذلك سوف نتعامل مع مسائل مختلفة بشكل جيد تحت طباعة واحدة. كل ما تحتاجه لتكون على الانترنت لدفع رسوم طباعة PDF، ومن ثم الانتظار للحصول على ما يكفي خلال الاجتماع. جميع الأوراق هي التالية المخططات ملصق على هذا كشك في واحد، كل حجرة لديه لوحة بيضاء وطبقة من الرفوف، يمكنك وضع الكمبيوتر المحمول على مشغل الفيديو أعلاه (على تكنولوجيا الروبوت البحوث، ووضع شريط الفيديو هو المهم حقا)

لقد لاحظت هذه الأوراق والخطط لنلقي نظرة فاحصة في وقت لاحق

تطبيق متزامن ديب تصنيف شبكة ومخطط الألعاب التسليح التعلم القائم على الحركة إلى روبوت موبايل

(Http://ghryou.me/assets/pdf/ghryou_icra_2018.pdf)

OptLayer - العملي مقيدة الأمثل لديب التسليح التعلم في العالم الحقيقي

(Https://arxiv.org/abs/1709.07643)

تدريب صناعي الشبكات العصبية للتعلم خطط الإنسان للقراءة من المظاهرات في العالم الحقيقي

(Https://arxiv.org/abs/1805.07054)

الدلالات برمجة روبوت للتلاعب-إخراج هدف في مشاهد مبعثر

(Https://www.youtube.com/watch؟v=kOcdqUmXRRo)

تصور التفاعلية: تسخير العمل في الإدراك والإدراك في العمل

(Https://arxiv.org/abs/1604.03670)

عبر AI تكنولوجي ريفيو alexirpan.com، شبكة لى فنغ المترجمة

تريد أن تعرف المزيد عن رؤية الكمبيوتر؟

أهلا وسهلا بك إلى الضغط على "قراءة النص"

ترحيب AI مكان المجتمع Yanxishe ~

كيا تشي هوان جديد مدرجة رسميا: 4،99-7،39 وان للبيع

أوسكار الغضب الجماعي الكراهية ترامب، ترامب: أرفض كنت فرك الحرارة

"المعلم" هوانغ شياو مينغ هل تعلم؟ قبل وضع السنوات العشر، زعيم الجمال أربعة تجعلك بالدوار!

الذهب + الماس! وهذا مزدوج دريك حصرية الهواء الأردن 1 لا تكون باهظة جدا؟

ووتش كأس الصين | كرة القدم 0: 1 أوزبكستان خسر بهدفين نظيفين، قاع كوب الصيني، بنغ شين لي مقاعد البدلاء

مشاعر، لا يستطيعون! 3.3 بوصة سراح بالم آلة جديدة، بسعر 349.99 $

تكنولوجيا فك التشفير: 9 الدخن 20W اللاسلكية تهمة فلاش هو كيف نفعل ذلك؟

مطاردة T60 الأسترالية المدرجة عن 184200 يوان من

"الشر المقيم 6" ثلاثة أيام اجتاحت 670 مليون، ولكن المرخص له الحصول على مليون دولار؟

AI عامل يوليو مراجعة: أعلى أوراق الحصاد، اتخذ المعهد زمام المبادرة تحولت إلى أن تكون عليه!

ColorOS جاء 5.2.1 النسخة الرسمية عدة نماذج الأوائل فرط دفعة

طباعة وسائل الاعلام الربط صحيفة الأعمال، الجذور الجغرافية وتحقيق التنمية المشتركة | 'أو مهرجان الأرز ونغجيانغ تبحث "إلى الأمام لتصبح صحيفة نموذج التعاون التجاري الجديد