أندريه Karpathy: التعلم تحت إشراف والتعلم غير خاضعة للرقابة، ومستقبل محاكاة الدماغ البشري وAGI (83 PPT تنزيل)

1 جي فاز تجميع جديد

تحميل PPT: https://docs.google.com/presentation/d/119VW6ueBGLQXsw-jGMboGP2-WuOnyMAOYLgd44SL6xM/edit#slide=id.p

الذكاء الاصطناعي العالمي (AGI) تأتي من؟

"ديب التعلم" المصلحة كلمة البحث

التقدم التقني في عدة نقاط زمنية رئيسية هي:

  • 2012: صورة الاعتراف

  • 2010: التعرف على الكلام

  • 2014: الترجمة الآلية

......

آلة البيئية الذكية البانوراما 3.0

جهتا نظر:

  • منظمة العفو الدولية اليوم لا يزال جدا "الضيق"

  • ولكن بفضل عمق التعلم، فإننا يمكن تحديث الحل أسرع

  • على سبيل المثال: AlphaGo

    العودة AI خصائص مواتية:

    • حتمية تماما. اللعبة لا ضوضاء.

    • ويمكن ملاحظة تماما. كل لاعب لديه معلومات كاملة.

    • مساحة العمل ليس مستمر. بالتعاون مع عدد محدود من الاحتمالات.

    • يمكن الحصول على جهاز محاكاة الكمال (اللعبة نفسها)، لذلك لا يمكن أن يتحقق التأثير في كل خطوة هو يمكن التنبؤ به بدقة.

    • كل الألعاب هي قصيرة جدا، فقط حوالي 200 اليدين.

    • تقييم واضح وسريع، مما يتيح الكثير من التجربة والخطأ. وهناك عدد كبير من البيانات الشطرنج الإنسان.

    بلوق إشارة Karpathy المقالات:

    Q: طرق يمكنني AlphaGo المستخدمة في الأمازون اختيار تحدي الروبوت تفعل؟

    • حتمية تماما. اللعبة لا ضوضاء. --OK

    • ويمكن ملاحظة تماما. كل لاعب لديه معلومات كاملة. - ربما OK

    • مساحة العمل ليس مستمر. بالتعاون مع عدد محدود من الاحتمالات. --OK

    • يمكن الحصول على جهاز محاكاة الكمال (اللعبة نفسها)، لذلك لا يمكن أن يتحقق التأثير في كل خطوة هو يمكن التنبؤ به بدقة. - سيئة

    • كل الألعاب هي قصيرة جدا، فقط حوالي 200 اليدين. - من الصعب

    • تقييم واضح وسريع، مما يتيح الكثير من التجربة والخطأ. - سيئة

    • وهناك عدد كبير من البيانات الشطرنج الإنسان. - من الصعب

    ملخص

    • AI تحظى بشعبية كبيرة.

    • منظمة العفو الدولية لا تزال ضيقة جدا.

    • تقنيات AI تعمل بشكل جيد في بعض الحالات، ولكن أيضا يمكنك الذهاب أبعد من ذلك.

    اذا كنا نستطيع السماح لمنظمة العفو الدولية لم تعد كذلك "تضييق"، ماذا سيحدث؟

    التقنيات العامة منحنى النضج الضجيج دورة مقابل AI

    لذا، الذكاء الاصطناعي العالمي (AGI) تأتي من؟

    • التعلم تحت إشراف

    • دون رقيب التعلم

    • AIXI (نظرية رياضية شكل AGI)

    • محاكاة الدماغ

    • الحياة الاصطناعية

    • الرادار لا يمكن رؤية الأشياء

    الجزء الأول: التعلم تحت إشراف

    التعلم تحت إشراف: جمع الكثير من البيانات هناك الكثير من التسميات، ومن ثم استخدام هذه البيانات لتدريب الشبكة العصبية

    الأمازون الميكانيكية الترك (الأمازون الميكانيكية الترك)

    الفكرة الأساسية: لبيانات جمع من السلوك البشري، والتدريب لمحاكاة شبكة واسعة من البشرية

    هذه الطريقة في منظمة العفو الدولية:

    • التناظرية / توليد الإنسان مثل العمل

    • هذه AI أنه الإبداعي؟ - (ربما)

    • ويمكن أن تعيين الجدول / الكراسي الحق في غرفة واحدة؟ - (يمكن)

    • حكموا الإنسان؟

    الجزء الثاني من التعلم غير خاضعة للرقابة

    التعلم غير خاضعة للرقابة: نموذج الجيل كبير

    على سبيل المثال :( الاختلاف) من التشفير

    مثال آخر: بدون إشراف العصبية ثقة (الخلايا العصبية العاطفية غير خاضعة للرقابة)

    فكرة:

    • في مراجعة كبيرة الإحضار الخالي من الملصقات (التعليقات على موقع أمازون) لتدريب شبكة كبيرة شار RNN

    • فالعصبون تلقائيا "اكتشاف" والمصنف العاطفة قليلا (على ميزات متقدمة مساعدة يتوقعون الحرف التالي)

    الشبكة العصبية لديه قوية ل"الدول الدماغ"

    لذلك، وهذا AI إلى السيطرة على العالم؟ - (لا)

    الجزء الثالث: AIXI

    AIXI:

    • تنطبق نظرية المعلومات العامة لخوارزميات الذكاء الاصطناعي. (ماركوس هوتر)

    • "المخابرات العامة"، والتعريف الرسمي. (شين ليغ)

    • النظرية الافتراضية وكيل آلة تورينج تعزيز التعلم الفضاء الفرضية.

    التعبير AIXI

    تعريف وكيل ذكي سوبر

    MC-AIXI كيل حلقة

    منظمة العفو الدولية ما هو؟

    • نحن بحاجة إلى إعطائها إشارة مكافأة. قد تكون هذه الجائزة من الصعب كتابة، يمكن أن تؤدي إلى "مثيل غير طبيعي" (مثيل الضارة).

    • ربما يمكن القول البشر لإعطاء الحوافز، ولكن قد لا يكون سلوكها على بينة من البشر.

    • حسابيا الكائنات صعبة للغاية، ولكن الإنسان ليست جيدة في كتابة التعليمات البرمجية المعقدة. (على سبيل المثال، "AIXI تقريب")

    • هذا العامل بشكل فظيع جدا، على الاطلاق "الذكية".

    الجزء الرابع: محاكاة الدماغ البشري

    كيفية قياس الدول الدماغ كاملة؟

    • المستوى المجرد؟

    • كيفية محاكاة ديناميكية؟

    • كيفية محاكاة الحواس في "البيئة"؟

    • على المشاكل الأخلاقية المختلفة

    الجزء الخامس: الحياة الاصطناعية

    الذكاء الطبيعي يأتي من؟

    الخلاصة: نحن بحاجة إلى تشجيع إنشاء بيئة الأدوات المعرفية الجديدة

    فوائد بيئة متعدد وكيل:

    • التنوع - البيئة ومعلمات وكيلها، وبالتالي فإن أفضل استراتيجية يجب أن يكون الاشتقاق الديناميكي

    • بيئة طبيعية - صعوبة البيئة يعتمد على قدرة وكلاء آخرين

    انقر هنا لقراءة المقال الأصلي لمعرفة التفاصيل، ونأمل أن تتمكن من الانضمام ~

    هي مفتوحة على مصراعيها "محاكاة ساخرة" شعار 6 السيارة، وفكرة الدماغ دونغ، الدراجين: الموهوبين

    بعد أن نظم الاقتصاد الكندي موجة من حالات الإفلاس، هو ظهور إشارة ركود جديدة، أو تسريع انسحاب المشترين الصينيين

    نيوزيلندا، والمتاعب لك لن ندف لي!

    سيارة في 120KM عالية السرعة / ساعة، والسيارة التي لا تطفو؟ كيف ينظر أصحاب؟

    110 اليوم العالمي للتوعية | هذا هو واحد من أكبر الأعمال في العالم للرد على الهاتف، استدعاء حالات مليون كل يوم!

    قدرة الاقتراض المحدودة في فيتنام، أو هي "المال" ما يدعو للقلق، وسائل الاعلام الاجنبية: فيتنام تواجه أزمة الطاقة

    كان تشنغ سان معلق تطعيم مفتوحة للمقاومة، إن لم يكن له فيما يتعلق الشوط الأول، وراء الفريق الصيني

    73800 فصاعدا! انخفاض استهلاك الوقود + يمكن والسيارات هذا 4 الصنع فعالة من حيث التكلفة الرجوع!

    "في العمق" هان شو أول مقابلة بعد خروجه بايدو: فاز الملك تشي في خط بدءا

    اقتصاد فيتنام أو لرد "النموذج"، بعد انتهاء لحظة حاسمة بالنسبة ليوان، لديها أشياء تقدم

    1 دقيقة 17! هذه البحث الساخن مع درجة الحرارة، وإذا رأيتم؟

    لكل فرد، ولكن من مائة! طعم هونغ كونغ، أوصى ميشلان الأكثر تواضعا