الجاف | جامعة نيويورك، وتشن شي: التطور الفني AlphaGo صفر حتمية (مرفق PPT)

يتم تحديد هذه المحاضرة من أستاذ مساعد في جامعة نيويورك تشن شي مؤخرا عام 2018 الدورة الثانية بعنوان العديد من التنوب التكنولوجيا AI المعلم المائدة المستديرة قدم "تطور AlphaGo صفر الفني لحتمية - وهو الجمع بين العضوية من آلة التعلم واتخاذ القرارات." الكلام.

خلفية إلكتروني خاص الكلمة الرد "0822" عن نسخة كاملة من PPT الكلام ~

تشن شى: اليوم أريد أن أشاطركم لماذا يجب على التعلم والعمليات آلة البحوث الجمع بين اثنين من التخصصات، من أجل حل فعال العديد من المشاكل العملية.

الأول، وتعلم الآلة

ما هو آلة التعلم؟ تحتاج أولا أن يكون مجموعة من البيانات، وبعد ذلك هناك آلة خوارزميات التعلم، والبيانات لوضع النماذج الإحصائية، وافتراضات النماذج الاحتمالية والبيانات والخوارزميات الداعمة. تعلم الآلة هو تطبيق البيانات التي يشيع استخدامها للتنبؤ على سبيل المثال، للتنبؤ سعر السهم غدا، والتي هي بعض من التوقعات الأساسية، والأهم من ذلك، من خلال تعلم الآلة، لمعرفة بعض من نموذج البيانات.

آلة التعلم من زوايا كبيرة إلى فئتين: التعلم تحت إشراف والتعلم غير خاضعة للرقابة (أشرف على التعلم وبدون اشراف التعلم). على سبيل المثال، حددنا من خلال الصور غرفة جها إنسانيا، علامة معينة في بعض الطريق لتحديد الوجه البشري في أي مكان، في هذا الوقت الذي دعا التعلم تحت إشراف. كما هو مبين في الشكل تشرف عليها تعلم الإطار، وفقا للوظيفة متوقعا، حيث التعيين إلى مجموعة تعلم الآلة.

التعلم غير خاضعة للرقابة هو المزيد من المجالات، مثل نحتاج لتصنيف الصورة، والذي يستند كليا على احتياجات ومشاعر الناس، مصنفة حسب طرق تعلم الآلة.

التعلم العميق هو أداة فعالة لاستخراج تلقائيا ميزة، مثل هيكل الصورة بحيث دراسة متعمقة لاستخراج ميزة كافية. ومع ذلك، ليس كل حقل البيانات هي قادرة على استخراج فعالية هذه الميزة عن طريق التعلم العميق، كما هو الحال في الكثير من القطاع المالي، يجب علينا أن نأخذ التعلم العميق والتعلم العميق لأساليب المقارنة غير فعالة.

ثانيا، القرار لمعرفة من

التقليدية عملية التعلم الآلة البيانات عادة ثابتة، ولكن ذلك لم يكن ليرضي العديد من احتياجات العمل، والعديد من التطبيقات التجارية تحتاج في نهاية المطاف إلى قيام قرار .

وينقسم تحليل الصور أعلاه من البيانات بالكامل إلى خمس مراحل:

  • المرحلة الأولى: وصفي ( وصفي )، ووصف البيانات الأساسية؛
  • المرحلة الثانية: التشخيص ( تشخيصي )، تشخيص البيانات الأساسية؛
  • المرحلة الثالثة: اكتشاف ( اكتشاف )، وبيانات النموذج الداخلي التعدين.
  • المرحلة الرابعة: التنبؤية ( تنبؤي )، التنبؤ تحليلات ما قد يحدث.
  • المرحلة الخامسة: تقادمي ( مفروضة )، استنادا إلى البيانات عملية صنع القرار.

في مجال الواقع، سيكون لدينا مشاكل العديد من القرارات، مثل المخزون القرارات، موقع المنشأة، تخطيط الطريق، وأسعار السلع الأخرى.

AlphaGo صفر، باعتباره تقدما كبيرا في لعبة الشطرنج، ليس فقط للتنبؤ الخصم، ولكن أيضا لصنع القرار Lazi. تصميم جوجل حتى تعزيز التعلم العميق (عمق تعزيز التعلم) ذلك العنصر مع قرار مونتي كارلو البحث شجرة (مونت كارلو شجرة البحث) تدع نفسك تلعب ضد آلة وآلة، وبالتالي التعلم. سواء كانت تعلم أو صنع القرار، تقنية المحاكاة (محاكاة) ومن المهم في AlphaGo صفر في أيضا.

للتطبيقات التجارية لا تزال بسيطة جدا، وهذا هو السبب؟ في برنامج لعبة الشطرنج، على الرغم من فضاء البحث واسع، والمعلومات كاملة، ثم وظيفة موضوعية بسيطة وواضحة (الفوز أو الخسارة)، وفي مجال الأعمال التجارية عملية صنع القرار، يمكن للدالة الهدف أن تكون معقدة للغاية.

ويسمى هذا العمل تشكيلة الأمثل، في الأساس نظام التوصية، مثل البحث عن رحلة، وسوف يساعد تلقائيا لي انتقاء معظم عدة رحلات جوية فعالة من حيث التكلفة.

هل تشكيلة الأمثل؟ أولا وقبل كل شيء، علينا أن نفهم سلوك الشراء العملاء، ومن ثم تختار أن تفعل مع اختيار نموذج (نماذج مختارة).

MNL هو النوع الأساسي اللوغاريتمي نموذج الطبقة، واحتمال اختيار منتج تساوي كفاءة المنتج (مدى المفضلة للمستخدم) إضافة إلى كفاءة جميع المنتجات الموصى بها عموما وتجهيز 1 (S: المنتجات الموصى بها، وهي: اختيار المنتجات، 1 : المستخدم ما المنتج لا مثل).

وهناك العديد من الحالات المعقدة، MNL المستحيل في واقع الحياة، لا يزال نموذجا صالحا.

نماذج اللوغاريتمي المتداخلة هي لتحديد فئة، ومن ثم تحديد المنتجات في هذه الفئة، كما هو مبين أعلاه، يتم تقسيم احتمال إلى قسمين، واحتمال اختيار سترة، والجزء الآخر هو احتمال اختيار معينة سترة النمط، لذلك لبناء عملية اختيار متعدد المستويات.

نظرا نموذج الاختيار، حول كيفية اختيار أفضل المنتجات الموصى بها للعملاء؟ لقد اخترنا S (المنتج موصى به) القيام التحسين التوافقي، لتعظيم الفوائد من توقعاتها الرياضي. مشكلة ولكن في الحياة الحقيقية هي أكثر تعقيدا هي أنك لا تعرف احتمال وجود المستخدم المحدد المنتجات.

Ruelala والوحيدة منصة مبيعات المنتجات FMCG، الساعة المبيعات قصيرة جدا، والبيانات التاريخية لم تكن كافية لدراسة درجة تفضيل المستخدمين للمنتج. الفيسبوك في القيام الاعلان على شبكة الانترنت، وإذا كان عدد من المنتجات المختارة بالملايين، هذه المرة لن تكون قادرة على تقدير مدى تفضيلات المستخدم لكل منتج. لذلك نحن بحاجة إلى نظام توصية ديناميكية، والتعلم الآلي والذكاء القرار معا.

هذا الرقم هو النموذج ديناميكية بسيطة، في كل لحظة ونحن نفترض أن المستخدم لا أوصي المنتج، وصنع شراء المستعمل والتعلم وقرار المستمر، حتى ينتهي كامل دورة المبيعات. إذا كنت تعرف احتمال أن المستخدم اختيار، يمكنك وضعه في إيجاد الحل الأمثل لساكنة، إذا كنت لا تعرف، فإنه قد يؤدي إلى مشكلة ديناميكية الأمثل.

كيفية تقييم جودة الخوارزمية؟ هناك طريقة تسمى تحليل الأسف في الأوساط الأكاديمية: اختيار أفضل تصنيف والعائد المتوقع وتصنف إلى تقليل الفرق. هدفنا هو بناء آلة التعلم خوارزمية وصنع القرار، وهي فترة كافية بحيث عندما ينتشر صغيرة جدا، وكذلك كيفية تقليل هوامش العائد.

على الرغم من أن هذه النماذج مفيدة، ولكن ليس معقدة بما فيه الكفاية، فإن جوهر تعلم الآلة هو استخراج الميزات، مثل استخدام المعلومات السياق، وخصائص المستخدم والمنتج المستخرج، لجعل دينامية اختيار نموذج، حتى نتمكن من تقديم خدمة أفضل حقيقة واقعة.

وقد فعلت وول مارت عمل مماثل، وفقا لوضعت عربة التسوق المستخدم على المنتج، ومن ثم يوصي المنتج في نهاية عملية الخروج.

الثالث، وملخص

العديد من الأعمال التجارية هو القضايا المعقدة للغاية، يجب علينا أن نفهم جيدا طبيعة المشاكل الهيكلية، والتعلم الآلي وقرار الجمع بين العضوية. فقط عملية تعلم آلة، والنمذجة العشوائية والاستغلال الأمثل للجميع معا لينة سوف نكون قادرين على فهم أفضل البيانات الكبيرة والتجهيز.

مضمون المناقشة: تشن

خلفية إلكتروني خاص الكلمة الرد "0822" عن نسخة كاملة من PPT الكلام ~

يرجى تحديد مستنسخة بيانات الإرسال THU

أفراد العمليات: ران هيل

GIF- الاولمبية الصينية لعب مجنون! 9 دقائق ازدهار حتى ثلاثة أهداف، الفلبين حظة ورطتها

جرد | 2018 تكنولوجيا الذكاء الاصطناعي اختراق العالمية TOP10 (تقرير)

ديزني معا! اثنين من المساعدات الخارجية في الدوري الممتاز السابقة، وجهت تيانجين الصداقة من ألمانيا!

"ملك الكون" جولدمان تقاطع في التاريخ، لدينا الآلي آلة شامل

من صفر إلى | المطلوب 14 AI إدخال دفتر قائمة القراءة (مرفق رابط PDF)

الشعب الصيني فقط سوف تمرير وو لي أيضا 32 سنة، وكان وطني الماضي مايسترو خط الوسط لكرة القدم؟

بيع 1 سنة 100،000! "واتهم حقيبة" بعيدا فاز 20 مليون $ الجولة B التمويل

توعية المواطنين النار شهر تجربة حية "النجدة" هو أقصر في ثواني فقط 19

حصريا | تفسير بيانات الأداء توليف النص في تقنيات التعلم الآلي

الإرهاب الجسدي! لعبة 90 دقيقة، كما قام سون هيونغ مين وقفة واحدة الزنادقة التجاوز!

ما الفيلم تبادل لاطلاق النار، والذكاء الاصطناعي لها الكلمة النهائية؟

سوف مدرب تايلاند ان يخرج بعد كأس الصين؟ الأصل لا تسمح لكرة القدم خسر مدرب!