الجاف | UT أوستن الدكتوراه شين يان ياو: بناء على عمق الاعتراف كيان اسمه التعلم النشط

تقنية مراجعة AI حسب: وكما نعلم جميعا، فإن التعلم العميق انفراجة في مجموعة متنوعة من التطبيقات العملية، والرئيسي وراء القوة الدافعة من البيانات الكبيرة، ونماذج كبيرة والخوارزميات. في الكثير من المشاكل في الحصول على علامات دقيقة لكميات كبيرة من البيانات يتطلب تكلفة عالية، والتي غالبا ما يحد من الطلب على عمق التعلم. على التعلم النشط من خلال تصفية الخالي من الملصقات والبيانات، يمكنك استخدام كمية صغيرة من البيانات المسمى لتحقيق دقة التعليم العالي. ولذلك، أصبحت أساليب التعلم النشط التعلم عمق بحث الساخن.

في الآونة الأخيرة، على GAIR محاضرة الدكتور القراءة شين يان ياو من جامعة تكساس في أوستن يناقش تطبيق والتفكير التعلم النشط في دراسة متعمقة للتمديد بناء على برنامج التدريب الداخلي في منطقة الأمازون، والمواد ICLR المشتركة عمق التعلم النشط، والمادة ICML.

شين يان ياو، جامعة تكساس في أوستن طالب الدكتوراه، وهو العام الثالث في القراءة، الهندسة الإلكترونية، جامعة تسينغهوا العليا والبحوث كبير في نظرية التعلم الآلي وتطبيقاته، عملت كمتدربة في منطقة الأمازون، ومعهد بحوث آسيا مايكروسوفت.

حصة الموضوع: تطبيق التعلم النشط والتفكير في التعلم العمق

حصة الخطوط العريضة

خلفية التعلم النشط وأهمية
نظرية التعلم النشط
طرق البحث المتطورة والتعلم النشط في التعلم العمق
التحديات التعلم النشط في التعلم عمق

حصة المحتوى:

حصة تستند نفسه في برنامج التدريب الداخلي في العام الماضي أمازون "التعلم النشط على أساس عمق NER ديب التعلم النشط للاعتراف مسمى الكيان" بدأت، ورقات عن مشروع "التعلم النشط العميق لمسمى الكيان الاعتراف. ICLR، 2018.Shen وقد وآخرون ". تلقتها عمق من أكبر مجالات الدراسة سوف ICLR عام 2018. القائمين على المشروع، ناقشنا دور وتوسيع عمق اللعب التعلم النشط في جميع أنواع المشاكل المخابرات أو تعلم الآلة الصناعية.

خلفية التعلم النشط وأهمية

نشط التعلم وتعزيز التعلم، والتعلم شبه إشراف والتعلم عبر الإنترنت مشابه، فهي بين التعلم تحت إشراف والتعلم غير خاضعة للرقابة، ولكن التعلم النشط مرة أخرى، والمفاهيم الثلاثة المختلفة، ويمكن الاستفادة من أسطورة أدناه لفهم التعلم النشط معين.

يشرف على النقيض من التعلم، والتعلم النشط والتوضيح مفهوم التعلم شبه الإشراف عليهم، يمكن أن ينظر إليه: في التعلم النشط، فإن نموذج (المتعلم) أخذ زمام المبادرة لتوفير بيانات تريد وضع علامة للعامل، وليس من قبل العمال. FIG من العمود الأخير من طراز (المتعلم) للعامل الخط الأزرق هو الجزء النشط من التعلم النشط في هذه المرحلة فإنه سيتم فحص البيانات تلقائيا نموذج يتم وضع علامة، يحدد عينات يستحق التعلم، وهو لا يستحق التعلم.

التعلم النشط لديه تركيب الاستعلام عضوية، وأخذ العينات الانتقائية على أساس تيار وأخذ العينات ثلاثة سيناريوهات (طريقة) القائم على حمام السباحة.

أخذ العينات تجمع القائم، بحكم تعريفها، أن جميع البيانات موجودة في بركة. مهمتنا هي لاقتطاف بعض العينات ملحوظ في البركة. في هذا الإطار، يتم تزويد جميع العينات للنموذج، هو المسمى المحدد جزء نموذج من العينة. في الممارسة العملية، وأخذ العينات على أساس مجموعة من الطرق الثلاثة استخدام ما يصل.

مقارنة مع أخذ العينات على أساس تجمع، على غرار إعدادات الأخريين المزيد من الناس لمعرفة الطريقة من الأشياء.

توليف الاستعلام العضوية، يعني أن النموذج يمكن أن تولد عينة جديدة، وهذا هو، ونموذج يمكن التلاعب بها لتوليد العينات. هذا هو مماثل لشخص إعطاء أولوية قصوى لعملية التعلم، وتوليد مشاكل جديدة خاصة بهم، وتحسين معرفتهم من خلال دراسة أكثر عمقا من مشاكل جديدة.
على أساس تيار أخذ عينات انتقائية، تشير عينة ليست في حوض السباحة، بل هي نظام معين لرؤية نموذج، ولكن احتياجات نموذج لتقرر ما إذا كانت تسمية كل عينة جديدة لنرى. هذه العملية مشابهة لكل يوم الناس يقبلون مفاهيم وتعريفات جديدة واختيار احتياجات المحتوى من دراسة متخصصة، لا تحتاج يتم تجاهلها أو نسيانها.

وباختصار، دراسة حديثة من عشر سنوات أو عشرين سنة، ومعظم أساليب التعلم النشط ومجالات المواد الرئيسية على أساس أخذ العينات المعتمدة على المجمع، ولكن في الواقع أن تكون حقا التعلم النشط، ونحن بحاجة إلى أن تكون قادرة على التكيف مع نموذج الاستعلام عضوية التوليف والقائم على تيار أخذ عينات مختارة من كل من الإنسان وطريقة التعلم هو أكثر مماثلة الى مكان الحادث.

ملاحظة: للحصول على شرح مفصل للمصطلحات وصيغ يمكنك مشاهدة تشغيل إطار التعلم النشط من قسم الفيديو في إطار التعلم النشط، ونموذج لديه استراتيجية الاستعلام (أي الطريقة التي تحتاج إلى تصنيفها الحكم عينات). في عملية التعلم النشط، وسوف يستمر النموذج لحلقة من خلال الخريطة، فإن دقة النموذج أيضا أن يواصل زيادة، وربما تكون أفضل من البيانات تميزت وضع عشوائيا دقة استراتيجية الاستعلام نموذج، وعندما دقة بعد أن وصل إلى مستوى معين، لوقف وضع العلامات.

ثم شرح هذا النوع من التعلم النشط ويستخدم على نطاق واسع استراتيجية الاستعلام، الذي يقوم على أساس عدم التيقن من طريقة أخذ العينات (عدم اليقين طرق أخذ العينات). لأنه يقوم على مفهوم بسيط، وهذا هو، عندما يكون هناك تصنيف أو نموذج، حدد تلك الموجودة في معظم احتمال غير مؤكد عينة وضع العلامات. "إن معظم احتمال غير مؤكد" هناك طرق عديدة تعريف تعريف الأكثر شيوعا من عدة طرق هو موضح في الشكل التالي.

ملاحظة: تفسير محددة من كل طريقة، يمكنك ان ترى ذلك الجزء من تشغيل الفيديو

العديد من تعريف المستخدمة عادة من الطرق بما في ذلك أقل ثقة، الهامش (بشكل رئيسي في عدة تصنيف)، الكون المنوال، وتسلسل الكون N-أفضل SE، وما شابه ذلك.

وتجدر الإشارة إلى أن الطريقة المذكورة أعلاه على أساس عدم اليقين في أخذ العينات (عدم اليقين طرق أخذ العينات) هي واحدة فقط من العديد من الطرق لتجربة التعلم النشط. ما يلي يشار أيضا إلى أخرى (أي سؤال من قبل لجان)، بالإضافة إلى ذلك هناك مسافة أخذ العينات بين جميع النقاط على أساس العلاقة (أشر إلى اختيار معظم معبرة، وليس فقط لكل بل هو أشر إلى تحديد مقدار عدم اليقين). وبشكل عام، يمكننا أن نجعل الكثير مثل هذا النوع من الأساليب التجريبية. من ناحية أخرى، هناك أيضا البحوث النظرية في التعلم النشط الكثير من الناس مستمرة. ونحن هنا نلقي نظرة سريعة على المبادئ الأساسية لهذه النظريات.

نظرية التعلم النشط

وفيما يلي موجز مقدمة لنظرية التعلم النشط.

الاستعلام عن طريق لجان هي خوارزميات مهمة جدا، يقترح (يتم عرض وعدم اليقين طرق أخذ العينات المذكورة سابقا في نفس الفترة) في عام 1992.

الاستعلام عن طريق لجان على الأفكار والنظريات الأصلية، ونحن نستخدم الرسم التوضيحي التالي لتوضيح ذلك.

تصنيف الخطي في السؤال، ونقطة نقطة حمراء النقطة الخضراء ملحوظ، يمثل خط عدة قوائم من الممكن تصنيف (والذي هو عدة أسطر أخذ عينات من الفضاء الفرضية، يمكن افتراض أن مساحة المنحدر من مجموعة خط يختلف أعرب مستمر حيث كل الخط الصحيح وللتمييز بين نقطة نقطة خضراء حمراء). الخوارزمية QBC، عندما يكون هناك عينة واردة جديدة (المسمى معروضة)، واخترنا عشوائيا يتم تحديدها من قبل افتراض خطين أن هاتين النقطتين تنتمي إلى أي فئة (أحمر أو أخضر)، عندما تستمد السطرين (عندما تصنف على أنها النقط الحمراء) عندما التصنيف هو أداء ثابت، وليس علامة اختيار تلك النقطة. ثم حدد عينة التالية، ثم مرة أخرى إلى خطين تم اختيارها عشوائيا، ومن المتوقع سطر واحد في حالة حدوث حالة النقطة الحمراء، والخط الآخر هو النقطة الخضراء توقعت (أي نتائج غير متناسقة)، وهذا النموذج يحاول نقطة علامة (المسمى أحمر) وتقليل مساحة فرضية (خط إزالة تلك التي تنبأ بأنه نقطة خضراء) عن طريق حذف افتراضات خاطئة.

ووفقا لهذا الفضاء فرضية سوف نشير إلى العديد من المصنف الخطي، وتستمر عملية دورة، أي عندما تنخفض عينة داخل المنطقة وصفت إعادة الاختيار. فإن حجم المساحة الفرضية تصبح أصغر تدريجيا، وتولد في نهاية المطاف نموذجا دقيقا جدا.

هنا، ونحن تلخيص نظرية التعلم النشط التي يشيع استخدامها عدة افتراضات: أولا، نفترض أن المصنف خطي للانفصال، أن هناك المصنف الخطي الكمال تصنيف جميع العينات. ثانيا، على افتراض مهمة تصنيف شيئين بدلا من إنجاز العديد من المهام والثالثة، على افتراض عدم عينة الضوضاء. الرابع، والحفاظ على مساحة الفرضية ممكنا.

هذا الجزء من الأدب أن يكون أربع نقاط في القليل من الاسترخاء والدراسة، ولكن المشكلة الحقيقية التي واجهت حالات ينتمون إلى ما سبق أربعة افتراضات غير راض، مما أدى إلى الناس يفضلون عدم اليقين في الممارسة الأساليب التجريبية أخذ العينات طرق وما شابه ذلك. ولذلك، نشطة خوارزمية التعلم نظرية التصميم لسبب عدم وجود توجيه التطبيق العملي يمكن تلخيصها على النحو الأسباب الثلاثة التالية:

الحفاظ على مساحة فرضية لا يطاق

مقارنة عينات انتقائية على أساس تيار الفرضية التقليدية، في الممارسة العملية يفضل أخذ العينات على أساس تجمع استخدام

تصنيف تعقيد مهمة ما هو أبعد من مهمة تصنيف الثنائية الفعلية

طرق البحث المتطورة والتعلم النشط في التعلم العمق

هذه المشاكل المذكورة أعلاه الناجمة عن وصول عمق التعلم وأكثر أهمية. يمكننا أن نرى عمق التعلم حقق نتائج لافتة في العديد من التطبيقات دينا نماذج معقدة وكمية هائلة من البيانات، في نفس الوقت بسبب يؤدي نموذج غير الخطية إلى الفضاء فرضية للحفاظ على يطاق جدا. وتشمل هذه التطبيقات الشكل التالي نحن أكثر الناس دراية، وقد استخدمت على نطاق واسع نوعين من نموذج التعلم التطبيقات عمق: CV وNLP.

بناء على ما تقدم نموذجين، هناك نوعان من المواد درس مؤخرا اثنين أو التعلم أكثر نشاطا في نموذج التعلم العمق. كما ناقش أساسا كيف (مثل طبقة وسيطة ما إذا كان سيتم توفير المعلومات تضمين أكثر ثراء لتحديد ما إذا كانت مماثلة بين العينة والعينة، وما إلى ذلك) مع طبقة المتوسطة الإلتواء إلى تعلم اختيار العينة بشكل أفضل.

لا يشمل عمق التعلم النشط أكثر من مجرد حل هاتين المهمتين، هم اثنين فقط من أنواع الصور والمشاكل اللغوية النموذج الأكثر احتمالا: فهي على غرار أصبح مشكلة تصنيف بسيطة.

المهام تطبيق التعلم العميقة التي نواجهها في التطبيق العملي لقضايا أكثر تعقيدا مثل تسلسل (مشاكل متتابعة). في مهمة معقدة، وهناك نوعان من القضايا تصبح بارزة بشكل خاص:

عمق سرعة نموذج القطار بطيئة جدا (سرعة تنبأ هو أيضا بطيئة أو أبطأ)

سواء المنهج التجريبي السابق يمكن أن تستمر في لعب دور في المشاكل المعقدة؟

هذا يؤدي إلى برنامج التدريب الداخلي في العام الماضي في منطقة الأمازون "التعلم النشط باستخدام عمق اسمه الاعتراف كيان (الاسم Enity الاعتراف، NER)." في هذا المشروع، ونحن بحاجة إلى تسلسل المهام علامات للتحقق من صحة فوائد التعلم النشط في العمق. سؤال السيناريو NER هو: إعطاء فترة الاستعراض المستخدم الأمازون، واستخدام نموذج التعلم العميق اعترفت تلقائيا منظمة تمثيلية، المكان والزمان، وأنواع عديدة من تعابير لها معنى الكيان المدى. لدراسة هذه المسألة يساعد على فهم معنى الرسالة آلة موقع الويب المستخدم، والذي هو أساس لكثير من أعلى مهام البرمجة اللغوية العصبية. يمكننا أن نتصور، وتتميز هناك في ذلك الوقت من جمع مجموعة البيانات، ونحن في حاجة إلى الاعتماد على الكثير من الشرح اليدوي ووضع العلامات دقيقة تصحيح اسمه فئة كيان غير تستغرق وقتا طويلا جدا، والذي هو السبب في أننا نأمل أن تكون قادرة على الحد من عمق علامة التعلم النشط كمية من الأسباب الرئيسية والدوافع.

أولا، دعونا ننظر في مهمة NER العامة، والحصول على أفضل نموذج يمكن التنبؤ بما نتائج التصميم. عمق نموذجا NER نموذج القطار شعبية جدا أقل العروض. ويستند هذا النموذج على ثنائي LSTM آخر يولد تسلسل وفقا لأعلى التنبؤ احتمال CRF.

وبالإضافة إلى ذلك نموذجا يحتذى به في السنوات الأخيرة كانت هناك مجموعة متنوعة من النماذج، بما في ذلك استخدام الأحرف مستوى التشفير (الرسالة ناقلات مستوى الكلمة)، وورد المستوى التشفير (كلمة ناقلات)، ثم استخدمت لصنع RNN النهائي أو CRF توقعات. يتم تعيين نماذج مختلفة عليها في الجدول في FIG.

محددة لهذه المهمة، إزالة الإشراف التعلم، علينا أن نكون قادرين على نموذج بسرعة على التنبؤ وتقييم عينات من عدم اليقين. من أجل مواصلة تسريع استخدام التعلم النشط في نموذج عملية لتحديد عدم اليقين، ونحن تسارع كذلك نموذج عمق، اقترح نموذج يستند إلى بنية CNN-CNN-LSTM، وهي الأحرف المستوى التشفير ونحن جميعا كلمة المستوى التشفير تعلم مع CNN، ولكن ليس الاستخدام النهائي LSTM CRF التنبؤ طبقة.

كما هو مبين أعلاه، فإن اليسار هو نموذج الأحرف المستوى التضمين، منتصف هو على مستوى العالم تضمين النموذج، الحق هو تسلسل LSTM نموذج الجيل.

من خلال التجربة، يمكن لنا أن نقارن استخدامات النموذج بوصفه CNN تأثير وفك التشفير LSTM كما أثر. كما يمكن أن يرى، واستخدام بنيتنا CNN-CNN-LSTM تحسنت بشكل ملحوظ سرعة التدريب والتنبؤ. لهذا فإننا نستخدم والتحقق من عمق خوارزمية التعلم النشط مهم جدا.

على الجانب الأيسر هو نتيجة اختبار (عدد قليل من الجمل، وأربعة أنواع فقط من تسمية التنبؤ) على مجموعة البيانات الصغيرة؛ على الجانب الأيمن عبارة عن مجموعة كبيرة من البيانات من نتائج الاختبار (مئات الآلاف من الأحكام، التسمية التنبؤ 18 نوعا). يمكن أن ينظر إليه في مجموعتي البيانات، والتشفير باستخدام CNN LSTM يمكن الحصول على تسريع أفضل مقارنة. حق سرعة رفع الجانب هو أكثر وضوحا، تصل إلى عشرة أضعاف تقريبا زيادة السرعة، ودون فقدان الدقة والدقة. سوف تستخدم هنا فك LSTM أداء أفضل من القيام CRF، CRF بسبب تعقيد حساب خوارزمية ويتناسب مع مربع عدد من العلامات، ولكن النسبي فقط على طول LSTM عدد الطابع الزمني، عندما يكون عدد من التسميات كبير، استخدم LSTM متفوقة CRF. وهذا هو السبب في أننا لا نفعل الترجمة الآلية من CRF، وإخراج إمكانية كثيرا (هناك عشرة آلاف ضوء كلمة الاختيار).

بعد الانتهاء من التصميم، يمكننا أن نبدأ أساليب التعلم النشط محاولة العمق. ونحن نعتبر أن أربعة خوارزميات الرئيسية التالية والتحقق من أدائها من خلال التجارب:

أي، والثقة أولا أقل (ويشار إلى LC)، ويتم احتساب قيمة احتمال القصوى المقابلة لالتنبؤ احتمال التسلسل.

ثانيا، الحد الأقصى لتطبيع دخول-Probality (MNLP)، وLC على أساس النظر في طول تسلسل يتم إنشاؤها في تأثير عدم اليقين، ونحن نفعل التطبيع (أي، مقسوما على طول كل جملة)، ولكل منها احتمال وقيم السجل احتمال إخراج نقطة التلخيص بدلا من ذلك.

والثالث هو الخلاف النشط طريقة التعلم القائم، دورا رئيسيا آخر في استخدام التعلم التسرب عمق (التسرب الدور الأصلي هو جعل نموذج التعميم أفضل في التدريب). في العام الماضي، غال وآخرون. تقول المادة لنا، وإذا كانوا أيضا القيام الاستدلال من التسرب يعادل في الواقع لحساب عدم اليقين نموذج. نحن هنا أيضا بحاجة إلى حين القيام التسرب تفعل عملية الاستدلال، وحساب النتائج التي تم الحصول عليها في أنواع M من وكم هي غير متناسقة.

وتستند هذه الطريقة الرابعة على كل نقطة أخذ العينات هو أسلوب تمثيلي من إزالة هو النظر في كل نقطة من عدم اليقين، ودرجة محسوبة من التشابه بين العينة والعينة، وكذلك تحديد اختيار أن عينة أكثر تمثيلا . أكثر طريقة فعالة لحساب هذه الأساليب تتطلب كمية كبيرة في حالة من البيانات. نعيد التعامل معها باعتبارها مشكلة تعظيم submodular والحصول على الحل الأمثل تقريبي باستخدام خوارزمية الجري.

طريقة الخامس هو لتوليد عينة عشوائية وصفها بأنها الأساس.

لاختبار فعالية من خمسة خوارزميات ذكرت للتو، والقيام اختبار أبسط.

ممثل بثلاثة ألوان باستخدام نماذج بيانات مختلفة تدريب، ثم كل عينة تحمل علامات وغير مدربين، وطريقة أخذ العينات باستخدام الشك (عدم اليقين طرق أخذ العينات) لحساب الأكثر غموضا 1000 العينات وتوزيعها . على سبيل المثال شمال غرب ممثلي الأخبار، وإذا كان لدينا لا نموذج التدريب باستخدام أي من شمال غرب عينة من المعلومات التدريب (نموذج البرتقالي)، ثم عدم التيقن من طريقة أخذ العينات يمكن أن نجد السابقة شمال غرب أعلى نسبة العينات غير مؤكد 1000، هذا أيضا يثبت بشكل غير مباشر أن الخوارزمية هو الأكثر فعالية.

أوضحت النتيجة النهائية في الشكل 17.

ملاحظة: PPT أخطاء المحتوى، يجب LC MNLP

أولا، طريقة خط الأساس هو أقل بكثير من طرق تصنيف أخرى. في مجموعة متنوعة من الأساليب، ركضنا العديد من التجارب لإثبات دقة نتائج NER، كل طريقة تشغيل 10 مجموعة، ووجه هذا الرقم أيضا إلى الانحراف المعياري، يمكنك ان ترى: LC تقريبا قليلا، MNLP و BALD أفضل. وعلى الرغم من BALD مع MNLP جيد على قدم المساواة، ولكن نظرا للحاجة إلى تنفيذ 100 مرات لكل الاستدلال عينة في التجارب BALD حساب، والتكلفة الحسابية من بسيط أسلوب المعاينة عدم اليقين، وبالتالي MNLP هو أجدر من النهج المتبع. وبالإضافة إلى ذلك، وجدنا أن عمق المشكلة في التعلم النشط، بناء على اختيار الأسلوب التمثيلي لم يحقق أي تحسن فيما يتعلق LC النقيض من ذلك، فإننا نعتقد أن الأكاذيب السبب الرئيسي في التسلسل الذي القضايا المهمة، فإنه من الصعب معرفة جيدة جدا تمثيل متجه، أن التضمين لا تمثل بكثير من التشابه بين عينات حقيقية. لذلك تحتاج فقط للتنبؤ احتمال كل عينة من عدم اليقين، فقد كان قادرا على تحقيق نتائج طيبة للغاية.

نشرح بإيجاز عن عمق عدة غيرها من أعمال التعلم النشط. ويمكن تقدير نموذج باستخدام مرحلة الانقطاع عن الدراسة في عدم اليقين الاستدلال المذكورة في المناقشة الواردة أعلاه هو ICML 2017 المادة، ركزت في المقام الأول على خصائص عمق النموذج نفسه. واحدة أخرى يستأصل تركز المادة 2017 البحوث حول التعلم النشط لتقليد شبكة العميقة باستخدام اثنين من عملية أخذ العينات من الفضاء الفرضية، وشبكة عميقة اثنين تحديثها باستمرار، وتحديث شبكة عميقة التعرف على اثنين يتم تحديد الافتراضات أخذ العينات بشكل متتالي أو الحاجة صفت العينات. هذا يتوافق مع البديل من QBC الخوارزمية، واستخدام علامة قوية من عمق نموذج. هذه المواد عنوان محدد، ومؤلف المعلومات ذات الصلة تشير باور بوينت والفيديو.

أدناه، فإننا سوف نستعرض بإيجاز الإطار الأساسي للتعلم النشط. كما يمكن أن يرى، وتهدف ونحن أساسا في ثلث العينات القائم على حمام السباحة، حتى لا تكون هناك دراسات على اثنين آخرين من ذلك؟

وقد اقترح الدراسات الحديثة استخدام نشط تعزيز التعلم التعلم لمحاكاة عملية اختيار العينة، وعلامة العينة المختارة ينظر إليها على أنها تعزيز السلوك تعلم: أي علامات أو علامات. ICML2017 من هذه المادة هو استخدام عامل تعزيز لمحاكاة نشطة عملية اختيار العينة التعلم التعلم. ICLR2018 من هذه المادة، تعتبر المؤلفين مهمة أكثر تعقيدا، وذلك باستخدام أسلوب التعلم التعزيز لتوليد القضايا ذات قيمة أكبر. هاتين المادتين تنتمي إلى سيناريوهين التعلم النشط الإطار الأساسي الآخر.

التحديات التعلم النشط في التعلم عمق

الجزء الأخير من التحدي لإدخال التعلم النشط في التعلم العمق. في بعض التقاليد، وقد عرفت أنه من الأفضل المهمة، نحن بحاجة إلى عملية أسرع وأسرع تدريب الاستدلال، منها سرعة الاستدلال هو أكثر أهمية. لأنه في التسلسل الفعلي من المهام، والتدريب هو في الواقع سريع نسبيا. ونحن لم يكن لاحتفال كلمة في الجملة لتحديد ما هو الأهم، وهذا هو أكثر صعوبة. على سبيل المثال، في ترجمة الترجمة الآلية في كل جملة وجملة أقل بكثير من التدريب، وذلك لأن العملية غير المتوازية سلوك الاستدلال، وهو واحد من جوانب التعلم النشط الاحتياجات البحثية العمق.

والثاني هو مزيج من التعلم النشط وتوليد النموذج، الذي هو مجرد أن نرى إطار ثلاثة نماذج، النموذج الأول يمكن أن تتولد تلقائيا العينة، والنقطة الحالية من البحوث حول هذه المسألة والتحدي نادرا هائلة.

والثالث هو الأمثل، الأمثل هو جزء من أي مهمة مهمة جدا، ولكنها ليست تصميم الشبكات واضح والاستفادة المثلى من عمق نموذج لجعل أكثر كفاءة لتعلم المهمة، وعمق التعلم النشط هو في الواقع على التحسين، وذلك الأمثل هو أيضا نشطة تعلم مسألة مثيرة للقلق.

في دراسة متعمقة لعملية التعلم النشط، يمكننا أن تقترض مقارنة مع عمق من الناس إلى التفكير في عملية التعلم النشط. خذ قبلت مهمة صعبة لالترجمة الآلية، على سبيل المثال، نقوم به حاليا آلة التعلم مهمة الترجمة الآلية، حاجة الملايين من مجموعات البيانات لتدريب نموذج للحكم، ولكن هذا النوع من العملية مع الناس الترجمة مختلفة: التعلم النشط في الترجمة البشرية والتي تلعب دورا هاما جدا. التفكير الترجمة الآلية والعملية التعليمية الإنسان، يمكن أن نجد التعلم النشط (بما في ذلك التعلم العميق النشطة) لا تزال مساحة واسعة للتحسين. وكمثال آخر، قبل المهمة NER، ويعبر عن نموذج ولدت عن طريق حساب قيمة احتمال من عدم اليقين، ولكن الناس لا تحتاج إلى حساب احتمال قيم دقيقة من الناس عندما يرون يتم تحديد العقوبة تفسير غامض بسيط إذا كانت عينة تحتاج إلى معرفة، وهذا هو، من دون أن طبقة إلى وحدة فك الترميز، يمكنك جعل الحكم قبل مرحلة التشفير. وهذا يشكل تحديا كبيرا لعمق الحالي للالتعلم النشط لا يمكن حلها.

هذه هي حصة من الضيوف الحالي، انقر لقراءة النص الأصلي للنهاية مشاهدة هذه الفترة GAIR قاعة كبيرة التشغيل الكامل الفيديو.

نعم، نحن تجنيد الناس، لمعرفة؟

BAT العليا خوارزمية مهندس ودورات التطوير الحصرية

معظم مقربة من الحياة والعمل من المرح التطبيق العملي للمشروع

إدارة الصف مساعد الطالب المهنية Q & A

تطبيق معارفهم لاتخاذ العرض، وهي استكمال يوصي التوظيف

(^ 0 ^) تقاسم ترحيب، أراك غدا!

طريق الحرير