جامعة تسينغهوا، وانغ Yansen: كيفية استخدام الأسئلة لتعزيز التفاعل حوار مفتوح نظام الحقل

لى فنغ شبكة AI Yanxishe حسب: الآن، وهذا النوع من الدردشة، مثل الروبوت قلطه تدريجيا إلى الرأي العام، وجزء حتى تصبح من الناس يقضون وقت الفراغ رفيق. الآن، ومع ذلك، على التفاعلي دردشة الروبوت، والاتساق ومنطق الحوار، لا تزال هناك بعض المشاكل عيوب تصميم.

محاضرة عن AI Yanxishe الأخيرة، وانغ Yansen من جامعة تسينغهوا لتبادل مقال المدرجة في أوراق ACL2018، في محاولة لاستخدام الأسئلة لحل نقص في الدردشة القضايا الروبوت التفاعل.

حصة رئيس مجلس النواب:

وانغ Yansen، تسينغهوا إدارة الجامعة من الطلاب الجامعيين علوم الحاسب متاحة الآن في تسينغهوا إدارة جامعة الحاسوب التفاعلية AI مجموعة أبحاث مختبر الذكاء الاصطناعي، تحت وصاية البروفيسور هوانغ مين كذبة تشارك في أعمال البحث والاتجاهات البحثية الرئيسية لنظم الحوار، وتوليد النصوص ومعالجة المعلومات المنطقي.

الفئة المفتوحة عنوان القراءة:

حصة الموضوع: كيفية استخدام الاستجواب المعززة الحوار التفاعلي نظام حقل مفتوح

حصة الخطوط العريضة:

نظام الحوار حالة تطوير الحقول المفتوحة، ومشاكل
جدوى استخدام أسئلة تفاعلية لحل مشكلة الحقول المفتوحة الحوار موجودة في النظام مع الفكرة الأساسية
كيفية استخدام فك القاطع (كتبته فك) أن نسأل الأسئلة الصحيحة في نظام حوار هادف
نموذج تحليل النتائج على مجموعة البيانات، ولا تزال هناك مشاكل

شبكة لى فنغ AI Yanxishe سوف تشارك تتلخص محتوياته كما يلي:

يشرفني جدا للمشاركة في هذه الورقة، ونحن نستخدم وحدة فك الترميز لنوع من الأسئلة نظام الحوار المفتوح باب العضوية، لتعزيز التفاعل والنظم البشرية.

سأقدم لكم عن نظام حوار مفتوح، والميدان هو حاليا لا يزال ما هي المشاكل، وهو ما يقودنا لماذا Q & A جلسة لإدخال النظام في الحوار، ومن ثم مقارنة مع العمل القائم، فإننا سوف يشرح نوع من فك وأخيرا، ليعرض مجموعة البيانات لدينا.

الأصوات الحوار مثل نظام كبير جدا، فهذا يعني أن التفاعل البشري مع الكمبيوتر.

من الأنواع، ويمكن تقسيمها إلى نظام الدردشة و نظام قائم المهمة . حول نظام الدردشة، وأعطي بعض الأمثلة يمكننا أن نفهم: سيري وقلطه، عند الدردشة ونظام الدردشة التي يمكن الدردشة معك كأصدقاء. والمثال النموذجي هو مهمة نظام خدمة العملاء الروبوت البنك المستندة إلى المهام، فإنك تعطيه طرح بعض الأسئلة على الأعمال التجارية، يمكنك على الفور الحصول على الأجوبة.

من الحل، ويمكن تقسيم النظام إلى الحوار: حكم القائم ، وبناء استرجاع و ولدت على أساس . ميزات القائمة على القاعدة التي ستقام في وضع مسبقا (نمط)، والرد عند الضرورة وفقا للوضع، واسترجاع القائم على النموذج من خلال التدريب أو نموذج التعلم، انتقاء أفضل رد من عينة القائمة؛ يشير لدت على أساس ومن خلال التعلم العميق أو تعلم الآلة، مما يسمح للعينات التدريب قد يعطي استجابات مختلفة للمدخلات مختلفة.

اليوم، نحن نتحدث أساسا عن القيل والقال التي تم إنشاؤها بواسطة نظام يقوم على أول نظرة على بعض من نتائج البحوث الجديدة نسبيا.

هذا هو استخدام نموذج التعلم العميق لتدريب بعض النتائج جيدة. كما يمكن أن يرى، يولد تعلم الآلة وسيلة جيدة جدا لديها ميزة، التي لديها بعض مبتكرة، لم تعد تقتصر على نتائج البيانات التدريب، ولكن استنادا إلى نموذج ولدت لتوليد الرد، والرد، وبالتالي غالبا ما خلاقة.

ولكن نموذج له حدود، في ما سبق يفهم، أن هذا المنطق لا يزال ضعيفا نسبيا القيام به .

من مستوى أعلى، وجدنا أيضا فهم الدلالات ، فهم السياق ، شخصية الاتساق الهوية سؤال. كثير من الناس استخدام نظام الدردشة وجدت خلال الكثير من الوقت في الحديث إلى نصف لن يذهب، لأن الروبوتات أنفسهم اليوم الأول يتحدث الميتة.

حتى بعض ينطوي على مسألة المستوى الأخلاقي، وبمجرد أن الروبوت لا يمكن فهم القصد من الخطاب الإنسان، وسوف يؤدي بسهولة إلى سوء الفهم.

ويبين الشكل المستخدم للروبوت، وقال في ذلك الوقت من الاكتئاب، ثم إلى المثال الثاني، وقال المستخدمين أنهم يريدون أن يعيشوا في اليوم التالي، والنتيجة هي طبيعية لالتقاط الروبوت: نعم، وأنا سوف أذكر لكم.

باختصار تلخيص، توجد درجات مختلفة من المشاكل على نظام آلة لفهم معنى الجملة، والاتساق السياق والتفاعل، وتتجسد أساسا هذه المشاكل في محتوى ، AI شخصية ، عاطفة AI و سياسة الدردشة على، وهناك بالفعل بعض العمل في محاولة حل هذه المشكلة.

على سبيل المثال، وهذه المواد الثلاث هي من البداية العاطفي إلى التفاعل وطرح الأسئلة والجملة السيطرة، ومحاولة حل التفاعل مشكلة الجهاز، والسياق لقضية التوافق، هذه المواد تؤكد إعطاء الروبوت شخصية مستقلة، لذلك فإن الناس لا مسألة وعملية الرد الآلي مشوشا، أما عن كيفية جعل الروبوتات تصبح ذكية، وتشير هذه المادة مستودع المعرفة يمكن إدخالها من الخارج، وتجنب تظهر إجابات غير ذات صلة.

اليوم نتحدث عن كيفية تعزيز التفاعل بين الروبوت عن طريق طرح الأسئلة.

الجهاز قد لا تعرف ما هو سؤال جيد، وهذا ينطوي على عامل مهم: فهم المشهد وهذا هو، آلة لفهم ما الجملة كلها ليقول، بدلا من حصرها في المحلية، وذلك لتحقيق أفضل تأثير الأسئلة.

وقد أظهرت دراسات سابقة أن السؤال هو تفضي سلوك أكثر استباقية للحوار بسلاسة. عمل في الماضي هو جعل النظام المادة في الوقت المناسب لتحديد المعلومات الأساسية تقع، وبالتالي جعل الأسئلة وهذا يعني أيضا أن هناك أسئلة لا تساهم في تحسين المقالة معلومات الزيادة الشاملة ولكن على محتوى سؤال مكرر أعلاه، هذه ليست مناسبة للتطبيق مباشرة إلى نظام الحوار.

عملنا السابق التنقيب وهناك العديد من الاختلافات الرئيسية:

أولا، نحن نأمل تعزيز التفاعل والاستدامة اسمحوا الدردشة بشكل فعال المضي قدما، وعمل في الماضي أشبه استرجاع المعلومات؛

ثانيا، في أنواع من الأسئلة، والعمل الماضي بعد إجابة معينة، في شكل أسئلة كان من المقرر أن يموت، ونأمل الأسئلة من قبل النظام الحوار نفسه لإيجاد وطرح الأسئلة الصحيحة .

ثالثا، في معظم الحالات، نحن لسنا على الأمور المذكورة أعلاه، وطرح الأسئلة، ولكن لتسألوا عن أشياء المرتبطة به، الأمر الذي يتطلب نموذج وهناك درجة معينة من التنقل في إطار موضوع معين .

من ملاحظة بسيطة وجدنا ينبغي بذل سؤال جيدة السؤال كلمة ، كلمة الموضوع موضوع و الكلمات الشائعة تكوين - تقرر وضع مسابقة كلمة السؤال، كلمة موضوع يوفر القدرة على تصميم نموذج لموضوع الهجرة.

لذلك نقترح نموذجا الجيل الجديد - نوع فك التشفير وينقسم الحكم مما أدى إلى خطوتين، النوع الأول هو وضع جيد، ومن ثم العثور على كلمة المطابقة وفقا لنوع. لتقسيم وفقا لدرجة من أنواع الكلمة، ونحن كتبته فك دينا في كتابة بشدة وأجهزة فك التشفير فك كتبته ضعيفة هما على التوالي HTD و STD التمثيل.

نحن ننظر أولا نوع ضعف فك STD، فك للحالة الراهنة، ونحن كل كلمة (السؤال كلمة / كلمة الموضوع / الكلمات الشائعة)، وبالتالي تولد التوزيع الاحتمالي المقدرة من قبل طبقة من المعلومات. ونحن نفترض أن كل كلمة لديه القدرة ليكون بمثابة نوع من كلمة، فإنه سيتم الحفاظ على نفس ثلاثة أنواع من مفردات المحتوى. كل نوع من فك سوف توقع أولا احتمال كل كلمة في قائمة الكلمات التي تظهر، ثم اكتب الكلمات على احتمال بت تيار فك الشفرة المطلوبة لتنفيذ التوقعات، وأخيرا، إلى الجمع بين الأمرين للحصول على جدول توزيع كلمة احتمال النهائي، أيهما أكبر الرأسي ولدت ككلمة. استخدام نفس المفردات في توزيعات مختلفة، فإن كل توزيعة لديهم نوع المقابلة، لذلك نستخدم استراتيجية مختلطة، مزيج هذه التوزيعات الاحتمالية.

هنا هو صيغة من احتمال الكامل في هذه المشكلة: احتمال كل موقف = الاحتياجات الحالية مضروبا في احتمال لكل نوع من كلمة في الموضع الحالي بأنها احتمال من هذا النوع.

حساب احتمال طريقة بسيطة جدا، وهذا هو، في ولاية النهائية طبقات مع خطية مختلفة ويمكن أن يكون.

نوع لينة من فك لديه مشكلة واضحة، من الواضح أن بعض الكلمات ضغط من غير المرجح أن يحدث كنوع معين من كلمة، لكننا نعتقد أنه من الممكن، والسماح نماذج لدراسة هذا الاحتمال، يبدو من السخف.

لفك المكتوب بقوة، ونحن نأمل أن تكون قادرة على السيطرة على هؤلاء الناس لا ينبغي أن نتعلم من هذا القسم، و "قوي" أساسا في قسمين:

أولا، بعض كلمة كلمة نحن بحاجة إلى تنفيذ تحديد

ثانيا، ما اكتب من الكلمات لكل موقع معين حدد ، يجب أن يكون هناك حكم واضح

دعونا ننظر إطار النموذج.

في فك كتبته بقوة، ليس هناك سوى المفردات، يتم تقسيم المفردات إلى ثلاثة أجزاء، كل جزء المقابلة لأنواع مختلفة. توقعنا أولا التوزيع الاحتمالي من نوع معين، وإعادة استخدام جامبل-softmax هل شحذ، مما يجعلها تلعب دور بوابة مماثلة. وأخيرا، وبوابة للتكيف مع احتمال أكثر من المفردات بأكملها.

دعونا نلقي نظرة على الصيغة.

على وجه التحديد، وكيف المعلمات التشكيل، نظرة على مجموعة من الأمثلة.

يمكننا النظر في استخدام التشكيل argmax ذلك؟ أولا، وظيفة argmax هو غير موصل، وهو ما يعني أن هذا النموذج في عملية التدريب قد يسبب عودة التدرج بعض المشاكل . وبالإضافة إلى ذلك، الغرفة مرة واحدة أجزاء من خطأ التنبؤ الكلام، بغض النظر عن مدى توقع المفردات بشكل صحيح، لا رجعة فيه، وهذا هو السبب في أننا انتهى عدم استخدام argmax، ولكنه اختار لاستخدام آلية تسمى gumble-softmax من.

آليات التوزيع gumble-softmax تتبع توزيع gumble، وإدخال عامل التوزيع العشوائي لتسهيل نموذج التدريب على محو بعض شحذ لا لزوم له.

التي تاو تشير إلى أن درجة شحذ gumble-softmax، معلمة مهمة عظمى، والذي يحدد الحدة من هذا النموذج. إذا تاو هو 1 يعني أن الثابت بقايا الحدة يميل إلى 0 سوف تتحول إلى argmax، فإنه يميل إلى ما لا نهاية إيجابية ستشكل توزيع الزي العسكري. باختصار، تاو هو أصغر، وتأثير واضح في شحذ، تاو، وتأثير أكثر ضبابية بشكل ملحوظ . نتمنى للتحكم في نوع الناتجة عن وضع شحذ، فإنه يأخذ عادة قيمة تاو أقل من 1 في الاستخدام العملي.

في حل مشكلة من نوع السيطرة اضطر في وقت لاحق، ونحن ننظر في كيفية تحديد توزيع قطع من قضية الخطاب، وهذا هو، وكيفية تحديد نوع كل كلمة يتوافق مع.

يتم تحديد السؤال كلمة أفضل لعدد قليل جدا من مجموع الاستجواب؛ تحديد كلمة موضوع لتكون صعوبة تذكر في التدريب، وجميع الأسماء والأفعال ونحن سوف استجابة في التدريب باعتباره كلمة الموضوع، وهذا هو، والأسماء الرد الموقع حيث يتم وضع علامة على المفردات والأفعال المقابلة ككلمة الموضوع.

ومع ذلك، في الاستخدام الفعلي، والرد لا يمكن أن تعطى في وقت مبكر هو جيدة، سيكون اصعب قليلا. من أجل التنبؤ على نحو أفضل، قدمنا PMI المعلومات المتبادلة نقطة يبدو مثل هذا المفهوم، وهو مقياس لدرجة العلاقة بين الكلمة وتظهر كلمة في الرد في هذا المنصب.

في الممارسة العملية، وسوف نقوم بنشر كل كلمة في كلمة كي المفردات من PMI الجمع بين استخدام هذه الصيغة، يمكنك الحصول على كلمات درجة المفردات ذات الصلة كي وما فوق.

20 (المعلمات فرط) لتصبح أعلى الموضوع كلمة، وغيرها من الموضوع أو السؤال الذي يجب تصنيفها على أنها كلمات عادية.

أما بالنسبة لفقدان هذه الوظيفة، ونحن ليس فقط كنموذج العامة مثل التوزيع الاحتمالي من مفردات جعلت فقدان وظيفة، ولكن أيضا زيادة الإشراف على جزء من بوابة الكلام، واستخدام امدا هذا من جزئين المعلمة السوبر التوفيق بين.

وجود نموذج، دعونا ننظر جزء من التجربة.

مع ظهور مجموعة العمل الجديد من البيانات - قواعد البيانات الحوار ولدت في الحوار، ونحن نركز على البيانات تدوين من فحص خارج، وهناك نحو تسعة ملايين، ثم تصفية بعض من الرد أقل أهمية.

وهنا بعض المؤشرات لتقييم التلقائي.

ويصف الخلط بين القضايا النحو وومتميزة (1) ويوصف متميزة-2 من حيث ثراء، ومؤشرات TRR الخاصة بنا ويقترح، وهو ما يمثل نسبة من إجمالي شكلت كلمة موضوع الرد. وعموما، نموذجنا على هذه المؤشرات قد حققت نتائج جيدة.

ثم نلقي نظرة على نتائج التقييم الاصطناعية.

ونحن أساسا للتقييم عن طريق اثنين وعشرين النقيض من ذلك، تقيم أساسا من المؤشرات الثلاثة التالية: الاقتضاء، ثراء، والاستعداد للرد . في هذا الجزء من نموذجنا كما حققت نتائج هامة، والتي نوع قوي فك متفوقة على ضعف أجهزة فك التشفير نوع .

وفيما يلي بعض الأمثلة هنا ولدت.

نموذج مماثل الماضي يمكن أن تعطي فقط "ما"، وحتى بعض من الرد المشترك، ليس لديها القدرة على الاستيلاء على كلمة الموضوع من فوق للقيام موضوع الهجرة، ونموذجنا هو الأسئلة أكثر وفرة، مجرد سؤال والحس السليم "ما سيحدث" لم يتم بعد تحسين هذا.

من نتائج من نوع السيطرة، والبوابة تأثير واضح جدا، ويمكن السيطرة عليه لنوع ديك ويفضل أن يكون في مكان معين، وبالتالي توليد نوع المقابلة من كلمة واحدة.

وينعكس بشكل رئيسي لدينا نموذج خطأ شائع في غياب كلمة الموضوع، والموضوع الذي ولدت حد الخطأ، ونوع من التوقع هو الخطأ، ونسبة حصتها من ثلاثة متشابهة نسبيا.

أن يكون استنتاج بسيط، ونأمل أن تولد أنواع مختلفة من المشاكل كلمة من مشاكل السيطرة، والتي نقترح نموذجا اثنين فك كتبته بقوة وكتبته ضعيفة. يعرض هذا المقالة مشكلة جديدة للجميع، ومجموعات البيانات الجديدة، ونماذج جديدة، فضلا عن بعض المشاكل، مثل نوع من بناء الجملة ومشاكل إطار اختلالها المفردات الذي تسببت فيه.

هذه هي الضيوف الحالي جميعا. أكثر انفتاحا الذهاب فئة فيديو لشبكة لى فنغ AI Yanxishe المجتمع (https://club.leiphone.com/) لمشاهدة. التركيز على عدد جمهور قناة الصغرى: AI Yanxishe (okweiwu)، يمكنك الحصول على أحدث إشعار وقت الفئة المفتوحة الحية.

طريق الحرير

جامعة تسينغهوا، وانغ Yansen: كيفية استخدام الأسئلة لتعزيز التفاعل حوار مفتوح نظام الحقل | AI Yanxishe 66 محاضرة

THX الملك لاول مرة مذهلة قريبا! الاتحاد شنتشن للموسيقى شنغهاي SIAV2019 اللون باستمرار مفاجأة

متحف الاستكشاف: تيغوان فولكس فاجن تيجوان Allspace نسخة 7 L

واد لعبت على النجمة، والضرر الحقيقي للهيمنة على الوادي

"الملك الجديد من الكوميديا" على غرار ستيفن تشو يحلم قليلا النضال المستمر لقاع المجتمع مصغرة صدى قوي إثارة الجمهور

الانضمام إلينا "منظمة العفو الدولية": دخلت بايدو تجنيد المدرسة 2018 جامعة تسينغهوا

عطلة نهاية الاسبوع المرح العائلي أصدقاء تجنيد للتوقيع في أقرب وقت ممكن نزهة، وزرع الربيع واختيار حية حية تشينغ

رخيصة وسهلة الاستخدام، وحتى المهنية ماكياج ظلال العيون الفنان هو كل الحب!

سوف بيجو الجديدة 301 تكون متاحة في مظهر الابتكار 17 مارس

بايدو 2018 في الحرم الجامعي التوظيف والوعظ جامعة بكين للبريد ومحطة للاتصالات، والمحطات الرئيسية الوطنية للعلوم: ندعوك لاستخدام AI "تفعل ذلك بنفسك"

"A يتا: معركة انجيل" الجديدة مقطورة لاول مرة "سوبر بول" يسلط الضوء على عمل مثير اشتعلت العين

المتخصصة غرام بطل المجموعة الضابطة المساعدة! المفتاح الرئيسي كبيرة السكتات الدماغية الحكم لقومية تشوانغ

تواصل الرجعية ليفي لفتح تذكير! هذا منتج واحد يمكنك تبحث من خلال "خزانة والده."

جاء و alipay الدكتور تشن ولى المزدوج جبن 2019 مهرجان ربيع ذلك ما تقوم به وسائل جديدة؟

من قانون مور إلى الذكاء الاصطناعي، واحتمال إطلاق البشري القانون الأسي

ابتداء من السادس إلى إرسال خارق! فيلم "كوريا الشمالية يتعهد لقضاء المساء" هدايا الجماهير "ازدهار" نرحب العام الجديد

تجمع جدار | شأنه منزل بناء باللون الاحمر أن يكون أكثر مثير؟

Zotye T700 الخارج أو التعرض الداخلي لإطلاق هذا الصيف

فيفو APEX 2019 صدر: لندع "الحلم" إلى حقيقة

الغناء BYD الطريق "فتح"، هل السيارة الذكية في نهاية المطاف ليس هناك دراما اندروز؟

رحلتنا نجوم البحر: التقييم ممن لهم R11S الكاميرا الخاصة

كيف مجد النص الملك لي Baiming أوصى ممثل إخراج اكتب الملعب

"رجال في الأسود: مطاردة العالمي" شقيق المطرقة قوة العصا، المذهل لاول مرة الإناث السود

الأحكام ذات الصلة