Q & A نظام الخوارزمية الخاصة | AIS قبل يجف فإن حصة كاملة الكلام

AIS (ACL، IJCAI، مكتب المفتش العام) 2018

جلسة 6: سؤال الرد

1. لين جامعة تسينغهوا Yankai

أشرف DenoisingDistantly المفتوح المجال سؤال الرد

الفهم القرائي (القراءة والفهم) ونحن الآن موضوعا ساخنا جدا، قد تعكس قدرة معالجة اللغة الطبيعية الجهاز الحالي والتفاهم. أولا نحن ننظر إلى ما آلة القراءة والفهم المهمة هو تعريف محدد؟ آلة القراءة والفهم مشكلة ويتم إعطاء الفقرات ذات الصلة المستخرجة من الإجابة على مشكلة فقرة معينة.

حاليا، وقد قرأنا في مهمة آلة الفهم حققت نتائج جيدة جدا. وقد اقترح الباحثون حاليا العديد من آلة القراءة نموذج الفهم وحققت نتائج جيدة في تقييم مهمة العامة. ومع ذلك، هناك آلة مشكلة فهم المقروء: فهو يتطلب منا أن تعطى مقدما وإصدار نص ذي صلة، ومن ثم استخراج الإجابة على السؤال في نص معين. آلة القراءة مشكلة الفهم أن يمنع تطبيقه كذلك في الممارسة العملية. عموما في حياتنا اليومية Q & A المشهد لا يمكن الحصول عليها في وقت مبكر وثائق تتعلق قضية.

لذلك، وقد اقترح الباحثون مهمة أكثر واقعية: من الأسئلة المفتوحة المجال (سؤال الرد المجال فتح)، ومحاولة الجمع بين استرجاع المعلومات والقراءة والفهم التكنولوجيا إلى حل هذه المهمة. على سبيل المثال، لدينا مشكلة "سكان بكين هو كم عدد" أولا، ونحن نستخدم محرك البحث (أو نظم استرجاع المعلومات الأخرى) واسترجاع الفقرات ذات الصلة من هذه المسألة من المكتبة النص، ثم استرداد هذه الفقرات القراءة والفهم ، استخراج الجواب النهائي على ذلك هو عدد سكان بكين.

القائمة المجال مفتوحا نظام الرد المسألة ببساطة استخدام استرجاع المعلومات ومهارات القراءة والفهم، لا فقرة استخدام استردادها، وأخرى يمكن عدم نشر اسمه الفقرة استردادها هو الصحيح وما يرتبط بها من مشاكل.

ولمعالجة هذه المسألة، يمكننا أن نتعلم من البشر إلى الإجابة على الأسئلة التي أثيرت في سياق نظام وردا على سؤال المجال مفتوحا فعال وعملي. عندما البشر للرد على الأسئلة، ونحن أول استخدام محرك البحث سوف استرداد عدد من القضايا المتعلقة الفقرة ثم سرعان ما من خلال قراءة هذه الوثائق، وتحديد والتي هي قضايا الفقرة وما يتصل بها، والتي الفقرة والقضايا ذات الصلة في التفاصيل قراءة الفقرة الأخيرة من معلومات موجزة عن كل سؤال على الجواب.

نظرا مشكلة واسترداد الفقرة المرتبطة بها، لدينا نظام أول من يفعل مع معطى احتمال الفقرة محدد قراءة سريعة لكل فقرة قد تحتوي على الجواب، وبعد ذلك القراءة والفهم قد تحتوي على الفقرات الجواب، استخراج كل الفقرة قطاع الجواب، ملخص نهائي لجميع فقرات المعلومات للحصول على إجابة.

لدينا تجارب باستخدام الحالي ثلاثة شعبية سؤال مفتوح نطاق وردا على بيانات كوازار-T، SearchQA وTrivialQA. جعلت نظامنا على ثلاث مجموعات البيانات زيادة كبيرة نسبيا، ولكننا نرى أيضا أن نظامنا يمكن أن يحقق ولديهم دائما لها تأثير في حالة سوى عدد قليل من أكثر الفقرات ذات الصلة. وبالإضافة إلى ذلك، مقارنة TOP1 لدينا تأثير نظام TOP5 كما لا يزال هناك مجال للتحسين من عشر نقاط، ثم الجواب قد تبني المزيد من سبل إعادة ترتيب لتعزيز فعاليتها.

وأخيرا، وتقاسم دراسة حالة. المشكلة هي أنه ما فنان يمكن استخدام يديه اليمنى واليسرى للعمل في نفس الوقت، فإن الجواب هو ليوناردو دافنشي. ويرد دليل على هذا السؤال في ثلاث فقرات مختلفة، الفقرة الأولى تشير إلى ليوناردو دا فينشي كان فنانا، ذكر ليوناردو دا فينشي في الفقرة الثانية يستخدم اليد اليسرى في العمل، المشار إليها في الفقرة الثالثة من ليوناردو دا فينشي ستعمل مع اليد اليمنى . نحن في حاجة إلى كل المعلومات استخدام الفقرات لتحديد الجواب على ليوناردو دا فينشي.

لتلخيص عملنا. ونحن نعمل الطريقة على البشر قراءة النمذجة الفهم، يمكن أن يحقق نتائج جيدة في حالة سوى عدد قليل من الفقرات. شكرا لك!

2. وانغ تشن بايدو NLP

المشترك Trainingof المرشح استخراج وجواب اختيار لالقرائي

أول الكلام عن هذه المهمة. ونحن نعتبر هذا الجانب هو أيضا فتح المجال الاستيعاب القرائي، في هذا المشهد التالي، وهو جزء من المشاكل تميل إلى أن تكون أكثر الوثائق ذات الصلة التي تم إنشاؤها بواسطة نموذج البحث، وفقا لأجزاء من هذه الوثائق، وإعطاء الجواب النهائي. ولكن هناك طريقتان التيار لا يمكن أن بشكل صحيح في الاعتبار، ولدي العديد من الإجابات.

ونحن نرى مثالا على القراءة والفهم. والمشكلة هي أن الروم، والجير والكولا وتشكل نوعا من كوكتيل، فإن الجواب هو كوبا حرة. من خلال هذا المثال يمكننا أن نرى ثلاثة خصائص المناطق المفتوحة من القراءة والفهم، والتكرار الأول، ومن المرجح جدت الجواب الصحيح في عدة أجزاء النص داخل. يليه جزء مشوش، إجابات خاطئة، فمن الممكن أيضا لتتناسب مع جزء من المعلومات من هذه المشكلة. والثالث هو مكمل، وأحيانا نحتاج إلى مزيد من المعلومات لنص التعليمات لتكون قادرة على الإجابة على هذا السؤال بشكل صحيح.

ونحن نعتبر هذه الخصائص الثلاث، والحلول المقترحة، ووضع نماذج من الإجابات مرشح. أولا، سوف مجموعة من الإجابات مرشح إنتاج، مع الأخذ في الاعتبار العلاقة بين الإجابات مرشح، لإعطاء الجواب النهائي.

أولا شيدت على مرحلتين مرشح استخراج ليذهب، يذهب لتحديد وضع الإجابة، ردا اختيار المرحلة، وإدخال بنا إلى آليات الاهتمام ارتباط المصفوفة القائمة على نمذجة العلاقة بين المرشح والمرشح. يمكن لهذه نموذج التدريب المشترك على مرحلتين من خلال طريقة تعزيز التعلم. نهجنا هو في الواقع أكثر فعالية في القراءة والفهم من عدة مجموعات البيانات التي حققت نتائج جيدة.

أول نظرة على المرحلة الأولى من نموذجنا، واستخراج مرشح، وكذلك في حالة النص على مجموعة معينة من المشاكل، ونحن نموذج احتمال تعيين مرشح.

المرحلة الثانية من نموذجنا هو الخيار إجابة لمراحل، والغرض من مشكلة معينة، فضلا عن مجموعة من مجموعة مرشح النص أسفل حالة لكل النمذجة مرشح، وقد تم اختيار الاحتمال في نهاية المطاف باعتبارها الحل النهائي. لأن هنا على إجابات مرشح المعلومات، لذلك نعتبر في هذه المرحلة هو أساسا من الإجابات على الأسئلة مرشح النمذجة.

أولا سنذهب لتوليد إجابات المرشح أنه وفقا لإجابات كل مرشح إلى أن تقوم على آلية الاهتمام بناء مصفوفة الارتباط عن طريق معامل الارتباط، وتوليد كمية مرجعية لكل مرشح البند يمكن استخدام كل المرشحين الآخرين للإجابة المعلومات.

بواسطة الرسالة هذه، قمنا بتصميم عدد من الميزات الأخرى على إجابات مرشح، بعد دمج هذه الميزات، مرة أخرى بضعة أجزاء من النص، وأخيرا الحصول على النتيجة النهائية للإجابات مرشح. حسب النموذج تطبيع، فإننا يمكن أن تنتج الجواب النهائي كما أن احتمال الجواب النهائي لكل مرشح.

نحن في مجموعات البيانات المراكز الثلاثة للقيام بهذه التجربة، أول اثنين هما الإنجليزية مجموعة البيانات هذا النوع من المشكلة هو لغز المشكلة.

نتائجنا، والتدريب المشترك من أي طريقة وحده التدريب أو العمل السابق، وكانت النتائج أفضل بكثير.

في دو المراتب أعلاه، ونحن أيضا اختبار نموذجنا لديه تحسنت بشكل ملحوظ. يتميز قدمنا في اختيارات الإجابة داخل وحدة، ونماذج لدينا هي مفيدة، وخاصة العلاقة بين لدينا إجابات المرشح المقترح إلى إجابات مرشح مساعدة نموذجنا هو أعظم.

وأخيرا، النظر في القضية. قبل الاهتمام مصفوفة، فإنه قبض على علاقة قوية نسبيا بين الإجابات مرشح، تكامل أفضل من المزايا من خلال هذه الجمعية، التي تعطي في النهاية الإجابة الصحيحة هي مفيدة.

3. وانغ من جامعة بكين

متعدد PassageMachine القرائي مع التأكيد الإجابة عبر الممر

اليوم نتحدث عن بعض جوانب المادة طويلة عمل ACL في هذا العام، ونحن نريد أساسا لحل مشكلة متعددة الفصل الفهم المشكلة، ونحن يمكن أن تضع قدما في حل هذه المشكلة من خلال تصديق متقاطع الجواب كل فصل، وهذا العمل هو ما أقوم به عندما بايدو التدريب العمل.

أولا، تخبرنا عن ما هو متعدد الفصل القراءة والفهم. فقط مع اثنين من المتكلمين القراءة والفهم قدمت ليست هي نفسها. ونحن نفعل المزيد من الفصل في القراءة والفهم، وعادة ما يتم إعطاء عدة فقرات، وعادة ما تكون هذه الفقرات التي تم استردادها من قبل محركات البحث الظهر. نريد أن نجد الجواب النهائي في عدة فقرات.

لديها العديد من الميزات: عندما وضعنا على مشكلة القراءة والفهم عند تطبيقها على واجب البيانات وجه الويب الحقيقي، لأن محركات البحث مرة أخرى لهذه المادة، وعادة مع المشاكل المتعلقة المواد مستقلة عن بعضها مادة أخرى ، لذلك هذه المواد، من بينها، بعض المواد لها الجواب الصحيح، وهناك بعض المواد ذات الصلة مع المشكلة، ولكنها ليست الإجابة الصحيحة، أو لا جواب. هوى وهذه الخيارات وعادة ما تكون من مشوش جدا. وبناء على هذه الخصائص يمكننا أن نذهب استكشاف طريقة لحل هذه المشكلة. يتم تجربتنا لمجموعتي البيانات، والتي هي المقترحة MS-MARCO مجموعة البيانات مايكروسوفت، هناك بايدو تمتلك DuReader مجموعة البيانات، والتي هي في الاستعلام الصيني، ومجموعات البيانات هما من محركات البحث البداية الحقيقية للمستخدم لقراءة لفهم خلفية حقيقية لاسترجاع الوثائق.

أولا نحن ننظر إلى مثال على ذلك هو من العينة البيانات MS-MARCO، فهو السؤال ما هو الفرق بين ثقافة مختلطة وثقافة نقية؟ والجواب الصحيح هو مرور السادس من الداخل الى الخارج، ويعود لاسترداد المواد التي، مع الإجابة الصحيحة 3،4،5 على إجابات متشابهة نسبيا. ويمكن أن تجد دليلا على الستة الأولى الإجابات الصحيحة في 3،4،5 من خلال التحقق من صحة لدينا.

واستنادا إلى هذه الميزة، نقدم نموذجنا. أولا وقبل كل شيء، نريد أن التنبؤ الجواب الحدود، والذي هو نفسه كما هو الحال مع الفهم القراءة التقليدية، وهذا هو، للعثور على بداية ونهاية المواقف. والثاني هو أن التنبؤ إجابات من المحتوى، وهذا يعني، بالإضافة إلى أن أقول أننا ننظر إلى أبعد من موضع بداية ونهاية الموقف، علينا أن نتوقع مضمون الإجابة ليست جيدة جدا، لذلك يمكنك تدريب أكثر من إشارة نموذجنا . الجواب الثالث هو التحقق من صحة عبر الوثيقة، التي هي محور مقالنا، والذي يتحقق من خلال آلية من الاهتمام، يجب علينا أولا تستند فقط على درجة المحتوى يحسب لحساب الجواب، وقال هذا هو المبلغ المرجح، ثم نحن من الاهتمام، لإجابات الحالية إلى فقرة أخرى على المعلومات جمع. وبهذه الطريقة، فإن الجواب على تمثيل الحالي، وكذلك التحقق من الأدلة التي تم جمعها، ويمكن أن يمثله ناقلات، ونحن غرزة بعضهم البعض من خلال طبقة إلى الأمام الأعلاف، ويمكنك الحصول على النتيجة النهائية للتحقق.

الهندسة المعمارية لدينا نموذج كامل لذلك، لإعطاء كل مادة من المواد مرور لأداء الترميز والترميز القيام به، ونحن نفعل Q-P مطابقة، وهذا هو نفسه كما هو الحال مع التقليدية. ويشارك في الطبقة السفلية، فإن الطبقة الخارجية جعل ثلاثة التنبؤات، والتنبؤ هو الحدود، والثاني هو محتوى متوقعا، والجواب الثالث هو التحقق من صحة عبر وثيقة.

يمكن أن يتم نموذج ثلاثة من التدريب المشترك. هناك ثلاثة أهداف، ثلاثة أهداف خسارة المقابلة لثلاث وظائف، 1 2 وبواسطة جهاز تحكم بسيطة من وزنه. وأخيرا التنبؤ متى نموذج ثلاثة الجمع على تناوله. تناول الطريقة هنا قليلا بسيطة، ولكن هو شعور قاعدة الكشف عن مجريات الأمور قليلا، وهذا يمكن أن يتحسن أكثر بعد العمل. هنا ليست سوى ضرب بعضهم البعض، كما أنها فعالة.

هذا هو نموذجنا على أداء مجموعتين من البيانات، بما في ذلك MS-MARCO وDuReader. في مجموعتي البيانات حققنا أفضل النتائج في ذلك الوقت، ولكن هناك تحسن أكثر وضوحا. نقوم به على البيانات MS-MARCO جمعت الدراسة تذرية، يمكنك ان ترى المحتوى النموذجية والتأكيد نموذج له مساهمة كبيرة، والتدريب المشترك هو أيضا مهم جدا.

لعبنا ثلاث وحدات وتوقع عشرات تبدو، يمكننا أن نرى علاقة أكثر اتساقا بين حجم الحدود النموذجية وContentModel، بعد إضافة نموذج التحقق، الأمر كله قد تغير واضح. وهذا يعني، أننا يمكن التقاط التأكيد نموذج الحدود والمحتوى مع معلومات مختلفة، والتي هي وثيقة انتشار المعلومات.

وهناك أيضا مشكلة، وهذا هو السبب في المحتوى نموذج فعال؟ من خلال هذه الصورة، وضعنا نموذج للتنبؤ الحدود الاحتمالات والاحتمالات المحتوى تلعب نظرة. أولا، يمكننا أن نرى أنه حقا الحدود تعلم جيدا، انها علمت حقا موضع بداية ونهاية الموقف، ولكن هذه المعلومات الداخلية عن الجواب، فإنه لا تعلم، ما هي الكلمة في الجواب جيدة، ما هي الكلمة سيئة، ولكننا لا نستطيع حق بعض الكلمات في الإجابة على التعلم وزنه من خلال نموذج المحتوى. لذلك، لدينا الحق في التعلم من خلال الوزن نموذج المحتوى، وهذه الكلمات تمثل معا، يمكنك الحصول على إجابات تمثيل أكثر ملاءمة.

4. جامعة وو وي بكين

متعدد PassageMachine القرائي مع التأكيد الإجابة عبر الممر

اليوم سهم هو أننا في دوري أبطال آسيا، والإجابة على الأسئلة والأجوبة المجتمع للأسئلة المهام الفرعية الآن شبكة ضغط، والعنوان هو لفترة طويلة، كنا لإدخال هذه الخيارات المجتمعات مسابقة وإجابة ثلاثة، ويتم ضغط الأسئلة الشبكة ماذا يعني ذلك.

أول مجتمع Q، في موقع الشبكة مجتمع Q & A، نحن أحرار في طرح الأسئلة في ما سبق، هناك العديد من المشاركين المختلفة قد الإجابة عليه. Q & A المجتمع، بايدو المحلية، بايدو مشاركة المحامين، أو معرفة تقريبا، تنتمي إلى المجتمع في شكل أسئلة وأجوبة. المجتمع Q & A Q & A مع النموذج العادي من ميزتين مهمتين مختلفة.

و، الأسئلة والأجوبة الشائعة الأولى هي مسألة، والإجابة على حكم قضائي، أسئلة المجتمع والأسئلة الأجوبة يمكن تقسيمها إلى شكلين مختلفين. الأول هو الجزء الرئيسي من هذه المسألة، والجزء الرئيسي يعطي أساسا المعلومات حول العناصر الرئيسية من الأسئلة المدرجة في الأرجح أعرب في بضع كلمات. الجزء الثاني هو الجسم من الأسئلة، المعلومات المذكورة في القسم أكرر باللقب مرة أخرى، وإضافة بعض المعلومات. على سبيل المثال، عندما يطلب معرفة ما يقرب من الأسئلة، وكيفية تقييم تسوى، هذا هو عنوان هذه المشكلة. في الجزء الرئيسي قد يقول تسوي تستخدم ليكون مضيف CCTV، وبعض من عمل مكافحة GM ما فعله وراء، والآن القيام ببعض الأعمال الإضافية. حتى يمكننا أن نرى بوضوح أن الأسئلة والأجوبة في المجتمع يمكن تقسيمها إلى قسمين.

الميزة الثانية، لأن المجتمع هو في شكل نص الأسئلة والأجوبة على شبكة الإنترنت، مقارنة مع الأسئلة العادية والأجوبة، وانها مشكلة الضوضاء المتكررة أن تكون أكثر جدية.

الجواب اختيار الأسئلة والأجوبة في المجتمع، ما تحاول جوانب منه لحلها؟ في Q & A المجتمع قد يكون لها العديد من الإجابات المختلفة على سؤال، بالنسبة للمستخدم، إذا يمكنك تطوير أداة آلية لجميع أنواع الأجوبة، وجاءت الإجابات أمام الخير وأجوبة سيئة، قد تصفح هذه الأسئلة والأجوبة موقع للمساعدة.

أخبرنا عن النموذج المقترح لدينا، والمسائل ضغط الشبكة. وفقا لخصائص الموجودتين، وفقا للجزء الرئيسي للمشكلة لضغط المعلومات المشار إليها الأسئلة. وينقسم شبكتنا إلى ثلاث مناطق: يتم ضغط على سؤال، يمكن أن يكون الجزء الرئيسي من هذه المسألة، وفقا لتتحلل مع معلومات رأس السؤال إلى قسمين. السؤال الأول هو الجزء الموازي والجزء الثاني وهو عمودي على الأسئلة. يحتوي القسم الموازي العنوان الرئيسي مع أسئلة أكثر المعلومات ذات الصلة، يحتوي القسم الرأسي بعض المعلومات مع خارج الجزء الرئيسي من هذه المسألة، وبعض المعلومات الإضافية هي جزء من الأسئلة الرئيسية لطرح الأسئلة.

الجزء الثاني هو التوافق بين الأسئلة والأجوبة، ويجيب المستخرجة مع مسائل التمثيل، تلك الأجزاء الأكثر أهمية.

الجزء الثالث، هذه العناصر التي يتم جمعها محاذاة وفي نهاية المطاف الحصول على اثنين من إجابات لبعض من خصائص هذا النوع من المعلومات.

أخبرنا عن هذه مجموعتي البيانات، وهي ممارسة نتائج 2017 SemEval2015 وعلى النقيض من هذه مجموعتي البيانات. لدينا على شبكة الإنترنت، من بعض الميزات التقليدية من الطريقة اليدوية، وأدناه بعض النتائج الشبكة العصبية الحديثة أكثر تعقيدا قد تحسنت.

وأخيرا، والقيام ببعض التلخيص. نقترح أسئلة المسابقة المجتمع في ضغط الشبكة، استنادا إلى آليات الاهتمام نقية، فإنه يمكن تدريب بسرعة كبيرة. ويستخدم المعلومات للمجتمع هي مسألة من الأسئلة والأجوبة يجب أن نميز بين هذا الموضوع والجسم، وذلك باستخدام العلاقة يمكن ضغط المجتمعات مميزة من الأسئلة والأسئلة الأجوبة، والمحتوى هو فقط أريد أن أعرض اليوم، شكرا لك!

5. ليو عملية CASIA

CurriculumLearning عن الإجابة الجيل الطبيعي

لدينا نموذج الرئيسي العمل للبيانات التدريب الحالية من نوعيات مختلفة من هذه الظاهرة والتصميم.

لأول مرة في الحال، بل هو آلة استراتيجية التعلم التدريب بعبارات بسيطة أنها بسيطة لمعرفة بيانات التدريب، وتدريب البيانات المعقدة التعلم من جديد.

وقدم المهمة الثانية: الإجابة الطبيعية الجيل (NAG، الجيل الجواب الطبيعي)، يمكنك مقارنة Q & A المعرفة (KBQA) ودردشة الروبوت (Chatbot). KBQA العودة هي إجابة دقيقة، Chatbot الحصول يتسق مع الأسئلة والأجوبة بطلاقة. NAG دقيقة ومتسقة، والإجابة بطلاقة، ويمكن اعتبار KBQA وChatbot توحد المهمة.

الأساليب الحالية، أساسا باستخدام البيانات التي تم إنشاؤها بشكل مصطنع على شبكة الإنترنت، مثل بايدو تعرف Q & A بيانات المجتمع الآخرين. Q & A المجتمع في بيئة حقيقية، سيكون هناك دائما بعض أقل جودة من الإجابات، من خلال تصفية، حدد البيانات يحتوي على كيان الإجابات الصحيحة، فإن البيانات الأولية تكون قادرة على تصفية 10 من بيانات التدريب. وعلى الرغم من الكيانات تصحيح، ولكن الجودة الشاملة لا تزال منخفضة نسبيا.

تحت بيانات التدريب الحالي، تحديين، الأول هو لتحديد بيانات التدريب عالية الجودة من الصعب بشكل خاص. ثانيا، حتى لو نستطيع أن نختار بيانات التدريب الجودة العالية، وحجم البيانات التدريب كما كان ينطق تراجع بشكل خاص.

البيانات التي تم إنشاؤها مباشرة من ومتسقة، والإجابة بطلاقة دقيقة الحالية أمر صعب، وضعنا ذلك تفككت. أولا، من ذات جودة منخفضة، يحتوي على بيانات التدريب في المدرسة الثانوية إجابة مختصرة إلى النموذج الأساسي، على سبيل المثال، لمعرفة التفاعل مع قاعدة المعرفة، والقادم من ذات جودة عالية وطويلة، وبيانات التدريب معقدة، والتعلم بشكل أفضل نموذج، ويأمل أن هذا النموذج يمكن أن يعود دقيقة ومتسقة، والإجابة بطلاقة.

فكرة لديها أعلى قضيتين، واحدة لتحديد مدى تعقيد الأسئلة والأجوبة (الزوج)، ويحتاج إلى تدريب ونوعية البيانات معا. والآخر هو لتحديد التقدم الذي تعلم عندما تعلم بيانات التدريب بسيطة، عندما تعلم معقدة من بيانات التدريب.

ولهذه الغاية قمنا بتصميم نموذج يلي: أولا تحديد مثال الجواب المشتركة التي محدد (Q & A على) والأهداف الحالات، الهدف الأمثلة هي ذات جودة عالية، والبيانات التعلم المعقدة. لقد قمنا بتصميم استراتيجيتين الاختيار، اختيار على أساس تردد كلمة، والثاني هو اختيار بناء الجملة. بعد التدريب مع المثال التقليدي والبيانات مثيل الهدف، وفيما يلي مثال على جدولة (أي طبعا). ووفقا للمثال الذي هو مساهمة في نموذج جدولة لتوليد الجواب الطبيعي، فإن الجواب إلى استنتاج مفاده أن ولدت.

بالطبع لدينا من سبيل المثال العاديين يتناقص، يتزايد المثال الهدف.

نتائج نموذجنا بغض النظر عن اختيار أو تحديد قواعد اللغة والمفردات، وأفضل من تأثير النموذج السابق. الحاجة ليتضاعف ثلاث مرات متعددة إلى الإجابة على الأسئلة، لتعزيز أداء نموذجنا هو أكثر وضوحا. وبالإضافة إلى ذلك، ونحن أيضا تقييم دقة الاصطناعية، الطلاقة واتساق المؤشرات الثلاثة، والمقابلة أيضا نموذج لدينا هو أفضل من الطريقة السابقة.

6. معهد بكين شياو وى تشى تقنية

مسائل الجودة: تقييم cQA زوج الجودة عبر Transductive متعدد مشاهدة التعلم

عملنا البحوث الخلفية المجتمع Q & A. Q & A Q & A المجتمع هو وسيلة مع تطور Wbe2.0 ولد في هذا Q & A منصة، يمكن للمستخدمين طرح الأسئلة، في حين يمكن للمستخدمين الآخرين الإجابة على الأسئلة المذكورة أعلاه. مع تطور الأسئلة المجتمع والأجوبة، هذه الأسئلة والأجوبة على الأسئلة أعلاه والبيانات الإجابات منصة أيضا بشكل تراكمي أكثر وأكثر، وبعد هذه الأسئلة والأجوبة يمكن زيادة استرجاع لمحرك البحث، وتستخدم للرد على بعض الأسئلة الجديدة للمستخدمين الآخرين. لأن بعض الأسئلة والإجابات أعلاه، عادة ما يكتب باليد، لذلك هناك الكثير من مشاكل الجودة.

من خلال مستخدم وجدت الدراسة أن أكثر من 45 من الأسئلة والأجوبة على الجودة ليست مرتفعة بشكل خاص. وهناك عدد كبير من الأسئلة ذات جودة منخفضة والأجوبة، من جهة تؤثر على تجربة المستخدم من مستخدمي محرك البحث، من ناحية أخرى سوف تضيع الكثير من الحوسبة والتخزين الموارد، وسيتم أيضا سبب الانخفاض في المجتمع Q & A الالتصاق منصة المستخدم. لذلك، بدأ العديد من الباحثين لدراسة كيفية الحكم على نوعية Q & A المجتمع. بعض الأساليب التقليدية، ويتحقق عادة عن طريق استخراج بعض الميزات، إلى الانحدار أو تصنيف النموذج.

هذه الطرق هناك السؤالين التاليين:

أولا، ودمج ميزة متعدد الزوايا. وعادة ما تسبب A Q & A جودة من قبل الكثير من الجوانب لاتخاذ قرار. وكل جانب من جوانب يحدد طبيعة مكملة Q والجودة. من خلال اتصال واحد، قد تحصل على نتائج مختلفة. على سبيل المثال، في هذا المثال، ونحن ننظر في الإجابة، قد تعتقد أن هذا هو السؤال والجواب جيدة جدا أزواج، ولكن إذا نظرت إلى المشكلة، وسوف تجد الموصوفة في هذا السؤال هو غامض إلى حد ما، وهناك الكثير من الأخطاء النحوية، ككل، والأسئلة والأجوبة نوعية ليست مرتفعة بشكل خاص.

ثانيا، عدم وجود بيانات الشرح. تحتاج العديد من أساليب التعلم القائمة على الاعتماد على عدد كبير من البيانات والشروح، والحصول على البيانات الشرح معقد للغاية وتتطلب عملية كثيفة العمالة. في ظل وجود عدد كبير من البيانات غير المسماة الانترنت يحتوي أيضا على الكثير من المعلومات المفيدة، ولكن في كثير من العمليات القائمة، لا يتم الاستفادة منها بشكل كامل.

ولذلك، فإننا نقترح استخدام متعددة-مشاهدة نهج Transductive حين معالجة متعددة زاوية ميزة الانصهار، وكذلك مسألة استخدام البيانات غير المسماة. في التعلم متعددة بغية علمنا من خلال الفضاء العام، في الفضاء العام، في حين أن اتساق المعلومات على مختلف وجهات النظر بعين الاعتبار. في الفضاء العام، ولكن نحن أيضا قادرون على الحفاظ على الخصائص الأصيلة في ملامح وجهة نظر فردية. ونحن أيضا استخدام البيانات وصفت والبيانات غير المسماة معا لمعرفة الأماكن العامة، أدركت تقييم نوعية الإجابات في الفضاء العام.

عندما منظور النمذجة المكانية، أعرب استخدام لابلاس مصفوفة الفضاء لكل زاوية الرؤية. استخدام العلاقة بين كل من الأسئلة والأجوبة والأسئلة والأجوبة الحق، والحق في أن تكون ممثلة في هذا الاختبار.

في دراسة الفضاء العام، ونحن نعلم من خلال تقليل الخلاف الفضاء منظور الأفراد والأماكن العامة. بعد أن علم الجمهور حول التمثيل المكاني، ونحن نستخدم نموذج الانحدار لتقييم جودة الإجابات في الفضاء العام. المشتركة بين فقدان الأمثل اثنين، يمكنك الحصول على نتائج التقييم لنوعية الأسئلة والأجوبة.

كانت تجاربنا ستاك إكستشينج تسلق البيانات المنال، على التوالي، وذلك باستخدام اثنين من مجموعة الإنجليزية ولعبة. نحن نستخدم الأسئلة والأجوبة المستخدم تطبيع متوسط عدد من الأصوات نوعية الأسئلة والأجوبة على التسمية، وهذه الطريقة لبعض الأسئلة الشائعة وتأثير جيد نسبيا، ولكن النتيجة ليست قضية شعبية جدا من الفقراء. لذلك، نحن فقط استخدام البيانات لبناء التسمية القضايا الشعبية في التجارب في الداخل.

استخدمنا أساليب تقييم اثنين، والتقييم الذاتي التقييم يدوي. في OverallPerformance مقارنة أسلوبنا يمكن أن يحقق نتائج جيدة في كل من التقييم التقييم اليدوي والآلي. بعد زيادة في عدد زاوية الرؤية، حيث لوحظت كل عرض للنموذج تأثير كله. وجدنا أن كل خصائص إضافية زاوية الرؤية، يتم تغيير أداء نموذج للأفضل. في الفضاء العام للمصفوفة التشابه وتصور أننا في الفضاء العام، وقادر على الأسئلة ذات جودة عالية وأجوبة على الأسئلة والأجوبة من جودة منخفضة تميز على نحو فعال.

7. تشاو تشو، جامعة تشجيانغ

مفتوح EndedLong شكل فيديو سؤال الإجابة عن طريق التكيف الهرمي ReinforcedNetworks

Q & A الفيديو الذي طرحناه في عام 2017، على أساس التفاعل والفيديو المهام اللغة الطبيعية. لفتح الفيديو الحقل Q & A، بناء على الأسئلة والإجابات وإنشاء الفيديو. فيديو Q & A مع الأسئلة والإجابات الأخرى ليست هي نفسها. فيديو Q & A، وطول الفيديو جدا، طويلة جدا، واحدة لمدة دقيقتين هناك الكثير من الإطارات، LSTM العاديين من الصعب جدا للتعامل مع مثل هذا الفيديو طويل. نحن مقفل في مجالين صغيرة جدا، واحد هو المفتوح باب العضوية، واحد هو طويل على شكل سؤال الرد.

الفيديو هو عادة لفترة طويلة جدا، والمشكلة ليست سوى جزء صغير من الفيديو، وأكثر من محتوى الفيديو لديها ما تفعله مع هذه المشكلة لا شيء. Q كيف الفيديو من عمل فيديو طويل. عملنا لديه مساهمة التالية، أول من اقترح الترميز - التعلم شبكة فك. ثانيا، استخدام التشفير الهرمي على التكيف والتعلم القائم على حل المشاكل من تمثيل الفيديو. دعونا نتعلم من مستوى القطاع، وفقا لهذه المشكلة وبعض الفيديو، ومقاطع الفيديو قطع تلقائيا، بعض شظايا المقابلة لهذه المشكلة، لذلك نحن تعلمت مستوى القطاع التمثيل. وأخيرا، قمنا بتصميم وحدة فك ترميز معززة لتوليد الجواب. وبالإضافة إلى ذلك، قمنا ببناء مجموعات البيانات الكبيرة جدا ..

أولا سنتعامل مع مستوى معين من إطارات الفيديو، كل إطار فيديو N، بمهمة القراءة والفهم غير متشابهة جدا. ثم يولد الجواب، A1 إلى AN، هو طبقة متغير الجواب (1)، إلى كلمات N ممكنة. انها التمثيل الدلالي لكل إطار الفيديو، ونحن نعرب عن معاني الكلمات، ونحن نستخدم التعبير عن A1 إلى AN.

نحن هنا نتعلم شبكتين، شبكة وأعرب أولا عن طريق F الترميز، F ديه اثنين من المدخلات، واحد هو V، هو الفيديو، هو Q، هو السؤال. ثانيا، نحن نعلم ان يترجم الشبكة، ونحن نفترض أن هناك أطر N هو مساهمة في التكيف فك. LSTM صعبة للغاية طالما فيديو، نقترح LSTM المرحلة القائم على حل المشاكل، والتي هي كيفية العمل؟ وهناك مدخل المشكلة LSTM، إذا كنت تعتقد كان الوضع الحالي نقطة تحول، وسوف نستخدم LSTM منفصل، ومرة أخرى لتحديث الحالة من التهيئة الخاصة به.

ليست هذه هي نفس القراءة والفهم. القراءة والفهم والحكم والعقوبة، والإطار الفيديو من الصعب جدا أن تكون مجزأة، نقطع نقاط تلقائيا. إذا كان فوق عتبة واثنين من دلالات المختلفة، وسوف نقوم بإعادة تهيئة LSTM للتدريب.

ونحن لا تزال تستخدم آلية الاهتمام، لجلسات الفيديو. نحكم عليه في إطار الفيديو ودلالات إطار القادمة من هذا هو ذات الصلة. ووفقا لبعض الأسئلة التي تطرح، وبعض الفيديو داخل الدولة الآن، لتحديد ما إذا كان اثنان الفيديو دلالات الدلالي، أو دلالات مختلفة. إذا دلالات مختلفة، ونحن نستخدم LSTM منفصل.

وبالإضافة إلى ذلك تقديم المعزز فك التعلم. ونحن، وقال مستوى الإطار التأهيل توليد مستوى القطاع الجواب مولد النهائي مع اتباع نهج معزز لتوليد الجواب.

فعلنا مجموعة من البيانات المسمى يدويا. استخدام WUPS = 0.0 و 0.9 WUPS = تم اختبار ومقارنة بعض الطرق المتقدمة.

8. تشاو تشو، جامعة تشجيانغ

متعدد بدوره الإجابة عن طريق VideoQuestion متعدد تيار الهرمي الاهتمام السياق الشبكة

أبحاثنا والحوار في الفيديو، والفيديو الاستمرار في طرح الأسئلة والحصول على الإجابات باستمرار. ونحن نعتقد أن الفيديو هو السياق، نواصل تسأل وتجيب الفيديو، بل هو الحوار. لذلك، نقترح آلية لمتعددة تيار السياق شبكة الاهتمام المستوى لمعالجة عدة جولات من مسابقة الفيديو.

لدينا الكثير من الفيديو، ووضع علامات اليدوي، يمكنك الحصول على الكثير من الحوار. ونحن لا نملك سوى بعض المدخلات الفيديو والأسئلة، وهناك أيضا السياق، وكذلك بعض القضايا المعروضة على الحوار. المشكلة الحالية هي أنه قد يصدر المعلومات ليست واسعة جدا، وعلينا أن تكون الإجابة مع الإشارة إلى سياق الحوار، حتى يتسنى للقضية بالإضافة إلى الفيديو والمشاكل، ولكن أيضا النظر في سياق الحوار، الذي هو مشكلة في مكان صعبة للغاية.

فعلنا بعض على مستوى الشبكة سياق آلية الانتباه متعدد تيار، النظر ليس فقط في دفق الفيديو، ولكن أيضا النظر في تدفق سياق الحديث، والتكامل بين التيارين، وبذل المزيد من الجهد لتحسين الأمثل.

فيديو يظهر مستويين، تمثيل على مستوى الإطار ومستويات التمثيل مجزأة. سياق المحادثة من جزأين، الجزء الأول من السؤال هو، هو الجزء الثاني من الإجابة السابقة. المعلومات الواردة ثلاثة، الأول هو المعلومات من شريط الفيديو، والثاني هو المعلومات سياق المحادثة، والثالثة هي قضية المعلومات.

بعد الأخذ في الاعتبار متعددة تيار، وتنصهر الأول من كل سياق محادثة من الأسئلة والأجوبة لإنتاج تمثيل السياق. بعد إضافة كل آلية من الاهتمام للسياق الحوار. كيفية استخراج بعض ذات الصلة، وغير ذي صلة تجاهل، ونحن اقترضت آلية التركيز، وبعض من الانصهار النهائي ذات الصلة، وليس الانصهار غير ذي صلة.

بعد أن توليد نموذج يستند إلى المعلومات التي لدينا السياقية المتعلقة الاستخراج، والمهم استخلاص المعلومات والفيديو، والتكامل في نهاية المطاف. العملية برمتها في خطوتين، الخطوة الأولى لفهم هذه المسألة. الخطوة الثانية، ونحن نركز على الاجابة الفيديو، تعتبر سمتين للفيديو، أول واحد هو سمة للدولة، والثاني هو خصائص الحركة. وطرح بعض الأسئلة للدولة، فمن لطرح بعض الأسئلة من الحركة، لذلك تم استخراج سمة من كلا الجانبين لإنتاج الجواب النهائي.

نحن صاغ مجموعة البيانات. هناك نوعان من مجموعات البيانات والفيديو، كل مجموعة البيانات هو على الارجح أكثر من 1000 سؤال. أول مجموعة من البيانات التي قد تحمل أكثر من 30000 فيديو Q & A في المجموعة الثانية من البيانات ملحوظ أكثر من 60،000 فيديو مسابقة الحق. يستخدم لدينا نموذج التعلم الاصطناعي القائم على الشرح.

قد يكون النتائج على بيانات تفصيلية في ورقة.

إيران الانتظار فريق الوطني لكرة القدم في آسيا، وملعب التدريب لماذا الضحك؟

الروبوت تشغيل لمنصب عمدة اليابان: سوف AI إدارة الإنسان

الفيسبوك المسؤولين التنفيذيين هم لك من بعيد إلى أي مدى؟

اليوم صوت الأساسية | عنيفة تحصيل الديون بالفعل! منظمة العفو الدولية لمعرفة كيفية الحصول عليها ~

هل يمكن أن تصبح صغيرة قبالة الظلام الحصان الجديد؟ خط تشانغ روي تعرض سيارة حقيقية M60

لقد حان الوقت لتوفير المال للهاتف المحمول: سيتم اطلاق سراح أقوى ثلاث الهاتف ملء الشاشة

"التكنولوجيا الأسود" SSD سراح! ولكن قد لا يكون لديك أي وصول!

الممرات الآن البرتقال البحر خفيف! فوتشو الربيع السياحة الثقافية شهر سعداء لارسال فورة!

"الكلمات الشعرية تشينغ مينغ يي كان يعتقد من قبل العدو" تشينغمينغ إنشاء المتحضر غرب بلدة جديدة من تونغتشو

ساذجة جدا! هل تعتقد أن جهاز التوجيه سلعة أخرى يمكن أن تحل بطيئة بطاقة شبكة الخبث؟

وقد حوصر بايدو عاصفة من الرأي العام؟ للرد على أحداث تاميل كاذبة - أنها توفر المواد كاذبة

مروحة أيضا أن تلعب من دون حدود! اللاعبين العاصفة MF120S التقييم: الانخفاضات بنصف السعر