لديك ويكيبيديا موسوعة، وML تعلم كيفية استخدام يحدد الخاصة بهم المصدر الأصلي

نهجنا، ونرى في النهاية السبب على ضرورة إضافة مرجع في صفحة المشروع على شبكة الإنترنت:

إضافة أسباب المذكورة

لا تقم بإضافة السبب استشهد

تعليم المراجع تعلم الآلة

المقبل، ونحن تدريب نماذج التعلم آلة للعثور على جمل تحتاج إلى المرجعية، وتوفير أسباب المقابلة.

نبدأ نموذج التدريب لتعلم كيفية التعرف على الحاجة إلى الجملة إشارة من المحرر المجتمع بأكمله. لقد أنشأنا ويكيبيديا "مقالات مميزة" مجموعة البيانات، والتي هي ذات جودة عالية 859، كل واحد وقد استشهد العديد من المقالات. تحتوي المادة الجملة مميزة يتم وضع علامة مرجعية المضمنة كحالات إيجابية، وهناك يتم وضع علامة أي حكم مضمنة إشارة كمثال سلبي. باستخدام هذه البيانات، نحن بناء على تسلسل الكلمات في الجملة RNN تدريب نموذج التصنيف التي يمكن التنبؤ حكما كمثال إيجابي (المراجع المطلوبة) أو الحالات السلبية (أي إشارة). النموذج النهائي من الأمثلة الإيجابية للتصنيف دقة تصل إلى 90.

خوارزميات تفسير للتنبؤ

فلماذا لديه نموذج تصل إلى 90 معدل دقة ذلك؟ في تقرير ما إذا كان لحاجة الجملة للرجوع إليها عند الخوارزميات هي التي تبدو وكأنها؟

لتفسير هذه النتائج، ونحن في حاجة للإشارة إلى الجملة أخذت عينات، ويأخذ بعين الاعتبار نموذج تم تسليط الضوء على معظم الكلمات ملحوظ. على سبيل المثال، في المثال بيان "الرأي"، فإن نموذج يكون أعلى وزن لل"ادعى، أعلن أن" الكلمة. في "إحصاءات والإحصاءات" نقلت أسباب ذلك، ومعظم كلمة مهمة في النموذج هو الأفعال الأكثر شيوعا التحليل العددي. في حالة ونقلت "والعلمية العلمية" الأسباب، فإن نموذج يكون مزيدا من الاهتمام لكلام نطاق محدد، مثل "الكم، الكم".

اعتقد نماذج ضرورة الجمل عينة مرجعية، أبرز الكلمات الرئيسية ملحوظ.

وأشار السبب الجملة التنبؤ

وعلاوة على ذلك، ونحن نريد هذا النموذج لتقديم شرح واف للأسباب المذكورة. علينا أولا استخدام الأمازون الميكانيكية الترك التعهيد الجماعي تصميم تجربة لجمع الأسباب المذكورة، وكما بصماته. لدينا مجموعة من المقالات من عينة عشوائية من الجمل 4000، والسماح للاستخدام الموظفين التعهيد الجماعي ثمانية أسباب حددنا في الدراسات السابقة التي أجريت علامة. لقد وجدنا أنه عندما الجملة المتعلقة الحقائق العلمية أو التاريخية، أو مباشرة، والكلام غير المباشر، ونحن بحاجة إلى توفير المراجع.

نحن تعديل الشبكة العصبية في الدراسات السابقة تستخدم لتمكين جمل المبني للمجهول تصنيفها إلى ونقلت ثماني فئات سبب ما. نحن نستخدم مجموعات البيانات الجماعية لعلامة هذه الشبكة إعادة تدريب وجدت لتحقيق دقة معقولة في التنبؤ الوقت ذكر أسباب (الدقة 0.62)، وخاصة لفئات مع الكثير من البيانات التدريب.

الخطوات التالية: التنبؤ عبر لغة وموضوعات "المراجع المطلوبة."

فإن المرحلة المقبلة من المشروع مراجعة نموذجنا للسماح لهم لتنفيذ التدريب لأي واحدة من اللغات المتوفرة في ويكيبيديا. سوف نستخدم هذه النماذج لتحديد نسبة عبر لغة محتوى ويكيبيديا في إصدارات مختلفة غير مؤكدة وخريطة الاستشهادات تغطية على المواضيع مواد مختلفة لمساعدة المحررين تحديد تلك الأماكن التي تحتاج إلى إضافة إشارة ذات جودة عالية جدا .

ونحن نخطط لتوفير الشفرة المصدرية للنموذج الجديد في أقرب وقت ممكن. وفي الوقت نفسه، يمكنك عرض لدينا ورقة بحثية "استشهاد مطلوب: A تصنيف وتقييم حسابي التدقيقية ويكيبيديا"، ورقة تلقى مؤخرا المؤتمر الويب 2019، تحليل ملحقها مفصل للسياسة وكذلك النموذج المرجعي لدينا للتدريب جميع البيانات.

CVPR 2019 | PointConv: سحابة نقطة لتحقيق عملية التفاف فعالة

الحكم على دائرة الطاقة الإيجابية من الأصدقاء، وهناك معنى عميق، يستحق إحالتها إلى أصدقائك

[الأصل] استشعار AET 3D، AI، الصناعية 4.0 تقنيات عمليات 2019 تكنولوجيا الساخنة في آفاق صناعة أشباه الموصلات

NBA | هاردن الأقوياء "ثلاثة أزواج من" صاروخ "الطفرة الطائرة" سيدي "دروموند" تطلعات شقاء باكس "ما وراء شاحب" بيستونز

إن أصحاب سيارات مرسيدس-بنز الناشطين يتوقون مدى الحياة للعودة إلى السلام

فئة السلامة | هذا هو خطر محتمل في أي وقت، قاد يجب أن نرى!

خمسة أسئلة حول متابعة حادثة مرسيدس بنز: هل يمكن استرداد رسوم الخدمات المالية لأصحابها الآخرين؟

هذا العمل "كاذبة"، يمكن أن يكون الكثير من النار! كنت قد تستخدم أيضا ......

شهره اعلاميه! كليات وجامعات فوجيان على قائمة القائمة الرئيسية لمشروع البناء المثالي هذا

ميزات المعرض الاول للصين ان "الطوقان" اتصال وثيق مع العراء جميلة

[التكنولوجيا] سهم حلقة عالية الجهد التعشيق من المبادئ السيارات الكهربائية ومخطط التصميم

في قرية باوشان يلتقي مونيه "الشروق"، القرويين حتى يطلق "كارما لينغ"