أعلى خوارزمية RecSys 2020 بدء الموسم، وكنت قد ترامب في نفس العينة في

في الآونة الأخيرة، RecSys 2020 كأس التحدي نظام توصية عنوان في مجال النشر، مسابقة موضوع "توقعات نسبة مشاركة تويتر والتوصية المحتوى" .

وحددت نحو 200 مليون البيانات المنافسة تويت العامة فيقدمه تويتر (ربما فقط لأنك ورقة رابحة في نفس العينة في)؛ المنافسة من الأعلى إلى الأقل للحصول على المراكز الثلاثة هم: 15000 $، $ 10000، والمكافآت $ 5000.

واحد من أكبر حقول البطولة التأثير على نظام توصية الحالي، RecSys التحدي هو جزء من الجزء العلوي من كبار RecSys مؤتمر أكاديمي الميدانية لمنظومة التوصية. تفاصيل هذه المسابقة RecSys عام 2020، وسيتم تجميع مصدر لى فنغ شبكة منظمة العفو الدولية من تعليق الانتهاء من التفاصيل على النحو التالي.

توصية المجتمع خوارزمية اولمبياد --RecSys

RecSys كنظام الموصى بها أعلى الميدان، تولى دائما أهمية كبيرة على استخدام خوارزميات مختلفة لحل المشاكل العملية التوصية.

أعلى سيبنى على قمة RecSys التحدي، الكثير من المطورين لخوارزمية توصيتها المعروفة باسم "الألعاب الأولمبية". كل دورة لديها كبيرة اسم قائد الفريق الشركات والتوصية خوارزميات المعنية، والمنافسة الشرسة.

منذ المسابقة التي عقدت منذ ذلك الحين، تتناول موضوعات تشمل: تفضيلات الموسيقى الموصى به، توصية السياق علم، وغيرها من مواقع الفيديو الموصى بها مشاهد الحياة اليومية، وحققت نتائج جيدة في حل هذه المشاكل.

حالة النظام الموصى بها

في الوقت الحاضر، مع مزيد من الدراسة المتعمقة والبحث، وكان نظام توصية تنمية أسرع، فقد أصبح موضوعا ساخنا الأكاديمي فحسب، ولكن أيضا الوصول الاهتمام في هذه الصناعة ل.

مقدمة والمنافسة مهمة

كما ذكرت في البداية، اخترت هذا RecSys 2020 التحدي تحت شعار "توقعات نسبة مشاركة وتويتر محتوى توصية"، لذلك يتركز محتوى اللعبة أيضا في بيئة ديناميكية على المهام في العالم الحقيقي تشارك في التنبؤ تويت.

أنواع إصدارها من الأمور التي تحدث في العالم على تويتر. سواء كانت ساخنة في الوقت الحاضر والأخبار العاجلة، القيل والقال أو الترفيه والرياضة والسياسة والأعمال المنزلية اليومية، على تويتر، والكثير من النصوص والصور وغيرها من البيانات لتحقيق الحصة العالمية.

العضو نشر على منصة ويسمى محتوى المشاركة "تويت" و "مثل"، "رد"، "إلى الأمام" و "مع تعليقات أحالت" لاظهار شكل نقطة المستخدم من عرض.

قام أربعة أنواع البيانات نشر وتصفية تطبيقه في نشر

مع أوصى التنمية والنضج أعلى-K طريقة، ويستند RecSys 2020 هدف التحدي في إدخال البيانات غير المتجانسة، ومجموعة من التنبؤ سقسقة مشاركة هدف أنواع مختلفة من المستخدمين (مثل الثناء، والرد، إلى الأمام، ومع تعليقات الشحن) احتمال.

تهدف إلى تقييم خوارزميات جديدة، توقعات نسبة مشاركة واسعة النطاق لتويتر، والتنبؤ أقصى مشاركة المستخدم من خلال مجموعات البيانات في العالم الحقيقي، وأوصت لتشجيع تطوير أساليب جديدة، مما يعزز من أحدث التطورات التكنولوجية نظام التوصية.

وفي الوقت نفسه، كمزود مجموعة البيانات التحدي وراعي تويتر، كما يعطي المنافسة مكافأة المثيرة فإن أعلى ثلاث يحصل على الجوائز التالية:

  • الفائز: 15،000 $

  • الوصيف: 10000 $

  • الوصيف: $ 5000

مجموعات البيانات المنافسة

في تحدي والخطط RecSys لاطلاق سراح ثلاث مجموعات البيانات، بما في ذلك: مجموعة التدريب واختبار مجموعة، مجموعة التحقق من الصحة. من بينها، يتم الحصول على مجموعة التدريب من قبل عينة فرعية من البيانات التفاعل الإيجابي خلال أسبوع واحد، واختبار وأجهزة التحقق من صحة ما أن يبدأ أخذ العينات البيانات اعتبارا من الاسبوع المقبل.

يتضمن مجموعة البيانات مجموعات البيانات العامة الكبيرة ستكون تويت العامة نحو 200 مليون تويتر إطلاق سراحهم، ويتم الحصول على هذه البيانات من خلال أخذ العينات الثانوية في حوالي 2 أسابيع.

التي تشمل: وظائف المشاركة، وظائف المستخدمين ووظائف تويتر، مثل: التفاعلات العامة (مثل "مثل"، "رد"، "إلى الأمام" و "مع تعليقات إحالته")، وكذلك عينات من الجمهور لتعقب الرقم 100000000 نفي شبه عشوائية كلمة سلبية.

ومن الجدير بالذكر أن صعوبة هذا التحدي هو القانون الجديد بشأن حماية البيانات والخصوصية. المتعلقة خصوصية المستخدم، ومجموعة البيانات التي سيتم تحديا الامتثال: إذا حذف مستخدم البيانات الخاصة بهم أو تويت من التغريد، سيتم تجديد مجموعة البيانات على الفور.

سيتم تحديث بيانات يوميا لضمان الامتثال لأحكام GDPR، وفي الوقت نفسه، سيتم تحديث مؤشر المقابلة في التصنيف العالمي. وهكذا، على كل تغيير في مجموعة البيانات، تقييم المقدمة وإعادة، وسيتم إعادة حساب القائمة باستخدام يتم تحديث مؤشر.

المزيد من بيانات يحتوي على البيانات والمعلومات وظيفة متاحة للجمهور، وصفها بمزيد من التفصيل في الوثيقة تويتر المطور (https://developer.twitter.com/) في.

معايير التقييم وعقدة الوقت

تقييم على اختبار عداء مجموعة الاحتفاظ قدمت نتيجة لذلك، فإن أحدث البيانات التي تم إنشاؤها نوع التغريدة على المنصة، وسوف تشمل منطقة استدعاء مؤشر تقييم دقيقة تحت المنحنى (PR-AUC) وفقدان عبر الكون.

حاليا، RecSys 2020 تحدي الموقع الرسمي أحدث جدول زمني على النحو التالي:

  • 2 مارس 2020 - نشرت مجموعة البيانات وRecSys يتحدى بدء (تم الإفراج عن مجموعات التدريب والتحقق من صحة)

  • 1 يونيو 2020 - تم نشر مجموعة بيانات الاختبار

  • 7 يونيو 2020 نهاية --RecSys التحدي

  • 15 يونيو 2020 أعلنت الترتيب النهائي والفائزين أوراق ورشة تحدي RecSys قدم -

  • 202022-26 سبتمبر - ندوات (كجزء من RecSys ACM الذي عقد في ريو دي جانيرو، البرازيل)

الموقع الرسمي البطولة:

تحميل مجموعة البيانات:

جيثب العنوان:

https://github.com/twitter-recsys-challenge-2020

مصدر لى فنغ شبكة AI شبكة من لى فنغ لى فنغ التعليقات الشبكة

وباء الالتهاب الرئوي تاج جديد أفضل، والناس جينان حديقة الغابات للتمتع الأيام الخوالي الربيع

الذي كان أول مدرسة الفتوة على pingyin التاريخ؟

جينان على اللسان

ورقة اليوم | 4D FIG الجمعيات؛ دراسة خصائص عامة، ويتعلم عنصر النقل؛ FIG الجيل مشهد غير متحيز، الخ

120،000 مكافأة وتدريب الشركات الشهيرة، دخول الصين الذكاء الاصطناعي NLP العد التنازلي مسابقة

جوجل تحديثات أكبر مجموعة بيانات الصورة المشروح، إضافة السرد المحلية

المؤسسات معبر الحرس التعليم والتدريب بنحو 60 مليون خط: التحول و"المساعدة الذاتية"

Ambarella الحوار أشباه الموصلات إيطاليا المدير العام، IEEE زميل البرتو أستاذ Broggi: مجهر خط الرؤية ستيريو مع الطيار الآلي مستقبل أوسع

مجموعة الوسطى لهجة، "البنية التحتية الجديدة" النار شامل! علم السبعة والتكنولوجيا لاندلاع

الاتصالات الكم الضوئية قياسيا عالميا جديدا! بان جيان وى، وانغ Xiangbin فريق الكم توزيع مفتاح 509 كم الأساس

ضبط أسعار السيارات قبالة "طفرة صحية"، SAIC مع "عميق UV" مكافحة الفيروسات التكنولوجيا سواء ذبابة؟

ورقة اليوم | الاجتماعية التى STGCNN، الكلام وجه جيل الفيديو؛ المكونات توليف الصورة؛ فائقة الدقة زاوية الحقل البصري، الخ