مقالة حصرية تتفهم نظام المعرفة نظام التوصية (التقييم ، القتال الفعلي ، مواد تعليمية)

(انقر لعرض الصورة الكبيرة)

رب هذا المقال لشرح:

تقييم نظام التوصية
بداية باردة للنظام الموصى بها (بداية باردة)
قتال النظام الموصى به (القتال الفعلي)
حالة النظام الموصى بها (دراسة حالة)

تصفح الفصول الثلاثة الأولى يرجى الاطلاع على المقال السابق.

4. تقييم نظام التوصية

كيف تحكم على إيجابيات وسلبيات نظام التوصية؟ هذه هي المشكلة الأولى التي يجب حل تقييم نظام التوصية. هناك بشكل عام 3 مشاركين في نظام توصية كامل:

المستعمل
مزود البند
توفير مواقع الويب التي توفر نظام توصية

يمكن أن يسمح تصميم نظام التوصية الجيد لنظام التوصية بجمع ملاحظات المستخدم عالية الجودة ، وتحسين جودة التوصية باستمرار ، وزيادة تفاعل المستخدمين ومواقع الويب ، وزيادة دخل الموقع. لذلك ، عند تقييم خوارزمية التوصية ، تحتاج إلى النظر في مصالح الأطراف الثلاثة في نفس الوقت. نظام توصية جيد هو نظام يمكنه الفوز في وضع الفوز.

4.1 الطريقة التجريبية للنظام الموصى بها

بشكل عام ، يتم إطلاق خوارزمية توصية جديدة أخيرًا ، وتحتاج التجارب الثلاث المذكورة أعلاه إلى إكمال: التجارب غير المتصلة بالإنترنت ، ومسوحات المستخدمين والتجارب عبر الإنترنت.

4.1.1 تجربة متصل

تتكون طريقة التجارب غير المتصلة بالإنترنت بشكل عام من الخطوات التالية:

الحصول على بيانات سلوك المستخدم من خلال نظام السجل ، وقم بإنشاء مجموعة بيانات قياسية وفقًا لتنسيق معين ؛
قسّم مجموعة البيانات وفقًا لقواعد معينة إلى مجموعات التدريب ومجموعات الاختبار ؛
تدريب نماذج اهتمام المستخدم على مجموعة التدريب ، توقع على مجموعة الاختبار ؛
نتائج التنبؤ للاختبار المحدد بواسطة خوارزمية تقييم الفهرس غير المتصلة المحددة مسبقًا.

من الخطوات المذكورة أعلاه ، يمكن ملاحظة أن التجارب غير المتصلة لنظام التوصية يتم الانتهاء منها على مجموعة البيانات ، مما يعني أنه لا يحتاج إلى نظام عملي لتوفيره للتجارب. طالما أن هناك مجموعة بيانات مستخرجة من سجل النظام الفعلي هذا هو كيف يمكن لسرعة التجارب غير المتصلة باختبار عدد كبير من الخوارزميات ، وهي ميزة كبيرة للتجارب غير المتصلة بالإنترنت. وهم الرئيسي العيب هو أنه من المستحيل الحصول على الكثير من مؤشرات الاهتمام التجارية ، مثل النقر -من خلال معدل التحويل ، ومعدل التحويل ، وما إلى ذلك ، ومن الصعب العثور على مؤشرات دون اتصال مع مؤشرات الأعمال ذات الصلة للغاية.

4.1.2 مسح المستخدم

هناك فجوة بين مؤشرات التجارب غير المتصلة بالإنترنت ومؤشرات الأعمال الفعلية. على سبيل المثال ، هناك فرق كبير بين دقة التنبؤ ورضا المستخدم. دقة التنبؤ العالية لا تساوي رضا المستخدم العالي. لذلك ، إذا كانت هناك حاجة إلى خوارزمية لتقييم الخوارزمية بدقة ، فستكون هناك حاجة إلى بيئة حقيقية نسبيًا. أفضل طريقة هي اختبار الخوارزمية مباشرة ، ولكن إذا كانت الخوارزمية ستقلل من رضا المستخدم ، فليس من المؤكد. الاختبار عبر الإنترنت له مخاطر عالية ، لذلك من الضروري عمومًا إجراء اختبار يسمى استطلاع المستخدم قبل الاختبار عبر الإنترنت.

يجب ضمان اختيار مستخدمي الاختبار للتأكد من أن توزيع مستخدم الاختبار هو نفسه توزيع المستخدم الحقيقي على سبيل المثال ، نصف الرجال والنساء ، وكذلك توزيع العمر والنشاط ، هو قدر الإمكان من المستخدمين الحقيقيين. بالإضافة إلى ذلك ، يجب أن تحاول استطلاعات المستخدم التأكد من أنها تجربة مزدوجة.

مزايا وعيوب استطلاعات المستخدم واضحة أيضًا. انها الميزة هي الحصول على العديد من المؤشرات التي تعكس المشاعر الذاتية للمستخدمين خطر التجارب عبر الإنترنت منخفض للغاية ، ومن السهل تعويض الأخطاء. العيب هو أن تكلفة توظيف واختبار المستخدمين كبيرة نسبيًا من الصعب تنظيم مستخدمي الاختبار الكبير لذلك ، فإن الأهمية الإحصائية لنتائج الاختبار لن تكون كافية. بالإضافة إلى ذلك ، من الصعب للغاية تصميم تجارب مزدوجة ، وقد لا تكون سلوك المستخدمين في بيئة الاختبار والبيئة الفعلية مختلفة. لذلك ، قد لا تكون مؤشرات الاختبار التي تم جمعها في بيئة الاختبار قادرة على التكاثر في الواقع بيئة.

4.1.3 تجربة عبر الإنترنت

بعد الانتهاء من التجارب غير المتصلة بالإنترنت ومسوحات المستخدم الضرورية ، يمكنك الاتصال بالإنترنت لاختبارات AB لمقارنتها مع الخوارزمية القديمة. اختبار AB هو طريقة تجريبية شائعة الاستخدام لخوارزميات التقييم عبر الإنترنت. إنه يقسم المستخدم بشكل عشوائي إلى عدة مجموعات من خلال قواعد معينة ، ويستخدم خوارزميات مختلفة للمستخدمين في مجموعات مختلفة ، ثم يمكن حساب الخوارزميات الإحصائية المختلفة لمؤشرات التقييم المختلفة لمجموعات مختلفة. على سبيل المثال ، يختلف أداء الخوارزميات المختلفة نسبيًا. يمكن للقراء المهتمين باختبارات AB أن يتصفح موقع الويب ، والذي يعطي العديد من الأمثلة التي تعمل على تحسين رضا المستخدمين لمستخدمي موقع الويب من خلال اختبار AB الفعلي. من هذا يمكننا أن نتعلم كيفية إجراء اختبار AB المعقول .

اختبار AB الميزة هي أنه يمكن الحصول على مؤشرات الأداء لخوارزميات مختلفة بشكل عادل بما في ذلك مؤشرات الاهتمام التجاري. اختبار AB العيب هو أن الدورة طويلة نسبيًا ، ويجب إجراء تجارب طويلة على المدى الطويل للحصول على نتائج موثوقة جوهر لذلك ، لا يتم اختبار جميع الخوارزميات عمومًا باستخدام AB ، ولكن فقط استخدامها لاختبار تلك الخوارزميات التي تؤدي جيدًا في التجارب غير المتصلة بالإنترنت ومسوحات المستخدم. ثانياً ، يعد تصميم نظام اختبار AB الكبير لموقع AB مشروعًا معقدًا أيضًا. يتم تقسيم بنية موقع ويب كبير إلى الأمام والخلف. غالبًا ما يتم تمرير الواجهة المعروضة للمستخدم من الواجهة الأمامية إلى الطرف الأخير عبر العديد من الطبقات. وغالبًا ما يتم التحكم الاختبارات.

إذا قمت بتصميم نظام اختبار AB لطبقات مختلفة ، فغالبًا ما تتداخل اختبارات AB المختلفة مع بعضها البعض. على سبيل المثال ، عندما نجري اختبار AB لخوارزمية توصية الخلفية ، وفي الوقت نفسه ، يقوم فريق الويب باختبار واجهة AB لصفحة التوصية. النتيجة النهائية هي أنك لا تعرف ما إذا كانت نتيجة الاختبار هو تغيير في الخوارزمية أو تغيير واجهة التوصية. لذلك ، فإن تدفق القطع هو مفتاح اختبار AB. طبقات وفرق مختلفة تتحكم في هذه الطبقات تحتاج إلى الحصول على حركة مرور اختبار AB من مكان موحد ، وينبغي أن تكون حركة المرور بين الطبقات المختلفة متعامدًا.

4.2 مؤشرات التقييم

4.2.1 رضا المستخدم

المستخدم كمشارك مهم في نظام التوصية ، رضاه هو أهم مؤشر لنظام توصية التقييم جوهر ومع ذلك ، لا يمكن حساب رضا المستخدم في وضع عدم الاتصال ، ولا يمكن الحصول عليه إلا من خلال استطلاعات المستخدم أو التجارب عبر الإنترنت.

في النظام عبر الإنترنت ، يتم الحصول على رضا المستخدم بشكل أساسي من خلال بعض إحصائيات سلوك المستخدم. على سبيل المثال ، في موقع E -Commerce ، إذا قام المستخدمون بشراء المنتجات الموصى بها ، فإنهم يشيرون إلى أنها راضية إلى حد ما. لذلك ، يمكننا استخدام معدل الشراء لقياس رضا المستخدمين.

بالإضافة إلى ذلك ، ستجمع بعض مواقع الويب رضا المستخدم عن طريق تصميم بعض واجهات ملاحظات المستخدمين. على سبيل المثال ، في راديو شبكة Douban ، هناك أزرار ردود فعل راضية أو غير راضية عن نتائج التوصية (يتم قياس رضا المستخدم من خلال ردود الفعل من القلب الأحمر وردود فعل سلة المهملات) ، ونقرات الاثنين يمكن للأزرار قياس رضا المستخدم للنظام. إنفاق. بشكل عام ، يمكننا قياس رضا المستخدم عن المؤشرات مثل معدل النقر -ووقت إقامة المستخدم ، ومعدل التحويل.

4.2.2 الدقة التنبؤية

القدرة على التنبؤ بدقة لقياس نظام التوصية أو خوارزمية التوصية للتنبؤ بسلوك المستخدم هي أهم مؤشر تقييم دون اتصال. من اليوم الذي ولد فيه نظام التوصية ، كان ما يقرب من 99 من الأوراق المتعلقة بالتوصية يناقشون هذا المؤشر. ويرجع ذلك أساسًا إلى أنه يمكن حساب هذا المؤشر من خلال التجارب غير المتصلة بالإنترنت ، مما يسهل العديد من الباحثين في الأوساط الأكاديمية لدراسة خوارزميات التوصية.

هناك مجموعة بيانات غير متصلة بالإنترنت عند حساب هذا المؤشر ، والذي يحتوي على سجلات السلوك التاريخي للمستخدم. ثم يتم تقسيم مجموعة البيانات إلى مجموعات التدريب ومجموعات الاختبار عبر الزمن. أخيرًا ، من خلال إنشاء نماذج سلوك المستخدمين ونماذج الاهتمام في مجموعة التدريب ، يتم التنبؤ بسلوكيات المستخدمين على مجموعة الاختبار ، ويتم حساب مصادفة الوزن لسلوك التنبؤ والسلوك الفعلي في مجموعة الاختبار كدقة للتنبؤ . تشمل مؤشرات دقة التنبؤ الفئات التالية:

التوقعات تسجيل

العديد من مواقع الويب التي توفر الخدمات الموصى بها لها وظيفة تتيح للمستخدمين تسجيل العناصر. إذا كنت تعرف النتيجة التاريخية لعناصر المستخدم ، فيمكنك تعلم نموذج اهتمام المستخدم منه ، والتنبؤ بمدى إعطاء المستخدم العنصر الذي سيتم تصنيف العنصر عندما يرى عنصرًا لم يتم تصنيفه فيه المستقبل.

توصية TOPN

عندما يوفر موقع الويب خدمة توصية ، فهي عمومًا قائمة توصية مخصصة للمستخدمين. تسمى هذه التوصية توصية TOPN. دقة التنبؤ الموصى بها من قِبل TOPN تقيس بشكل عام الدقة (الدقة)/معدل الاستدعاء. ترتيب R (U) هو قائمة التوصيات للمستخدمين بناءً على سلوك المستخدم على مجموعة التدريب ، و T (U) هي قائمة بسلوكيات المستخدم على مجموعة الاختبار. ثم ، يتم تعريف معدل استدعاء نتائج التوصية على النحو التالي:

يتم تعريف دقة نتائج التوصية على النحو التالي:

تغطية

يصف التغطية قدرة الحفر للنظام الموصى به لفترة طويلة من العنصر. يحتوي معدل التغطية على طرق تعريف مختلفة. أبسط تعريف هو نسبة العناصر الموصى بها التي يمكن للنظام الموصى بها أن يوصي بها. افترض أن مجموعة المستخدم للنظام هي U ، والنظام الموصى به للتوصية بقائمة من العناصر R (U) بطول N لكل مستخدم. ثم يمكن حساب معدل تغطية نظام التوصية من خلال الصيغة التالية:

معدل التغطية هو مؤشر سوف يهتم به المزود. أخذ توصية الكتاب كمثال ، قد يكون الناشر قلقًا جدًا بشأن ما إذا كان قد تم التوصية بكتابهم للمستخدمين. يمكن التوصية بنظام التوصية مع معدل تغطية 100 لمستخدم واحد على الأقل. بالإضافة إلى ذلك ، يمكن ملاحظة من التعريف أعلاه أن تغطية التوصية للتصنيفات الشائعة منخفضة للغاية. سوف يوصي فقط بتلك العناصر الشائعة. هذه العناصر تمثل نسبة صغيرة من إجمالي العناصر. لا يتطلب نظام التوصية الجيد رضا المستخدم العالي نسبيًا ، ولكن أيضًا تغطية عالية.

تنوع

من أجل تلبية اهتمامات المستخدمين الواسعة ، تحتاج قائمة التوصية إلى تغطية اهتمامات المستخدمين المختلفة ، أي أن نتائج التوصية يجب أن تكون متنوعة. على الرغم من أن اهتمام المستخدم هو نفسه في الفترة الزمنية الطويلة ، فإن لحظة معينة تصل فيها المستخدم إلى نظام التوصية ، إلا أن اهتمامه غالبًا ما يكون واحدًا ، ثم إذا كانت القائمة الموصى بها يمكن أن تغطي نقطة اهتمام المستخدم فقط ، ويمكن أن تكون نقطة الاهتمام هذه هي ليس مصلحة المستخدم في هذه اللحظة ، ولن ترضي القائمة الموصى بها المستخدم. على العكس ، إذا كانت القوائم الموصى بها متنوعة وتغطي معظم مصالح المستخدمين ، فستزيد من احتمال العثور على عناصر مثيرة للاهتمام. لذلك ، تحتاج قائمة التوصية للمستخدمين أيضًا إلى تلبية الاهتمام الواسع للمستخدمين ، أي التنوع.

يصف التنوع عدم المعرفة بين العناصر في قائمة التوصية. لذلك ، التنوع والتشابه يتوافق مع. يفترض

حدد التشابه بين العناصر I و J ، ثم يتم تعريف تنوع قائمة توصية المستخدم U (U) على النحو التالي:

يمكن تعريف التنوع الكلي لنظام التوصية على أنه متوسط القيمة لجميع المستخدمين للتوصية بتنوع قائمة:

من التعريف أعلاه ، يمكن ملاحظة أن عناصر مختلفة مماثلة لوظيفة الدرجة

يمكن أن تحدد التنوع مختلف. إذا تم وصف التشابه بين العناصر من خلال تشابه المحتوى ، فيمكننا الحصول على وظيفة تنوع المحتوى. إذا وصفت وظيفة التشابه في الترشيح المنسق التشابه بين العناصر ، فيمكننا الحصول على وظيفة التنوع في الترشيح التآزري.

بدعة

توصيات جديدة تشير إلى المستخدمين أنهم لم يسمعوا عن العناصر من قبل. أسهل طريقة لتحقيق الجدة في موقع الويب هي تصفية هؤلاء المستخدمين الذين لديهم سلوك على الموقع الإلكتروني من قبل. على سبيل المثال ، في موقع ويب للفيديو ، لا ينبغي أن توصي توصيات جديدة بمقاطع فيديو شاهدتها أو تتفوق عليها أو تصفحها. ومع ذلك ، قد تكون بعض مقاطع الفيديو هي أن المستخدمين قد شاهدوا مواقع الويب الأخرى أو شاهدوا على التلفزيون ، لذا فإن تصفية العناصر التي يعاني منها المستخدمون في هذا الموقع لا يمكن أن يدرك الجدة تمامًا.

ومع ذلك ، فإن متوسط شعبية نتائج التوصية قاسية ، لأن الأشياء التي لا يعرفها المستخدمون المختلفين مختلفة. لذلك ، من الضروري حساب الجدة بدقة.

مفاجئة

Serndipity هو الموضوع الأكثر سخونة في هذا المجال في السنوات الأخيرة. لا تشبه نتيجة التوصية للمستخدمين المفاجئين العناصر المفضلة في تاريخ المستخدم ، لكن المستخدمين يشعرون بالرضا. بعد ذلك ، يحتاج تعريف المفاجأة أولاً إلى تحديد تشابه نتائج التوصية والعناصر الموجودة في تاريخ تاريخ المستخدم ، وثانياً ، هناك حاجة إلى رضا المستخدم عن توصية نتائج التوصية.

لا يمكن الحصول على رضا المستخدم إلا من خلال استبيانات الاستبيان أو التجارب عبر الإنترنت ، ويمكن تعريف تشابه نتائج التوصية وتشابه العناصر في سجل المستخدم بشكل عام في تشابه المحتوى. بمعنى آخر ، إذا شاهد تاريخ المستخدم الفيلم ، فإن الممثلين والمخرجين الذين حصلوا على هذه الأفلام تم جمعهم ، ثم أوصوا بفيلم أنشأه المخرج والممثل الذي لم ينتمي إلى المجموعة أ ، وأعرب المستخدم عن شديدة راضٍ ، بحيث يدرك ذلك ، حتى يدركوا ذلك. توصية مفاجئة عالية. لذلك ، فإن زيادة توصية مفاجآت التوصية تتطلب رضا المستخدم لنتائج التوصية ، وفي الوقت نفسه يقلل من تشابه نتائج التوصية وسجل المستخدم.

ثقة

لا يمكن طرح درجة الثقة في نظام التوصية إلا إذا كان المستخدم يثق في نتائج توصية نظام التوصية من خلال استبيان الاستبيان. هناك طريقتان رئيسيتان لتحسين نظام الثقة:

بحاجة إلى زيادة شفافية نظام التوصية والطريقة الرئيسية لزيادة شفافية نظام التوصية هي تقديم تفسير توصية. فقط من خلال السماح للمستخدمين بفهم آلية التشغيل لنظام التوصية والسماح للمستخدمين بتحديد آلية التشغيل لنظام التوصية ، يمكن أن تثق المستخدم في نظام التوصية.
النظر في معلومات الشبكة الاجتماعية للمستخدم ، استخدم معلومات أصدقاء المستخدمين لتقديم توصيات للمستخدمين ومع الأصدقاء لشرح التوصية. وذلك لأن المستخدمين يثقون عمومًا بأصدقائهم ، لذلك إذا تم شراء المنتجات الموصى بها من قبل الأصدقاء ، فسيكونون جديرين بالثقة نسبيًا بشأن نتائج التوصية.

في الوقت الحالى

في العديد من مواقع الويب ، لأن العناصر (الأخبار ، Weibo ، وما إلى ذلك) لها توقيت قوي ، فهي بحاجة إلى التوصية بها للمستخدمين عندما تكون العناصر توقيتًا. على سبيل المثال ، من الواضح أن التوصية بأخبار المستخدمين بالأمس أفضل من التوصية بأخبار اليوم للمستخدمين. لذلك ، في هذه المواقع الإلكترونية ، تعد الطبيعة الحقيقية للنظام الموصى بها مهمة للغاية.

تتضمن طبيعة الوقت الحقيقية للنظام الموصى بها جانبين:

يحتاج نظام التوصية إلى تحديث قائمة التوصية في الوقت الفعلي لتلبية التغييرات السلوكية الجديدة للمستخدمين. على سبيل المثال ، عندما يقوم المستخدم بشراء iPhone ، إذا كان النظام الموصى به يمكن أن يوصي على الفور الملحقات ذات الصلة له ، فيجب أن يكون أكثر قيمة من اليوم التالي للتوصية بالملحقات ذات الصلة. ستقوم العديد من الأنظمة الموصى بها بحساب قائمة توصية المستخدم مرة واحدة يوميًا في الحالة غير المتصلة بالإنترنت ، ثم عرض قائمة التوصية للمستخدم خلال الفترة عبر الإنترنت. من الواضح أن هذا التصميم لا يمكن أن يرضي الوقت الحقيقي. المقابلة للطبيعة الفعلية لسلوك المستخدم ، يمكن تقييمها عن طريق تغيير معدلات القائمة الموصى بها. إذا لم تتغير القائمة الموصى بها كثيرًا بعد أن يكون لدى المستخدم سلوك ، أو لم يتغير ، فهذا يعني أن الطبيعة الحقيقية لنظام التوصية ليست عالية.
يجب أن يكون نظام التوصية قادرًا على التوصية بالعناصر الجديدة للنظام للمستخدمين. هذا يختبر بشكل أساسي قدرة النظام الموصى به على معالجة العناصر الباردة. بالنسبة لقدرات توصية العناصر الجديدة ، يمكننا استخدام نسبة العناصر الموجودة في قائمة توصية المستخدم لتقييمها حديثًا في ذلك اليوم.

قوي

سيتم مهاجمة أي نظام خوارزمية يمكن أن يحقق فوائد. مثال أكثر نموذجًا على هذا الجانب هو محرك البحث. تعتبر صراعات الغش والمكافحة في محركات البحث شرسة للغاية. هذا لأنه إذا تمكنت من جعل منتجاتك أول فاكهة بحث عن كلمات البحث الشائعة ، فسيحقق فوائد تجارية رائعة. واجه نظام التوصية أيضًا نفس مشكلة الغش ، و قوي (قوي ، متانة) يقيس المؤشر قدرة نظام التوصية على مكافحة الغش.

يستخدم تقييم متانة الخوارزمية بشكل أساسي هجوم تمثيلي. أولاً ، يمكن إعطاء مجموعة بيانات وخوارزمية لمستخدم مجموعة البيانات هذه لإنشاء قائمة توصية للمستخدم في مجموعة البيانات هذه. بعد ذلك ، استخدم طريقة الهجوم شائعة الاستخدام لحقن بيانات الضوضاء في مجموعة البيانات ، ثم استخدم الخوارزمية لإنشاء قائمة توصية للمستخدم مرة أخرى على مجموعة البيانات بعد ضوضاء الحقن. أخيرًا ، فإن متانة خوارزمية تقييم التشابه لقائمة التوصية قبل الهجوم وبعده. إذا لم تتغير قائمة التوصية بعد الهجوم بشكل كبير قبل الهجوم ، فهذا يعني أن الخوارزمية قوية نسبيًا.

في النظام الفعلي ، بالإضافة إلى اختيار خوارزمية قوية للغاية ، هناك أيضًا الطرق التالية:

حاول تصميم نظام التوصية سلوك المستخدم بتكلفة عالية الاستخدام جوهر على سبيل المثال ، إذا قام المستخدمون بشراء السلوك وسلوكيات التصفح للمستخدمين ، فيجب على الاستخدام الرئيسي للمستخدمين استخدام سلوك شراء المستخدم. نظرًا لأن الشراء يتطلب الدفع ، فإن تكلفة سلوك شراء الهجوم أكبر بكثير من سلوك تصفح الهجوم.
قبل استخدام البيانات ، اكتشاف الكرنفال ، لتنظيف البيانات.

اهداف العمل

معظم الوقت، يولي نظام تقييم وتوصيات الموقع المزيد من الاهتمام لما إذا تم تحقيق أهداف العمل في الموقع ترتبط أهداف العمل ارتباطًا وثيقًا بنموذج الربح للموقع. بشكل عام ، فإن هدف العمل الأكثر أهمية هو متوسط الربح الذي يجلبه مستخدم واحد للشركة. ومع ذلك ، ليس من الصعب حساب هذا المؤشر ، فهو يحسب فقط سعرًا كبيرًا نسبيًا. لذلك ، ستقوم العديد من الشركات بتصميم أهداف أعمال مختلفة بناءً على نماذج الربح الخاصة بها.

مواقع الويب المختلفة لها أهداف أعمال مختلفة. على سبيل المثال ، قد يكون الهدف من مواقع الويب E -commerce مبيعات. قد يكون هدف العمل بناءً على مواقع الويب المعروضة بواسطة الإعلانات المعروضة هو العدد الإجمالي لعرض الإعلانات. هدف العمل استنادًا إلى موقع الويب الخاص بربح الإعلان قد يكون العدد الإجمالي من النقرات الإعلانية. لذلك ، عند تصميم نظام التوصية ، يجب مراعاة هدف العمل النهائي ، ويستخدم الغرض من موقع الويب نظام التوصية بالإضافة إلى تلبية احتياجات المستخدمين للعثور على المحتوى ، كما أنه يحتاج إلى استخدام نظام التوصية لتسريع الأعمال التجارية المؤشرات.

5. بداية باردة للنظام الموصى بها (بداية باردة)

5.1 تعريف البدء البارد

يحتاج نظام التوصية إلى التنبؤ بالسلوك المستقبلي واهتمامات المستخدمين بناءً على السلوك التاريخي واهتمام المستخدمين. بالنسبة للشركات الكبيرة مثل BAT ، فقد تراكمت الكثير من بيانات المستخدم ولا تقلق. ومع ذلك ، بالنسبة للعديد من المواقع الإلكترونية التي تقوم بأنظمة توصية خالصة أو العديد من مواقع الويب التي ترغب في الحصول على توصيات مخصصة في البداية ، كيفية تقديم توصية أكثر فعالية للمستخدمين دون معرفة (أي بيانات سلوك المستخدم) هذا يستمد مشكلة البدء البارد.

5.2 تصنيف بدء البرد

تنقسم مشكلة البدء البارد بشكل أساسي إلى 3 فئات:

بدء تشغيل المستخدم البارد ، هذه هي كيفية تقديم توصيات مخصصة للمستخدمين الجدد
البند البارد يبدأ هذه هي الطريقة التي توصي بها عناصر جديدة للمستخدمين الذين قد يهتمون بها
نظام البرد البدء أي كيفية تصميم نظام توصيات مخصصة على موقع ويب تم تطويره حديثًا (لا يوجد مستخدم ، ولا سلوك للمستخدم ، وبعض المعلومات فقط) ، بحيث يمكن للمستخدمين تجربة توصيات مخصصة عند إصدار موقع الويب

5.3 حل مشكلة البدء الباردة

5.3.1 تقديم توصيات غير شخصية

إن أبسط مثال هو توفير التصنيفات الشائعة ، والتي يمكن أن توصي بالتصنيفات الشائعة للمستخدمين. عندما يتم جمع بيانات المستخدم ، يمكن تحويلها إلى توصيات شخصية. يوضح بحث Netflix أيضًا أن المستخدمين الجدد يميلون بالفعل إلى القوائم الشائعة خلال مرحلة البدء الباردة ، وسيحتاج المستخدمون القدامى إلى توصية طويلة.

5.3.2 استخدم معلومات تسجيل المستخدم

يتم تقسيم معلومات تسجيل المستخدم بشكل أساسي إلى 3 أنواع:

معلومات الإحصاءات السكانية ، بما في ذلك العمر والجنس والاحتلال والعرق والتعليم والإقامة
وصف اهتمام المستخدم ، ستسمح بعض مواقع الويب للمستخدمين باستخدام النص لوصف الاهتمام
خارج سلوك محطة المستخدم المستوردة من مواقع الويب الأخرى ، مثل المستخدمين الذين يستخدمون حسابات مواقع الويب الاجتماعية لتسجيل الدخول ، يمكن أن يقدم بعض السلوكيات وبيانات الشبكة الاجتماعية على موقع الشبكات الاجتماعية عند الحصول على إذن المستخدم.

هذه الحبيبات الشخصية سميكة للغاية. على افتراض أن الجنس يوصى به باعتباره تفريخًا ، فإن جميع النساء المسجلات حديثًا يرون نفس النتيجة ، ولكن مقارنة بالطريقة التي لا يميزها الرجال والنساء بين الرجال والنساء ، تحسنت دقة التوصية هذه بشكل كبير.

5.3.3 حدد العنصر المناسب لبدء مصلحة المستخدم

عند تسجيل الدخول ، يقوم المستخدمون بتفتيش بعض العناصر ، ويجمعون معلومات اهتمام المستخدمين حول هذه العناصر ، ثم يوصي بتلك العناصر المماثلة التي تشبه هذه العناصر. بشكل عام ، تحتاج العناصر التي يمكن استخدامها لبدء اهتمامات المستخدم إلى الخصائص التالية:

إنه أكثر شعبية. إذا كنت تريد من المستخدمين من عناصر التعليق ، فإن الفرضية هي أن المستخدم يجب أن يعرف ما هذا ؛
إنها تمثيلية وتمييز ، وعناصر بدء اهتمام المستخدم لا ينبغي أن تكون شائعة أو صغارًا وكبارًا ، لأن هذه العناصر لا تتميز من قبل المستخدمين ؛
هناك مجموعة متنوعة من مجموعة العناصر. في وقت البدء البارد ، لا نعرف اهتمام المستخدم ، وإمكانية اهتمام المستخدم محتملة للغاية. من أجل مطابقة مجموعة متنوعة من الاهتمامات ، نحتاج إلى توفير مجموعة من عناصر بدء التشغيل ذات التغطية العالية. يمكن أن تغطي هذه العناصر اهتمام المستخدمين الرئيسيين تقريبًا.

5.3.4

UserCF

UserCF

ItemCF

5.3.5

PandoraJinni

PandoraPandora400400

6.1

MovieLen (https://grouplens.org/datasets/movielens/)

MovieLens1~5MovieLens9431 68210 0006 0403 900100

BookCrossin g (

Book-Crossing278858271379(demographic feature)Cai-Nicolas Ziegler2004Book-Crossing

Jester Joke (

Jester Joke7349610041010~10Ken Goldberg

Netflix ؛

NetflixNetflix2005(netflix prize)10%480 18917 77010

Usenet Newsgroups (

20KDD 2007

UCI (https://archive.ics.uci.edu/ml/datasets.html)

UCIBlake1998

6.2

LibRec src="https://image.gutx.org/5139/1161/1034580136.b0c53cb5c7a37d04b16ce2085da11340.jpg"/>

LibRec70GPL3.0GitHub https://github.com/guoguibing/librec
- سلطعون src="https://image.gutx.org/5139/1161/1034580141.06c811712c0cd51a686e0326ff2fd539.jpg"/>
  
  CrabPythonitemuserCrabpython
  
  Tutorial src="https://image.gutx.org/5139/1161/1034580144.52ef75abb28d874ccc38375b902b0bd1.jpg"/>
  
  feature-basedApexKDD Cup 2012KDD Cup 2011 2012JMLRSVDFeatureMatrix FactorizationSVDSVD++, SVDFeature Logistic regressionmodelensemble
  - LibMF ( src="https://image.gutx.org/5139/1161/1034580148.6b7878652d74e0a6602c0a5fe8211cff.jpg"/>
    
    The author Chih-Jen Lin comes from the famous Taiwan National University. They have enjoyed a prestigious in the field of machine learning. In recent years, they have won excellent results in the KDD-CUP competition for many consecutive years, and have won championships لعدة سنوات.LibSVMLiblinear
    
    LibMFSGD locking problem memory discontinuity FPSGDFast Parallel SGDblock
    - LibFM ( )
    KonstanzSteffen RendleLibFMKDD Cup 2012 Track1Track2LibFM
    
    LibFMMCMCMarkov Chain Monte CarloSGDLibFM SGDSGDAAdaptive SGDALSAlternating Least Squares
    - Lenskit ( )
    JavaGroupLensMovielens
    
    GitHubhttps://github.com/grouplens/lenskit lenskit-api,lenskit-core, lenskit-knn,lenskit-svd,lenskit-slopone,lenskit-parent,lenskit-data- structures,lenskit-eval,lenskit-testk-NNSVDSlope-One
    - EasyRec ( )
    EasyRectenantEasyRectenanttenant
    
    7. Case Study
    
    7.1 Facebook
    
    Facebook Facebook ؛
    
    Facebook100010Netflix Prize Facebook Facebook Apache Giraph
    
    Facebook- Matrix Factorization, MF جوهر MFR'R,
    
    Stochastic Gradient Descent, SGD SGDSGD Alternating Least Square, ALS
    
    FacebookGiraphGiraphSGDALS
    
    100010080TB100010080GBGiraphSGD
    
    GiraphFacebook work-to-work طرق فعالة ومريحة لنقل المعلومات. تنقسم هذه الطريقة إلى دائرة من الفصل الأصلي. يحتوي كل عامل على مجموعة من العناصر والعديد من المستخدمين. في كل خطوة ، يتبع العامل المجاور الطريقة في اتجاه عقارب الساعة لإرسال تحديث العنصر إلى العامل المصب. وبهذه الطريقة ، تقوم كل خطوة بمعالجة الدرجات الداخلية لكل عامل فقط ، وبعد نفس خطوات العمال ، تتم معالجة جميع الدرجات أيضًا. تدرك هذه الطريقة أن مقدار الاتصال لا علاقة له بالنتيجة ، والتي يمكن أن تقلل بشكل كبير من كمية البيانات في البيانات في الرسم البياني. علاوة على ذلك ، فإن مشكلة التوزيع غير المتكافئ للعقد في الطريقة القياسية غير موجودة أيضًا لأن العناصر لم تعد ممثلة بواسطة Apex. من أجل زيادة تحسين أداء الخوارزمية ، قام Facebook بدمج خوارزميتين من SGD و ALS ، واقترح طريقة حلول هجين دوارة جوهر
    
    بعد ذلك ، يقوم Facebook بتشغيل الفعلي اختبار A/B تم قياس أداء نظام التوصية. بادئ ذي بدء ، من خلال إدخال مجموعة التدريب المستمر ، يوصى بنظام التوصية برفع معلمات الخوارزمية لتحسين دقة التنبؤ. ثم ، يعطي النظام درجات لمجموعات الاختبار ويقارن مع النتائج المعروفة. يقوم فريق Facebook بتقييم نظام التوصية من متوسط درجة العناصر ، ودقة التسجيل في أول 1/10/100 ، ومتوسط دقة جميع عناصر الاختبار. بالإضافة إلى ذلك ، يتم استخدام الخطأ التربيعي المتوسط (RMSE) لتسجيل تأثيرات خطأ واحد.
    
    بالإضافة إلى ذلك ، حتى إذا تم استخدام طريقة حساب موزعة ، فمن غير المرجح أن يتحقق Facebook من درجة كل زوج مستخدم/عنصر. يحتاج الفريق إلى إيجاد طريقة أسرع للحصول على العناصر الموصى بها من K قبل تصنيف كل مستخدم ، ثم استخدام نظام التوصية لحساب درجة المستخدم لذلك. أحد الحلول الممكنة هو الاستخدام بنية بيانات شجرة الكرة لتخزين العناصر المتجهات. يمكن أن يتسارع هيكل شجرة الكرة من 10 إلى 100 مرة من عملية البحث ، بحيث يمكن إكمال توصية العناصر خلال فترة زمنية معقولة. هناك طريقة أخرى يمكن أن تشبه حل المشكلة وهي تصنيف العناصر بناءً على خصائص العنصر. وبهذه الطريقة ، تنقسم العثور على درجة توصية إلى عمليتين للعثور على أكثر العناصر الموصى بها وأعلى عناصر التسجيل في مجموعة العناصر. ستقلل هذه الطريقة من مصداقية نظام التوصية إلى حد ما ، ولكن يمكنها تسريع عملية الحساب.
    
    أخيرًا ، أعطى Facebook بعض التجارب. في يوليو 2014 ، أعلنت Databricks عن نتائج أداء ALS على Spark. يقوم Facebook بإجراء تجارب قياسية استنادًا إلى مجموعة بيانات Amazon ، مقارنة بنتائج الطريقة المختلطة الغزل بناءً على Spark Mllib. توضح النتائج التجريبية أن نظام Facebook أسرع حوالي 10 مرات من النظام القياسي. علاوة على ذلك ، يمكن للأولى التعامل بسهولة مع أكثر من 100 مليار درجة.
    
    في الوقت الحالي ، استخدمت هذه الطريقة تطبيقات متعددة من Facebook ، بما في ذلك توصية الصفحة أو المجموعة. من أجل تقليل عبء النظام ، ينظر Facebook إلى الصفحات والمجموعات التي تحتوي على أكثر من 100 كمرشح. علاوة على ذلك ، في التكرار الأولي ، يستخدم نظام توصية Facebook المجموعة/المجموعة المضافة التي يحبها المستخدم والمجموعة التي لا يحبها المستخدم أو يرفض الانضمام إلى الإدخال. بالإضافة إلى ذلك ، يستخدم Facebook أيضًا خوارزميات قائمة على ALS للحصول على ملاحظات غير مباشرة من المستخدمين. في المستقبل ، سيستمر Facebook في تحسين نظام التوصية ، بما في ذلك استخدام الخرائط الاجتماعية واتصالات المستخدم لتحسين مجموعات التوصية ، وتعديل المعلمات الآلية ، ومحاولة تقسيم أفضل.
    
    7.2 أعلنت Netflix التخصيص والعمارة نظام التوصية
    
    كمزود لتأجير الفيديو عبر الإنترنت ، يمكن لـ Netflix توفير عدد كبير من أقراص DVD ، ويمكن أن يسمح للعملاء باختيار الفيديو بسرعة وبشكل مناسب. العملاء لمدة خمس أوقات متتالية. تُعرف وظائف التوصية والتخصيص الخاصة بـ Netflix بدقة في الصناعة وأعلنت بنية نظامها في هذا الصدد. ؛
    
    أعلنت Netflix عن إطار نظامها وشرحت المكونات وعمليات المعالجة:
    
    بالنسبة للبيانات ، فإن أسهل طريقة هي حفظها وتركها للمعالجة المتصلة بالإنترنت. هذا جزء من الهندسة المعمارية التي نستخدمها لإدارة العمليات غير المتصلة بالإنترنت. حساب خط إلى جانب بالقرب من الإنترنت أيضاً الطريق عبر الإنترنت إنهاء.
    - حساب عبر الإنترنت (حساب عبر الإنترنت) يمكن الاستجابة للأحداث الأخيرة وتفاعلات المستخدم بشكل أسرع ، ولكن يجب إكمالها في الوقت الفعلي. هذا يقيد تعقيد الخوارزمية وكمية البيانات التي تمت معالجتها.
    - حساب غير متصل هناك عدد أقل من كمية البيانات وتعقيد الخوارزمية ، لأنه ليس لديه متطلبات وقت قوي في الدفعات. ومع ذلك ، نظرًا لعدم إضافة أحدث البيانات في الوقت المناسب ، فمن السهل أن تكون قديمًا. القضية الرئيسية في الهندسة المعمارية المخصصة هي كيفية الجمع بين عمليات الحوسبة عبر الإنترنت والمتصل.
    - الحساب القريب بين الطريقتين ، يمكنه تنفيذ طريقة مشابهة للحوسبة عبر الإنترنت ، ولكن لا يجب إكمالها في الوقت الفعلي.
    - تدريب النموذج إنه حساب آخر يستخدم البيانات الموجودة لإنتاج نموذج ، وهو مناسب للاستخدام في حساب النتائج الفعلي.
    بنية أخرى هي كيفية استخدام أنظمة توزيع الحدث والبيانات لمعالجة أنواع وأحداث مختلفة. المشكلات ذات الصلة هي كيفية الجمع بين الإشارات والنماذج المختلفة (الإشارات والنماذج) التي تعبر ، بالقرب من الإنترنت وعبر الإنترنت. أخيرًا ، تحتاج إلى معرفة كيفية الجمع بين نتائج التوصية (نتائج التحويل) لجعلها ذات معنى للمستخدم.
    
    المورد المرجعي:
    
    < تتم كتابة المخطوطات أعلاه على أساس الإشارة إلى الموارد التالية > ال
    
    https://www.slideshare.net/xamat/recommender-systems-machine-rearning-summer-school-2014-cmu
    
    recsys
    
    https://github.com/markusweimer/cofirank
    
    https://github.com/jegonzal/powergraph
    
    https://github.com/hernad/easyrec
    
    https://github.com/lenskit/lenskit
    
    https://github.com/apache/mahout
    
    https://github.com/davidcelis/recommendable
    
    "ممارسة النظام الموصى بها" (شيانغ ليانغ)
    
    "النظام الموصى به" (انتظار ديمار جاناخ ، ترجمته Jiang Fan)
    
    "صورة سلوك شبكة المستخدم" (انتظرت NIU Wenjia)
    
    "دليل أنظمة التوصية" (Paul B Kantor Waiting)

طريق الحرير

مقالة حصرية تتفهم نظام المعرفة نظام التوصية (التقييم ، القتال الفعلي ، مواد تعليمية)

حصريا | اقتراحات ل8:00 العلماء البيانات الأولية (مرفق مصادر التعلم)

فاز العضوة الإيطالية الصينية الفوتوغرافي المجتمع وانغ Huirong جائزة الفنون الوطنية الإيطالية الثالثة عشرة

GIF- كبيرة Qiuya غوان 2-0 هزيمة دفاع المنافس، والمراوح الكورية احتفالات صاخبة!

حصريا | قراءة معرفة نظام المادة المزكي - في (مفهوم، وهيكل، خوارزميات)

الربيع الوجبات الخفيفة الأساسية، 2 دقيقة للتعلم، وحلوة وناعمة، وأيضا لذيذ من شراء

الحكومة البريطانية: لبناء قوى منظمة العفو الدولية في العالم 18 توصية (تحميل التقرير)

يوم عرض خاص الأم | قلب امرأة البحر الإبرة، وهذه المنتجات التكنولوجيا ترسل "أمهات" للتأكد من

الناس ينظرون هي الطريقة المبرمجين اعتراف! (مع دروس ~)

حصريا | قراءة تعلم المادة المتكاملة (تعلق مصادر التعلم)

حصريا | يعلمك لبناء مجموعات البيانات الخاصة بك مع Scrapy

"نيويورك تايمز": 2016 في معظم أخبار العلم لا تنسى

اليوم، استغرق شخص واحد يشارك في ماراثون Mulanshan

حصريا | الألعاب البيانات: اعتمدت نهائي دوري أيضا على!

حدث ليلة واحدة! الجمال السويسري البالغ من العمر 20 عاما وتنسى نيمار قضاء الليل!

تسينغهوا والقطع: السفر عبر الفضاء الحضري المحورية تقرير التنمية الصين!

من أجل الطفل غروت إلى بيع منغ، الأعجوبة زمني تغيرت!

تقنية تشاو | "الفضاء السهم الأزرق" 80 طنا من اختبار محرك مولد غاز الاشتعال نجاح الجولة الأولى

وإذ تشير إلى بداية من القلب للحزب لتنفيذ مدينة دائمة تسيقونغ، وهما منظمتان جديدة للاحتفال بالذكرى 40 للاصلاح والانفتاح اللوحة معرض التصوير الفوتوغرافي

مباراة استعدادية لراشفورد 2 أهداف ، وأحرز مارتيالم هيتاريان فيلايني مانشستر يونايتد 5-2 جالاكسي

حصريا | ناجحة منظم 9:00 اقتراح: البرمجة؟ في الواقع، ليس مهما جدا!

إذا آينشتاين على حق مما كنا نظن ربما سانتا كلوز الدهون

قراءة المقال شبكة معقدة (تطبيقات، ونموذج ودراسة التاريخ) | الحصرية

الأحكام ذات الصلة