حول أوصى الذكية ستة تجربة صغيرة، انكم تستحقون

نظام توصية ذكي ليس لغزا، للتسوق عبر الإنترنت، يرى "أوصى لك، أو مزيج المرتبطة ب" البضائع، يمكننا أن نقول في التوصية ذكية من حولنا، ويبدو أيضا أن الخدمة الشخصية على نحو أفضل. وقال الأمازون CEOJeffBezos مرة واحدة حلمه هو "إذا كان لدي 1000000 المستخدمين، انا ذاهب الى القيام مليون الأمازون بالنسبة لهم." يمكن العثور على أهمية نظم توصية الذكية، فمن خلال التعلم الآلي، واستخراج البيانات، ومحركات البحث وغيرها من التكنولوجيا لتطوير نظام توصية جيدة، ولكن كيف نفعل لهم تحقيق نتائج أفضل؟

1، والاستفادة الكاملة من البيانات ردود الفعل الصريح الضمني

البيانات هي أساس كل نظام الموصى بها. حسن تأثير توصية يجب ان يأتي من بيانات غنية ودقيقة. وتشمل هذه البيانات كل من المعلومات الأساسية ذات الصلة حول المستخدم (المستخدم) والبنود التي سيتم موصى بها (البند) (ملاحظة: البند والتوصيات المحددة المشهد ذات الصلة، يمكن أن يكون سلعة، وأشرطة الفيديو، والموسيقى، والأخبار، وما إلى ذلك، إذا كان أوصى أحد الأصدقاء، ثم البند ويمكن أيضا أن يكون المستخدم نفسه)، من ناحية، وسلوك المستخدم الآخر، والعلاقة بين المستخدم وعنصر البيانات التي تحدث في الموقع أو التطبيق هو أيضا مهم جدا. لأن هذه سلوك المستخدم والبيانات العلائقية تعكس حقا تفضيلات كل مستخدم والعادات. هذه الأساسي جمع البيانات، والقيام التنظيف وظيفة جيدة وما قبل المعالجة، هو حجر الزاوية في النظام توصية بأكمله.

البيانات سلوك المستخدم، ويمكن تقسيمها إلى قسمين: البيانات ردود الفعل الصريحة (explicitfeedbacks) وردود الفعل الضمني (implicitfeedbacks) البيانات. يشير ردود الفعل الصريح البيانات السلوكية يمكن توضيح ما يحب ويكره المستخدم، مثل المستخدم شراء المنتج، والدخل - حيازة، والنتيجة وغيرها من البيانات. في المقابل، البيانات ردود الفعل ضمنية يشير لا تعكس بشكل مباشر على تفضيلات سلوك المستخدم، مثل ينقر المستخدم على الموقع، وتصفح، والبقاء، والقفز، وإيقاف الأفعال الأخرى. عن طريق حفر البيانات ردود الفعل الصريح يمكن فهم بوضوح تفضيلات المستخدم، ولكن في العديد من التطبيقات، البيانات ردود الفعل الصريح عموما متفرق، مما يؤدي إلى تفضيلات المستخدم التعدين غير قادرة على اختراق . في بعض التطبيقات، هذه المشكلة فقط على الخط، أو العنصر الجانب أقل شعبية أو المستخدم الذي يعكس على وجه الخصوص. في هذه الحالة، البيانات ردود الفعل الضمني المستخدم مهم بشكل خاص. على الرغم من أن مثل هذه الأعمال كما ينقر المستخدم على الموقع هي معقدة للغاية، ولكن يحتوي على ثروة من المعلومات. 2006 - توصية المسابقة الدولية NetflixPrize الشهيرة التي أجريت بين عامي 2008، الفريق الفائز YehudaKoren المستخدمين على العثور على تأجير الأفلام المسجلة، وتحويلها إلى ناقل ميزة حقن قيمة فريدة خوارزمية تحلل (SVD) للتأثير على ناقلات اهتمام المستخدمين، ويمكن تحسين جيدا دقة الموصى بها.

المعالجة البيانات الأساسية لتعزيز تأثير التوصية أيضا مفيدة جدا. حتى عام 2012 ACMKDD كأس (الدولية المنافسة استخراج البيانات)، على سبيل المثال، نموذج التدريب، بلغ عدد العينات السلبية في الواقع 92.82 من العدد الكلي للعينات، ولكن من خلال تحليل دقيق لهذه العينات سلبية وجدت أن هناك الكثير من عينات الضوضاء، من خلال سلسلة من تحليل وفحص طرق الدورة، التي احتفظت 11،2 من العينات للتعدين توصية لاحق، وليس فقط تحسين بنجاح دقة التوصية، ولكن أيضا يقلل كثيرا من كمية حساب. حتى الاستفادة الكاملة من جميع أنواع البيانات الصريحة والضمنية، والقيام بعمل جيد التجهيز مسبقا من البيانات، لضمان جودة البيانات المدخلة، هو أول نقطة حرجة.

2، تولي اهتماما لعامل الوقت

سلوك المستخدم هو وجود وقت واحد منتظم قوي. على سبيل المثال، عادة الناس سوف يأكل عند الظهر، والإجازات في نهاية الأسبوع، والعودة إلى ديارهم سنة جديدة سعيدة وهلم جرا. كما بانتظام استغلالها سلوك المستخدم في تطبيقات مختلفة، وهذه المرة مع خصائص جيدة، في توصية العديد من المشاهد، وسوف يوصي لتعزيز تأثير عونا كبيرا.

سجل سلوك المستخدم، يتم تسجيل السلوك (الطابع الزمني) الطابع الزمني عادة. هذا الطابع الزمني من كل من المستخدم وهذا البند لتحليلها. من وجهة نظر المستخدم من عرض: مصلحة المستخدم في كثير من الأحيان مع الزمن المتغير، قبل بضع سنوات والفائدة الفائدة الحالية قد تكون مختلفة، من ناحية أخرى، وسلوك المستخدم، هناك بعض القواعد، مثل سلوك يوم عمل وهو مشابه، ولكن عطلة نهاية الأسبوع في سلوك المستخدم تغيير، حتى في نفس اليوم، صباحا ومساء من سلوك المستخدم والتفضيلات سيكون لها مجموعة متنوعة من القوانين المختلفة.

من وجهة نظر هذا البند، وسوف شعبية مع مرور الوقت سيكون هناك تقلبات العادية، استمرار الحفر من خلال السجلات في السلوك بين المستخدم وهذا البند على مدى فترة من الوقت، غالبا ما تكون قادرة على اكتشاف هذا القانون، وبالتالي أن يوفقنا توقع سلوك المستخدم في وقت لاحق، وتحسين دقة التوصية.

بعض الوقت مشترك يتألف نظام معالجة العوامل: 1) في الصيغة، أو مستخدم حساب تصفية التعاونية البند التشابه، مما يزيد من عامل الوقت، والوقت دورا مماثلا؛ 2) يتم تعيين لطبيعة الوقت منفصلة أشهر أو أسابيع أو أيام أو ساعات، الخ أجريت شريحة الوقت، والحسابات الإحصائية، وبالتالي فإن البيانات المتراكمة لنموذج معين الانحدار (Regressionmodels)، نتيجة لتوجيهات التنبؤ؛ 3) كما خطية من المتغيرات زمنية متواصلة تستخدم لتدريب المعلمات نموذج.

3، تتطلب سيناريوهات محددة يوصى باستعمال المعالم الجغرافية

هناك بعض مشاهد الموصى بها ترتبط ارتباطا وثيقا الجغرافية والمستخدمين، وعلى وجه الخصوص، وتطبيق بعض LBS، O2O هو، بمجرد مغادرة المنطقة هذه الميزة، وذلك تنفيذا لتوصية الذكي هو ببساطة غير وارد. على سبيل المثال عندما كنت في حاجة الى توصية مطعم، دون النظر موقع المستخدم الحالي، ثم حتى لو مطعم وطعم مطابقة للمستخدم الحالي مرتفع جدا، ولكن بعيدا، هذه التوصية لا قيمة لها.

حاليا نظام توصية باستخدام ميزات جغرافية لا تزال في حالة بدائية نسبيا، وعادة ما تتطلب من المستخدم لجعل المنطقة حيث نتائج توصية الفحص (مثل المقاطعات والبلديات والمقاطعات والمحافظات، وما إلى ذلك)، أو تحدد عدد النتائج داخل دائرة نصف قطرها يدويا. هذا النهج ليس فقط عملية معقدة، وعدم وجود تحليل مفصل للمعلومات الجغرافية. على سبيل المثال، على الرغم من أن خريطة الموقع بعيدة مباشرة من A و B، ولكن هناك ظهر المترو مباشرة وإيابا بين نقطتين، في حين أن آخرين خريطة الموقع C على الرغم من أن خط مستقيم من الإغلاق، ولكن بين نقطتين تحتاج إلى إزعاج حركة المرور الالتفافية. وبالإضافة إلى ذلك، من وجهة المستخدم من عرض، أنشطة يوم هناك دائما القوانين المحلية، مثل يوم العمل، وغالبا منطقة نشطة بالقرب من مكان العمل، والوقت ليلا تكون قريبة من المنزل، وهلم جرا.

في تطبيق المعلومات القائمة على الموقع، والحاجة إلى ذكاء التفضيلات المحلية المستعمل التعدين (وهذه المرة الأفضليات وغالبا ما ترتبط ارتباطا وثيقا)، على سبيل المثال، تصفية التعاونية القائمة على المستخدم، وهو مستخدمي إقليمي مماثل نشط سلوك المستخدم، كما الصورة النمطية الموصى بها - أن منطقة نشاط المستخدم مماثلة، قد يكون هناك بعض من نفس التفضيلات. التعاونية تصفية القائمة على فكرة أو استخدام هذه المادة، حيث إدخال درجة التشابه بين منطقة البند حساب. في LatentFactorModel، منطقة نشاط المستخدم لبمثابة ناقلات ميزة تعليقات المستخدمين ضمنية وما شابه ذلك، والحلول الممكنة.

الهاتف هو أفضل الناقل بناء على توصية المعلومات الجغرافية، مع ازدياد شعبية تطبيقات الإنترنت عبر الهاتف النقال، ونتطلع إلى ظهور مستقبل مزيد من المعلومات على أساس المنتجات الموصى الجغرافية.

4، والعلاقة بين SNS

في السنوات الأخيرة، كان الشبكات الاجتماعية التطور السريع، المستخدم لم يعد مجرد متلق للمحتوى، ولكن يمكن أن تأخذ زمام المبادرة لإقامة علاقات بين المستخدمين. هذه العلاقات يمكن تقسيمها إلى علاقات واضحة (explicitrelations) والعلاقة الضمنية (implicitrelations). تشير العلاقة واضحة للمستخدم أنشأت بوضوح ارتباط، على سبيل المثال، والتركيز على بو الصغرى / قلقون حول شخص ما، وما إلى ذلك، في المجتمع أو إضافة كصديق وهلم جرا. ضمنيا يشير إلى العلاقة، وهناك بعض التفاعلات بين المستخدمين، ولكن هذه الإجراءات لا يمكن أن تشير بوضوح إلى العلاقة بين المستخدمين. على سبيل المثال يقوم المستخدم بالنقر على بو الصغرى، والتعليقات، تحال إلى آخر مستخدم آخر، إذا لاعب آخر في عالم الألعاب عبر الإنترنت يتحدث، أو PK وهلم جرا. على الرغم من أن العلاقات الضمنية ليست كما علاقات واضحة مثل وضوح، ولكن أكثر الغنية من علاقات واضحة. حتى في بعض متطلبات الدقة العالية جدا لتطبيق سيناريوهات الموصى بها، تحتاج علاقات صريحة للعب دورا رئيسيا، ولكن بعضها يحتاج إلى تحسين توصية المشهد التالي استدعاء ويوصي نتائج التنوع، وخصوصا عندما تواجه العلاقة واضحة بين تبعثر البيانات عندما تكون المشكلة (ملاحظة: هذه المشكلة منتشرة في تطبيق موصى به)، والاستفادة الكاملة من العلاقات الضمنية يمكن أن تلعب تأثير جيد جدا. KDD كأس في مسابقة هذا العام، على سبيل المثال، على المدونات الصغيرة صديق نظام توصية تينسنت عن طريق زيادة العلاقات الضمنية لدينا في SVD ++ النموذج، وتبعثر معالجة البيانات مشاكل، ويمكن أن يوصى بها لتعزيز دقة 5.5

وبالإضافة إلى ذلك، فإن شعبية من الإنترنت عبر الهاتف النقال، علاقة SNS بحيث أكثر ملاءمة للاستخدام، ويقترن المعلومات الجغرافية، مما أدى إلى رواية مثل هذه التطبيقات النقالة قناة الصغرى، جنبا إلى جنب مع العلاقات SNS والخصوصيات الإقليمية الاستخدام، وجعل نظام توصية يولد أيضا أكثر نتائج موضع ترحيب.

5، واستخراج البيانات وتحقيق الأداء الأمثل كبير

تدرس استخراج البيانات كبيرة في السنوات الأخيرة، وذلك بفضل الاستخدام الواسع للتقنيات الحوسبة الموزعة، البيانات الإنتاجية لزيادة حجم النظام، والقدرة على استخراج البيانات حاليا ينمو أيضا، وتجهيز عدد كبير من سلوك المستخدم يصبح البيانات لأكثر ملاءمة. ولكن في التعدين الموصى بها، وبين القدرة الحاسوبية والاحتياجات التشغيلية الفعلية للنظام يمكن أن توفر، هناك دائما تناقض، حتى إذا كان التخصيص الفعال والرشيد للموارد الحوسبة مهم جدا. وينبغي أن تخصص على عمق الحفر معقول. المستخدم الرئيسي أو عنصر، يمكنك تخصيص المزيد من الموارد، والمزيد من الحفريات في عمق. وينطبق الشيء نفسه على أساس البيانات، والجودة يمكن استخدامها لتحليل أكثر تفصيلا، والبيانات ذات قيمة منخفضة قد تحتاج فقط إلى عمليات تبسيط.

وغالبا ما تتطلب أنظمة الخلفية خارج الخط تحديثها دوريا النموذج، كامل المبلغ أو تحديث تزايدي هنا كيف هذا النموذج هو يستحق نقطة للقلق. نموذج المستخدم على سبيل المثال، يتم تحديث النماذج ليس كل المستخدمين الشخصية في كثير من الأحيان، ودينامية، يجب أن تحتاج إلى تحديث بشكل متكرر أكثر مساهمات المستخدم عالية. هذا البند هو مماثل، البند البند تحديث تكنولوجيا دورة الشعبية والتي لا تحظى بشعبية قد تكون مختلفة.

في أداء البيانات جوانب نظام توصية الأمثل كبيرة، وهناك بعض التقنيات المستخدمة عادة، مثل استخدام مؤشر مقلوب، مثل الاستفادة الكاملة من آلية ذاكرة التخزين المؤقت.

6، وتحسين موضوعي واضح وأدوات التقييم

تطوير نظام توصية أولي متاح ليست صعبة، والصعوبة تكمن في كيفية تأثير أفضل في التوصية الأصلية على أكثر من ذلك. تحديد أهداف التحسين وأدوات التقييم هو المفتاح لحل هذه المشكلة. تحتاج أولا إلى تحديد النظام الأمثل الهدف. مثل السعي لتحقيق نتيجة توصية CTR نظام التوصية؛ كما يرى البعض الآخر التحويل الفعلي أو انقر فوق تأثير دوران، وبعض مشاهد الموصى بها أكثر قلقا حول حداثة النتائج أوصت بأن آمل أكثر سيظهر الموقع الجديد البنود المدرجة على المستخدم والبعض الآخر مزيدا من الاهتمام لتنوع النتائج.

بعد ينصح النظام الهدف بشكل واضح، تليها السؤال هو كيفية قياس وتقييم هذه الأهداف الموصى بها؟ التقليدية المشكلة تصنيفات التنبؤ عادة RMSE (RMSE) أو خطأ يعني المطلق (MAE) وطرق حسابية أخرى. ومع ذلك، في التطبيقات العملية الأعلى-N التوصية أكثر شيوعا، NDCG هذا السيناريو (NormalizedDiscountedCumulativeGain) أو MAP (MeanAveragePrecision) هو مقياس شيوعا.

نظرا لبعض الأنظمة توصية التقنية إشارة الفن في كثير من الأحيان ذات الصلة، مثل الإعلانات أو نظام البحث، وبالتالي فإن مزايا الحوسبة منحنيات الدقة يذكر في الإعلان نسبة النقر إلى الظهور أو محركات البحث الأخرى وغالبا ما تستخدم لتقييم تأثير التوصية. فإن بعض الأنظمة حتى مباشرة في النظام يوصي تعلم الآلة، وأدوات التقييم أيضا سيتم تحويلها إلى مشكلة طريقة المقابلة.

النظام الفعلي في كثير من الأحيان أكثر مقاييس التفاعل (CTR، ودقة، والتغطية، والتنوع، والجدة وهلم جرا)، والطلب الفعلي للمنتج، وتسوية المرجح نتائج التقييم. لديه طريقة الاختبار أيضا خط A / BTesting واليدوية نقد وما شابه ذلك. بغض النظر عن الأسلوب، يجب أن يستند نظام توصية متطورة على أهداف واضحة ونظام التقييم الأمثل، فهي مثل الحاكم، وقياس وتيرة التقدم المحرز في كل نظام التوصية.

قبل أن تعتاد على ألف شخص، ونحن الآن تبدو وكأنها ألف ألف الوجوه، تحت نظام ذكي يعتمد على "الآلاف من ألف وجوه" البيئة، من خلال البيانات، الخوارزميات، والهندسة المعمارية وهلم جرا التقنيات، وسلوك وخصائص المستخدمين المنتجات الموصى بها جنبا إلى جنب مع الخاصة، أكثر إنسانية، وخدمة أكثر واقعية، وأكثر ذكاء للمستخدمين لدينا!

طريق الحرير

حول أوصى الذكية ستة تجربة صغيرة، انكم تستحقون

وليس رحلة الى اللحاق بالركب، خوض الكثير ماديا علة، ليلة هي سحب الصوف 20000000000

العيد شره من الأرز والدخن تنطبق على المقاعد المفتوحة العيد القادم: لى جون كوك

التفكير في الأمر؟ خلال ذاكرة حدث الأسعار أيضا في هؤلاء الأطفال المسرات!

التطور والممارسة 58 مدينة نظام توصية الذكية

نشرت الصين مدينة نينغبو تقرير التنافسية والقدرة التنافسية للبلاد لأول مرة في العشرة الأوائل

الشاشة الصغيرة الإنجيل! اي فون SE مرة أخرى على الرفوف، بسعر يوان فقط 1687

سهلة القراءة آلة التعلم خوارزمية العشرة

اندروز قناة الصغرى الإصدار 7.0 بيتا متاح للتحميل مسؤول: الميزات الجديدة في هذا

360 متصفح السرعة لنظام التشغيل Mac سراح الزهر الأصلي من التجربة الأصلية

تصبح منصة الأعمال الإلكترونية المشترين؟ شارك سحب الكهرباء المورد الصوف من الفرص الخفية

كنت تنفق فرشاة الهاتف الخليوي لركوب الحافلة حتى الآن؟ فرشاة الهاتف الخليوي لاتخاذ القطار هنا مرة أخرى

تقرير اتجاه تطوير الذكاء الاصطناعي العالمي لعام 2019

أقل مركزية باريس، هو كيفية الفوز في أولد ترافورد

يقدر طرق سبعة إصابات (مع رمز)

0 يوان مقابل فتح بطاقات الهاتف، والهواتف المحمولة التنقل البلاد فرشاة

صغيرة ميان تشو جدول 9.0 التحديث تحديث مرة أخرى، يا الدخن ميكس 2 و 6 ذلك؟

سرق الحدث البالغ من العمر 16 عاما ما QQ، والآن كيف؟ الشائعات الرسمية تينسنت

مهاجم هينان جياني يريد البقاء في الدوري الممتاز، 11 هدفا في 21 مباراة الموسم الماضي،

"صيف شراء شراء شراء" توصية يوم الاثنين غرامة القادمة!

شياو 855 التعرض النموذج، تشغيل ما يصل إلى 360000 نقطة، ويقدر آلة الإنتاج إلى 40 مليون دولار!

Baojun التعرض الرسم سيارة براءات الاختراع، أو أن تصبح الجديد SUV عائلة الرائد

موتو G7 السلطة لقطات آلة حقيقية، العضو: OK هذا هو الإصدار 2019؟

الأحكام ذات الصلة