تطابق السيدة بين أفضل نتيجة ومفتوحة المصدر مايكروسوفت بنج البحث الخوارزميات الرئيسية وراء!

مع شعبية الإنترنت، أصبح البحث واحدة من الوظائف الأساسية الأكثر استخداما، ولكن ما هو السر وراء ذلك؟ في الآونة الأخيرة، ويصف مايكروسوفت كيفية استجابتها لتغيير عادات بحث المستخدم، ودعم ومفتوحة المصدر بينغ بحث خوارزمية وراء.

الكاتب | تشارلي فالدبرغر المترجم | ليو تشانج ذبيان | الحادية عشرة أنتجت | AI معسكر التكنولوجيا (معرف: rgznai100)
الاحتياجات المتغيرة البحث

السابقة ظيفة البحث صفحة بسيطة جدا، يقوم المستخدم بإدخال بضع كلمات، فإنه سيعود قائمة من صفحة نتائج المقابلة. اليوم، قد تكون هذه للمستخدمين استخدام الهواتف المحمولة لالتقاط الصور ووضع مربع البحث أو استخدام مساعد الذكية الخاصة بهم لطرح الأسئلة، لا تحتاج إلى أجهزة تعمل باللمس شخصيا. قد يدخلون مباشرة على سؤال ونتوقع استجابة المقابلة، وليس مجرد قائمة من صفحات إعطاء عدد من الإجابات الممكنة.

التغيرات في الطلب على نظام البحث فهرسة استنادا إلى الماضي، والاعتماد على مطابقة تعطى نتائج البحث الكلمات الرئيسية من محركات البحث التقليدية يمثل تحديا.

وقال رانجان ماجومدر مايكروسوفت بنج البحث وفريق منظمة العفو الدولية من مديري المشاريع "الفاصل في خوارزمية البحث الكلمات الرئيسية سيقترح في الناس التقاط الصور وطرح الأسئلة أو أنظمة بحث" ما هذا؟ ".

وبطبيعة الحال، لمواكبة تفضيلات البحث للمستخدم ليست جديدة، منذ ظهور وظيفة البحث على الإنترنت، والذي كان لعبة. ولكن الآن، ويرجع ذلك إلى تنمية الذكاء الاصطناعي، بما في ذلك التقدم مايكروسوفت في اتجاه والذكاء الاصطناعي، وعلى نحو متزايد سهلة لتلبية هذه الاحتياجات المتغيرة.

"الذكاء الاصطناعي هو جعل منتجاتنا أكثر انسجاما مع عادات تفكير الناس"، وقال ماجومدر "، ولكن الناس لديهم للتفكير في الماضي،" عندما كنت تستخدم جهاز كمبيوتر للبحث، وكيفية إدخال من أجل الحصول على النتائج التي تريدها؟ "

وقد قدمت مايكروسوفت، واحدة من أكثر أدوات الذكاء الاصطناعي المتقدمة، وكانت مفتوحة على جيثب، فإنه سيتم أيضا إطلاق سراح هذه الأدوات من خلال العملاء أمثلة AI مختبر مايكروسوفت للتكنولوجيا وإدخال الفيديو

ربط https://www.ailab.microsoft.com/vectorsearchexperiment)

وهذا ما يعرف التقسيم FIG الفضاء شجرة (التقسيم الفضاء شجرة والرسم البياني، SPTAG) الخوارزمية تتيح للمستخدمين الاستفادة من نموذج التعلم العميق لمليارات قطعة من البحث عن المعلومات خلال أجزاء من الثانية (أو الموجه). في المقابل، وهذا يعني أنها يمكن أن توفر نتائج يقابل بسرعة أكبر للمستخدم.

ناقلات بحث بالمقارنة مع البحث عن الكلمات الرئيسية، يمكنك بسهولة أكبر الحصول على نتائج البحث حسب المحتوى. على سبيل المثال، إذا كان المستخدم بكتابة "كيف عالية هو برج ايفل؟" بنج يمكن إرجاع نتائج تحكي المستخدم اللغة الطبيعية برج ايفل هو 1063 قدم، على الرغم من أن "البحث الاستعلام" "ايفل" لا تظهر كلمة في، و "كلمة طويل القامة" أنها لن تظهر في النتائج.

سيتم تطبيق مايكروسوفت لبحث متجه محرك البحث بينغ، لا يمكن للتكنولوجيا أن تساعد بنج أفضل الجغرافية القصد وراء توقف مليار البحث على شبكة الإنترنت، والعثور على أفضل مباراة في المليارات من الصفحات.

باستخدام ناقلات للبحث أفضل

هي الكلمة على طبيعة ناقلات، أو غيرها من نقاط البيانات الصور الرقمية بكسل تمثل، فإنه يساعد على التقاط المعنى الحقيقي للقطعة معينة من البيانات. بسبب التقدم في تكنولوجيا التعلم العميق، تعتقد مايكروسوفت أن استخدام هذه النواقل يمكن أن تبدأ في فهم وتمثل هدف البحث. يتم تخصيص مرة واحدة البيانات إلى نقطة من البيانات، أو قد يتم ترتيب لتعيين هذه النواقل، والتي رتبت لتوجيه التمثيل الرقمي للتشابه. سيتم عرض النتيجة النهائية الأقرب إلى المستخدم، وذلك لتعزيز نتائج البحث. عندما لاحظت يبحث المستخدم عن المهندسين نمط اتجاه غير طبيعي، ناقلات بحث استخدام التكنولوجيا بنج وراء يبدأ.

وأضاف "في تحليل السجلات لدينا، وجد الفريق أن الأحرف استعلام البحث الحصول على فترة أطول"، وقال ماجومدر. وهذا يدل على أن المستخدم يثير المزيد من الأسئلة للبحث عن مزيد من التوضيح لهذه المشكلة قبل تجربة سيئة البحث عن الكلمات الرئيسية، أو "في محاولة للتفكير مثل الكمبيوتر" عند وصف الأشياء المجردة. هذه هي غير طبيعية وغير مريح للمستخدم.

بواسطة البحث بينغ، وقد تم تمديد عمل كمية موجهة لمحركات البحث أكثر من 150 مليار البيانات لتعزيز تأثير خوارزميات مطابقة الكلمات الرئيسية التقليدية، بما في ذلك كلمات مفردة، حرفا، صفحة على شبكة الإنترنت مقطع التعليمات البرمجية والاستعلامات كاملة ومعلومات وسائل الإعلام الأخرى. وبمجرد أن يبحث المستخدم، يمكن بنج مسح ناقلات مؤشر وتوفير أفضل النتائج مطابقة. Vectoring عمق تعلم استخدام التكنولوجيا للتدريب والتطوير المستمر. سوف نموذج النظر في الماضي مزدوجا فوق إدخال المستخدم بعد البحث، من أجل فهم أفضل لمعنى البحث.

وقال خبراء مايكروسوفت على الرغم من أن وسائل الإعلام الموجه وبيانات البحث ليست جديدة، لكن في الآونة الأخيرة من الممكن استخدامه على الكبيرة محركات البحث على نطاق و(مثل بنج). "بينغ سيقوم بمعالجة المليارات من الوثائق كل يوم، والآن الفكرة هي أن نتمكن من استخدام هذه الإدخالات ممثلة كناقل، والبحث من خلال مؤشر على نطاق واسع من أكثر من 100 مليار من أجل العثور على أفضل نتائج المباريات في 5 ميلي ثانية." مايكروسوفت جيفري تشو بينغ مدير برنامج الفريق.

لوصف هذا أكثر سهولة، وأوضح ماجومدر في التفاصيل: يمكن تمديد كومة 150000000000 بطاقة القمر، غمضة عين، ويمكن استخدامها SPTAG بنج خوارزمية البحث للعثور على جهات الاتصال في مختلف 10 البطاقة.

البحث في المشاريع خوارزمية وSPTAG

يفترض أن مكتبة البرامج لتمثيل متجه عينة وL2 يمكن استخدامها لمقارنة المسافة أو متجه المسافات جيب التمام. الاستعلام بإرجاع متجه متجه هو الحد الأدنى من المسافة أو المسافة جيب التمام L2 وناقلات الاستعلام تواجهها.

يوفر SPTAG طريقتين: دينار شجرة والرسم البياني حي المرتبطة بها (SPTAG-KDT) ك وسيلة لتحقيق التوازن بين الشجرة والرسم البياني حي يرتبط بها (SPTAG-BKT). SPTAG-KDT في مؤشر لبناء أرخص تكلفة، والبحث دقة SPTAG-BKT في بيانات عالية الأبعاد على نحو أفضل.

عملية حسابية

مستوحاة SPTAG بالطرق NGS . وهي تتألف من اثنين من وحدات أساسية هي: بناء مؤشر والباحث. RNG على أساس ك أقرب الجيران خريطة على، لتحسين الاتصال. يستخدم التوازن إلى وسائل ك شجرة شجرة استبدال دينار لتجنب ناقلات عالية الأبعاد، وتقدير المسافة دينار شجرة أخطاء ملزمة. بحث أول شجرة البحث قسم الفضاء للعثور على بعض البذور يمكن أن تبدأ البحث في عدد من RNG، ثم تكرارا بحث الشجرة والشكل.

أكد

آخر التحديثات: دعم الإدراج على الانترنت وناقلات الحذف

الخدمات الموزعة: البحث على أجهزة كمبيوتر متعددة

بناء

  • تكوين بيئة

  • تثبيت

فهو يولد مجلد الإصدار في الدليل الرمز، الذي يحتوي على كافة الأهداف يبني.

فإنه سيتم إنشاء SPTAGLib.sln في دليل الإنشاء. في Visual Studio سوف (على الأقل نسخة 2015) جمعت مشروع ALL_BUILD تولد الدليل الهدف الإصدار بناء جميع الأطراف المعنية.

التحقق

تشغيل الإصدار اختبار مجلد (أو test.exe و) للتحقق من جميع الاختبارات.

مستقبل
ناقلات تستخدم لالبصري، البحث الصوتي

وقال فريق بنج أرادوا المنتجات مفتوحة المصدر للعمل أو التطبيقات الموجهة نحو المستهلك، استنادا إلى لغة لتحديد مقاطع صوتية أو صور لمجموعة واسعة من الخدمات، مثل السماح للناس الصور تبادل لاطلاق النار من الزهور وغيرها من التطبيقات، ومن ثم تأكد من أنه ما هو نوع من الزهور. لمثل هذه التطبيقات، بطيئة أو غير ذات صلة تجربة المستخدم البحث من السهل أن تخسر.

"، وحتى بضع ثوان من البحث جعل التطبيق غير صالحة للاستعمال" قال ماجومدر. ويأمل الفريق أيضا يمكن للباحثين والأكاديميين استخدامها لاستكشاف والبحث عن اختراقات في مجالات أخرى. "لقد بدأنا لاستكشاف إمكانية بحث ناقلات الحقيقي في هذا العمق."

العنوان الأصلي: الشبكي: //blogs.microsoft.com/ai/bing-vector-search/ https://github.com/microsoft/SPTAG

"سهل" عشرات آلاف هونان "ثلاثة عشر الخمسة" التخفيف من حدة الفقر خارج الموقع نقل وثائقي

طي 3: الأطفال شي هو في النهاية هنا! ريتا جديد الجلد أية أخبار، ولكن أيضا "تغذية" ل

اخترق تجاوز المكدس، VS كود 1.34 أطلق سراحه! | عناوين المهوس

DNF الذكرى تساى شو كون ذات الصلة؟ ويتعرض كل التفاصيل، الأصدقاء: التخطيط كنت جميلة جدا

DNF: المرج لم يخرج في البرد؟ أصبحت خدمة الرقم اختبار الأبيض، وسحب أربعة ثمانية السحب في كل مكان

هونان المقاطعة تجربة الاتصالات الحياة 5G 5G مفتوحة نائب الرئيس جيجابت الذكية ذات النطاق العريض تجربة

الرسمي "Jianlou" قطعة أثرية القادمة! 12306 السكك الحديدية التذاكر خدمات لإدارة مرشح رسميا

DNF بريبين إزالة مكافأة، وكانت الميدالية الذهبية خمسة أسلحة، هؤلاء اللاعبين بحاجة إلى إعادة بناء

[أدوات البرمجة] SpringBlade 2.3.1 الإفراج عنهم، هيكل تطوير الأعمال

DNF: بعد دوامة من الاستدعاء الدم، وكلها فرق محترفة من انخفاض عتبة، ولكن مضات ليس بينهم

هل رأيت شاحنة مثقلة فارغة على ذلك؟ هذه هي الطريقة التي

نماذج الساخنة تتغير "الأساسية" القادمة، يي نقل / CS35 PLUS الحوت الأزرق طبعة تشونغتشينغ للسيارات