الكستناء من الجزء السفلي من الجانب المقعر من غير معبد،
تقارير و qubit | عدد ملفه QbitAI
خريطة ، هل بنية بيانات مفيدة مع العقدة (عقدة) و جانب (حافة) تنسج شبكة. على سبيل المثال، علم رسم الخرائط هي واحدة من هذه الشبكة.
معالجة هذه البيانات، الاستخدام FIG التضمين (الرسم البياني التضمين): شبكة الأبعاد عالية، يتم تحويلها إلى ناقلات الأبعاد منخفضة. بعد المعالجة، نماذج التعلم الآلي يمكن تناول الطعام بسهولة.
إذا كانت الصورة على هذا FIG، فقط عدد قليل من العقد، وحواف عشرة، أي صعوبة التضمين FIG.
إذا كان هناك عدة مليارات العقد، تريليونات حواف ذلك؟ سوف FIG طريقة التضمين التقليدية قبض القلق.
ولكن الآن، الفيسبوك المصدر المفتوح ويطلق عليه PyTorch-BigGraph (يشار إلى أن PBG ) أدوات جديدة.
مع ذلك، فإن أعظم عرض (الأصلي كبير بشكل تعسفي، أي كبير) يمكن تركيبها بسرعة توليد FIG. وعلاوة على ذلك، كل ذلك دون GPU .
بالإضافة إلى تدريب نموذج مفتوح المصدر الخاص بها، وهناك 78 مليون العقد ويكي بيانات تأخذ نموذج بيانات المدربين قبل، يمكنك تحميل الاستخدام.
بعد أن نشر PBG والشركاء الصغار الذين لديهم بحماس انتشار الأخبار:
LeCun المعلم توجيه شخصيا مرتين.
كيفية زراعة
PBG هو توزيع نظام مع 120 مليون العقد كامل فريبيس رسم خرائط المعرفة للتدريب.
عملية التدريب، سوف PBG أكل في خريطة في جميع جانب (حافة) قائمة كبيرة، ويستخدم كل عقدة حافة تحديد أهدافها، والمصدر (المصدر)، وهو الهدف (الهدف). ويعرف أيضا بين النقطتين العلاقات (نوع العلاقة).
بعد ذلك، إلى كل PBG عقدة، وإخراج ناقلات ميزة (مضمن)، بحيث عقدتين المجاورة في الفضاء ناقلات من أقرب، حتى أن عددا من العقد غير المجاورة البقاء بعيدا.
ونتيجة لذلك، تلك البيئة المحيطة عقدة توزيع مماثل، فإن الموقف في الفضاء ناقلات تكون قريبة من بعضها البعض، للتعبير عن معنى الخريطة الأصلية على الحفاظ عليها.
وعلاوة على ذلك، على كل علاقة مختلفة "، ويسجل ما يقارب (القرب النتيجة)" يمكن أن تكون مخصصة في طرق حسابية مختلفة. وبهذه الطريقة، جزءا لا يتجزأ من العقدة، يمكنك مشاركة في أنواع مختلفة من العلاقات داخل.
أسرع قليلا، ثم أسرع
للتعامل بسرعة مع بيانات الخرائط على نطاق واسع، قضى PBG عدة نوبات:
أولا تقسيم الشكل (الرسم البياني التقسيم)، لذلك نحن لسنا بحاجة يتم تحميل نموذج كامل في الذاكرة. في حالة FIG تركيبها دون فقدان الجودة، وتوفير 88 من احتياجاته من الذاكرة من دون تقسيم. والثاني هو آلة الحوسبة متعددة الخيوط . ثالثا، آلات متعددة المدى في وقت واحد، كل منها يعمل في المنطقة لا المتاخمة للFIG. رابع أخذ العينات دفعة السلبية (دفعات سلبي أخذ العينات)، وحدة المعالجة المركزية يجعل من مليون لكل حافة الثانية، كل حافة 100 عينة سلبية.
بعد الانتهاء من التدريب، على FB15k، يوتيوب، لايف جورنال، الخ ويتم اختبار الشخصية.
وقال الفريق، PBG وأسلافه تماما كبيرة الرسم البياني تضمين الجودة، ولكن الوقت المطلوب وبدرجة كبيرة.
يمكنك أيضا محاولة
لديك لتدريب بار PBG.
على أي حال، لا GPU.
لا أريد أن تدريب، نموذج ثم هناك مدربون قبل مع كامل ويكي بيانات.
كنت في حاجة الى البوابة، كل شيء هنا.
كود بوابة:
https://github.com/facebookresearch/PyTorch-BigGraph
مؤشر الطعام:
https://torchbiggraph.readthedocs.io/en/latest/
ورقة بوابة:
https://arxiv.org/abs/1903.12287
مقالات المدخل:
https://ai.facebook.com/blog/open-sourcing-pytorch-biggraph-for-faster-embeddings-of-extremely-large-graphs/
- كامل -
التوظيف الصادق
المكدسة تقوم بتجنيد محرر / مراسل، ومقرها في تشونغ قوان تسون في بكين. نتوقع الموهوبين والطلاب المتحمسين للانضمام إلينا! مزيد من التفاصيل، يرجى و qubit عدد الجمهور (QbitAI) واجهة الحوار والرد "تجنيد" كلمة.
و qubit QbitAI عناوين على التوقيع
' " تتبع تقنيات AI دينامية جديدة والمنتجات