صدر الفيسبوك ثلاثة أنظمة الأجهزة AI، أعلن مصدر المفتوح وسهولة

لى فنغ شبكة الأخبار، أمس، أعلن الفيسبوك على موقعها الالكتروني الرسمي للcode.fb.com الرمز، صدر النظام الأساسي للجهاز الجيل القادم لتدريب صهيون AI لتصميم رقاقة مخصص جديد الملوك AI المنطق كانيون فضلا عن الترميز الفيديو جبل شاستا.

يشار الى ان البنية التحتية للالفيسبوك كل شهر لتوفير الخدمات لنحو أكثر من 2.7 مليار شخص على نظم التطبيقات والخدمات بأكملها. وقد صمم مهندسو وخلق نظام فعال لتوسيع البنية التحتية، ولكن مع نمو حجم العمل، والاعتماد على معالجات للأغراض العامة لم تتمكن من تلبية احتياجات هذه الأنظمة.

إيجاد حلول فعالة للبنية التحتية تحتاج إلى أن تنشأ من خلال عمل تصميم الأجهزة عبء العمل الأمثل التعاوني. لهذا السبب، الفيسبوك تم العمل مع الشركاء لتطوير حلول لAI المنطق والتدريب AI والترميز الفيديو. وتباطأ الترانزستور معدل النمو انخفض بشكل كبير، الأمر الذي يتطلب تطوير مسرعات المتخصصة والحلول الشاملة على مستوى النظام لتحسين الأداء والقوة والكفاءة.

الأجهزة AI

وتستخدم البنية التحتية الفيسبوك بأكملها في عبء العمل AI، مما سمح المزيد من الخدمات ذات الصلة، وتحسين تجربة المستخدم مع الخدمة. مساعدة الناس التفاعلات اليومية، وتوفير خدمة شخصية فريدة من نوعها. من خلال نشر على نطاق واسع من نموذج منظمة العفو الدولية، يمكن الفيسبوك توفير 200000000000000 مرات في اليوم وأكثر من ستة مليار مرة تكهن الترجمة. الفيسبوك استخدام أكثر من 3.5 مليار دولار لبناء وتدريب الصورة العامة لنموذج منظمة العفو الدولية، والسماح لهم لتحديد أفضل ومحتوى العلامة.

وتتم معظم عمليات AI خارج في الفيسبوك من خلال منصة إدارة FBLeaner، ومنصة يتضمن أدوات للعمل مع كل جزء من المشكلة، مثل التخزين وظيفية، والتدريب، وإدارة سير العمل ومحرك الاستدلال. تستخدم جنبا إلى جنب مع الحاسبات المفتوحة عن طريق نشر مشروع (OCP، توسيع مشروع حساب) تصميم الفيسبوك الأجهزة، والأداء الفعال للنموذج نشر على نطاق واسع. بدء مع مؤسسة مستقرة، وركزت الفيسبوك على خلق تصميم الأجهزة موحد وبائع مستقلة، والاستمرار في التمسك بمبدأ من التحلل من أعمال التصميم من أجل تحقيق أقصى قدر من الكفاءة وأطلقت في نهاية المطاف الجيل القادم من الأجهزة للحصول على حجم العمل والتدريب والمنطق.

صهيون AI نظام التدريب

صهيون الفيسبوك هو الجيل المقبل من تخزين موحدة منصة التدريب الكبيرة التي يمكن التعامل معها بكفاءة مجموعة من الشبكات العصبية بما في ذلك CNN، LSTM وSparseNN، بما في ذلك التصميم. منصة صهيون لتوفير تخزين ذات قدرة عالية لالحرجة أعباء العمل النطاق الترددي العالي، يربط مرنة وعالية السرعة، وقدرات حوسبة قوية.

صهيون باستخدام الفيسبوك الجديدة وحدة OAM (OCP مسرع وحدة)، AMD، حبان، GraphCore مثل الفيسبوك وNVIDIA شركاء يمكن وضع حلول خاصة بهم على مواصفات OCP شيوعا. صهيون الدعم العمارة استخدام الجزء العلوي من مفاتيح رف تمتد من كل منصة الفردية إلى خوادم متعددة في رف واحد. ويبلغ حجم وتعقيد التدريب الفيسبوك AI ينمو، كما سيتم تمديد منصة صهيون.

نظام صهيون مقسمة إلى ثلاثة أجزاء:

  • الخادم 8 المقبس

  • 8 منصة مسرع

  • OCP مسرع وحدة

صهيون ذاكرة النظام، الحوسبة وشبكة مكثفة مكونات فصل كل عنصر يسمح بتمديد مستقلة. ويوفر النظام واجهات الذاكرة 8X NUMA CPU DDR والجدول تجمع كبير أو ما شابه ذلك جزءا لا يتجزأ من التجمع تستهلك ذاكرة SparseNN. في حين SparseNN CNN أو أجزاء من هذه الذاكرة كثيفة كثيفة عرض النطاق الترددي والمكثف للحوسبة أعباء العمل، يتم توصيل كل وحدة المعالجة المركزية إلى OCP واجهات وحدة التسارع.

نظام صهيون واثنين من هيكل عالية السرعة: ربط وحدة المعالجة المركزية وهيكل متماسك من كل بنية ربط جميع دواسة البنزين. نظرا لعرض النطاق الترددي ذاكرة عالية، ولكن الذاكرة منخفضة مسرع، المطلوب من قبل الفيسبوك تقسيم النموذج إلى كفاءة استخدام سعة الذاكرة المتاحة من البلمرة، بحيث الوصول على نحو أكثر تواترا يقيم البيانات على دواسة البنزين، وأقل كثيرا الوصول يقيم البيانات مع ذاكرة DDR وحدة المعالجة المركزية. ومتوازنة عن الحوسبة والاتصال بين وحدة المعالجة المركزية ودواسة البنزين وتوصيلها بشكل فعال من خلال السرعات العالية والمنخفضة.

قبل تنفيذ الاستدلال كينجز كانيون

بعد الانتهاء من نموذج التدريب، ونحن بحاجة إلى نشر إلى بيئة الإنتاج لمعالجة البيانات عمليات منظمة العفو الدولية واستجابة لطلبات المستخدمين، وهو ما يسمى المنطق. المنطق حجم العمل يتزايد بشكل كبير، وهو ما يمثل زيادة كبيرة في العمل والتدريب، وكان المعيار الحالي المستخدمة من قبل وحدة المعالجة المركزية الخادم غير قادر على مقياس جيد النطاق لتلبية الطلب.

تعمل الفيسبوك مع الاسبرانتو، وإنتل، مارفيل وكوالكوم وغيرها من الشركاء لتطوير ونشر المنطق البنية التحتية للتحجيم على رقاقة أسيك. وهذه الرقائق توفر عملية عبء العمل INT8 نصف الدقة للحصول على الأداء المطلوب، ولكن أيضا دعم FP16 احدة الدقة الحسابية، لتحقيق أعلى قدر من الدقة.

سقوط حلول الخادم المنطق كله إلى أربعة أقسام مختلفة، والاستفادة من تم نشر OCP إلى كتل بناء الحالية. استخدام من المكونات الموجودة يمكن تسريع عملية التنمية والحد من المخاطر من خلال التنوع. أربعة عناصر رئيسية للتصميم هي:

  • كينجز كانيون وحدة المنطق M.2

  • واحدة فتحة (واحد مأخذ) الخادم التوأم البحيرات

  • الأنهار الجليدية نقطة بطاقة V2 الناقل (بطاقة الناقل)

  • يوسمايت رف V2

على مستوى النظام، من خلال M.2 كينجز كانيون لكل خادم متصلا مسرع وخادم التوأم البحيرات الجليدية نقطة بطاقات V2 الناقل. الجمعية هي التي شنت على تحديث اثنين يوسمايت V2 الرف، وتوصيلها إلى أعلى رف التبديل من قبل المضيفين متعددة NIC. يوسمايت زلاجات المحدثة ترقية متكررة يوسمايت V2 زلاجات، يتم توصيل قناة PCI-E أخرى ستستضيف التوأم البحيرات إلى NIC، من أجل الحصول على النطاق الترددي للشبكة العالي. وتضم كل وحدة أسيك كينجز كانيون، والذاكرة المرتبطة بها وعناصر الدعم الأخرى، حيث وحدة المعالجة المركزية المضيف من خلال قناة PCI-E في التواصل مع دواسة البنزين. ويشمل الجليدية نقطة V2 تبديل متكاملة PCI-E، مما يتيح الوصول المتزامن لجميع وحدات الخدمة.

عمق نموذج التعلم هو أعباء العمل المكثف تخزين مثل SparseNN النموذج يحتوي على جدول توصيف جزءا لا يتجزأ من واسع جدا، وسوف يستغرق عدة غيغابايت من مساحة التخزين، ويمكن أيضا أن يواصل النمو. نموذج من هذا القبيل قد لا تكون مناسبة لعبء كبير على جهاز ذاكرة منفصلة، أو ما إذا كانت وحدة المعالجة المركزية مسرع غير ممكن، الأمر الذي يتطلب نموذج تجزئة (نموذج التقسيم) على عدد وافر من أجهزة الذاكرة. عندما تكون البيانات في جهاز ذاكرة أخرى، فإن تجزئة خلق العديد من تكلفة الاتصالات، وحسن خوارزمية تجزئة لالتقاط مفهوم التطبيق الموضعي، مما يقلل من تكلفة الاتصال.

بعد نموذج التقسيم المناسب، يمكنك تشغيل كما SparseNN مثل هذا النموذج على نطاق واسع من نموذج التعلم العميق. إذا كانت سعة الذاكرة غير كافية لدعم عقدة واحدة نظرا نموذج، يمكن للنموذج أن يكون مزيدا من الانقسام بين عقدتين، وبالتالي زيادة كمية نموذج الذاكرة المتوفرة. العقدتين يمكن ان تكون مرتبطة عن طريق متعدد سيد NIC، ويدعم معالجة المعلومات عالية السرعة. سيؤدي هذا إلى زيادة التكلفة الإجمالية للاتصال، هناك وصول يمكن استخدام الاختلافات مميزة عبر جداول متعددة جزءا لا يتجزأ، نوع الجدول وفقا للحد من تأخير الاتصال.

الشبكة العصبية مترجم الأجهزة مسرع

كود عام أسيك ليست قيد التشغيل، فإنها تتطلب المتحولين مترجم الخاصة قد يتم تنفيذ التعليمات الرسومات على دواسة البنزين. توهج الهدف المترجم هو تحديدا بائع تجريد الأجهزة من البرامج الأكثر تقدما كومة، والبنية التحتية، بائع مستقلة. أنها تقبل PyTorch 1.0 المحسوبة من FIG مثل الإطار، ودواسة البنزين يولد التعلم الأمثل للغاية رمز لهذه الآلات.

جبل شاستا المستخدمة في الترميز الفيديو

منذ عام 2016، بث متوسط عدد الفيسبوك لايف مضاعفة كل عام. منذ إطلاقها العالمي في أغسطس 2018، لقد الفيسبوك ووتش أكثر من 400 مليون وجهات النظر في الشهر، واستخدام 75 مليون شخص كل يوم. لتحسين أشرطة الفيديو هذه، بحيث يمكن أن تتكيف مع مجموعة متنوعة من بيئات الشبكات، وتنقسم الفيسبوك إلى عدد وافر من القرارات ومعدلات بت من جودة الانتاج مختلفة، ويشار إلى هذه العملية باسم الشفرة الفيديو.

الشفرة هو حساب كامل المطلوب هو مكثفة للغاية، وكانت كفاءة المعالج للأغراض العامة غير قادرة على تلبية الاحتياجات المتزايدة من الفيديو. من أجل السير أمام الطلب، الفيسبوك ومن Broadcom والتعاون VeriSilicon مصممة الأمثل مخصصة ASIC لتحويل الشفرة أعباء العمل.

يتم تقسيم عملية الترميز الفيديو إلى عدد من الخطوات المختلفة، من أجل تحسين الكفاءة، والفيسبوك والموردين لكل مرحلة من مراحل عملية الترميز تم إنشاؤها حدة أسيك مخصصة. معدات مخصصة لإنجاز هذه أعباء العمل قد يجعل العملية أكثر كفاءة، ودعم ميزات جديدة مثل الوقت الحقيقي 4K 60FPS الجري. وموحدة ترميز الفيديو واحدة، من دون تغييرات متكررة، حتى في هذه الحالة، تفتقر إلى المرونة يتميز رقاقة العرف ليس عيب كبير.

يشار المرحلة الأولى على أنها تحويل الشفرة الفيديو فك في عملية فك، وضغط الملفات تحميل للحصول على البيانات الأصلية يمثله سلسلة من صور الفيديو. وفي وقت لاحق هذه الصورة غير مضغوط تعمل لتغيير قرار منها، ومن ثم إعادة ترميز باستخدام الإعدادات الأمثل، فهي مضغوطة إعادة دفق الفيديو، وإخراج الفيديو إلى الأصل تحسب بمقارنة مؤشرات الجودة.

وقد اتخذت جميع شرائط الفيديو هذا النهج للتأكد من أن إعدادات الترميز يمكن استخدامها لانتاج نوعية الفيديو. ويسمى ترميز الفيديو القياسية وفك الفيديو طريقة الترميز المستخدم التيار بروتوكولات ترميز H.264، VP9 وAV1 تستخدمه حاليا.

في ASIC، إضافة إلى خوارزميات برنامج يتم استبدال كل من وحدات محددة داخل رقاقة، هي خطوات أخرى نفس، الفيسبوك فيديو المعجلات قد تدعم قرار أكثر المرجوة وصيغ الترميز الأخرى، وتحقيق أعلى من الخادم الحالي مرات عديدة كفاءة، والهدف من ذلك هو معالجة اثنين 4K 60FPS 10W على الأقل السلطة داخل تيارات مدخلات موازية.

الشفرة الفيديو ASIC ديه عادة الكتل المنطقية الرئيسية التالية:

  • فك: تلقي تحميل، ضغط الناتج دفق الفيديو الخام

  • المتسلق (المتسلق): تغيير دقة الفيديو

  • التشفير: إخراج مضغوط (المشفرة) فيديو

  • اختبار الجودة: بعد حساب جودة الفيديو المشفرة

  • PHY: شريحة التفاعل مع العالم الخارجي، والاتصال إلى قناة الخادم وذاكرة PCI-E

  • تحكم: التنسيق بدوره والعام تشغيل البرامج الثابتة تدفق كتلة التعليمات البرمجية

مثل الاستدلال، الفيسبوك OCP باستخدام كتل البناء التقليدية الشفرة الفيديو أسيك المنتشرة داخل مركز البيانات. هي التي شنت على دواسة البنزين على وحدة متكاملة بالوعة الحرارة M.2، يمكن أن يكون هذا الملف المشترك الكهربائي المشترك على منصات الأجهزة المختلفة. هي التي شنت وحدة على الجليدية نقطة V2 (GPv2) حامل البطاقة، والناقل وجود بطاقة والخادم التوأم البحيرات نفس الشكل المادي، يمكن أن تستوعب عدد وافر من وحدات M.2، يوسمايت V2 رف يمكن تكييفها، وحيث والبحيرات التوأم الزوج الخادم.

منذ الفيديو الترميز ASIC تتطلب طاقة منخفضة وحجم صغير، لذلك قدر الإمكان عن طريق الفيسبوك المطلوب رقاقة وهذا مرتبط إلى خادم واحد لتوفير التكاليف. GPv2 عالي الكثافة وهذا يمكن أن يتحقق، مع توفير ما يكفي من قدرة التبريد لتحمل درجة حرارة التشغيل من مركز البيانات.

بعد الانتهاء من دمج البرامج، الفيسبوك فيديو الترميز يمكن توزيعها على غير متجانسة تحميل موازنة الأجهزة موقف مركز بيانات مختلفة. من أجل توسيع نطاق عملية التعاون مع مجموعة متنوعة من التعلم الآلي والفضاء الفيديو مقدمي الخدمات، كما أنها تسعى جاهدة لضمان أن مطوري البرمجيات مع نموذج مفتوح، وتعزيز واعتماد واجهة مشتركة وإطار.

وقال الفيسبوك في النص، وستقوم الشركة الدخول في مستقبل مشرق، وتأمل صهيون، كينجز كانيون وجبل شاستا يمكن شراؤها بشكل منفصل للتدريب العنوان في منظمة العفو الدولية، منظمة العفو الدولية المنطق والترميز الفيديو تزايد حجم العمل. سوف تكون متاحة من خلال الفيسبوك OCP فتح جميع التصاميم والمواصفات هي موضع ترحيب للانضمام شركات أخرى لتسريع عملية بناء البنية التحتية، واصلت الأجهزة والبرمجيات التصميم المشترك الجهود المبذولة لتحسين هذه النظم.

لى فنغ لى فنغ صافي صافي

الرابط الأصلي: تسريع البنية التحتية الفيسبوك مع الأجهزة الخاصة بالتطبيق

سوف هسياو لعب، يانغ كون تفشل همية أيضا، وبرنامج الموسيقى الروتيني كيفية

هل تعتقد أن ستيفن تشو مجرد عبقرية هزلية؟ خطأ، فهو انتشار المحبة من الدفاع عن النفس سيد الفنون!

الأحمر القادمة شبكة "أمبولة" في نهاية المطاف ما هو؟ سحب حسنا الأعشاب حقا يستحق؟

سوف هسياو لعب، يانغ كون تفشل همية أيضا، وبرنامج الموسيقى الروتيني كيف؟

الرقم الرسمي هوندا N BOX ارتداء صدر زرع وجه انقاص وزنه المشي في الشوارع لين

[تشونغتشينغ] لا مزدحمة سحابة زهرة معرض اللعب في عطلة نهاية الأسبوع، 6 فدان من ماغنوليا الكرز، ساعتين بياو حبل!

ادلى تشانغ يى مو تشانغ تسي يي وغونغ لي نجم، مثل عقد لها عندما رفضوا، والفتاة هي آسف جدا!

الحقيقة! الإصدار الحصري 9 الدخن وقف شفافة بيع، في الواقع، سامسونج عاء

ليو يولين وليو زينون: المودة، وبعد المسافة، و "مكتب ابنة"، "Junzizhijiao" وراء

لينوفو S5 برو، K5 برو وغيرها من خمسة إطلاق المنتجات الجديدة، بالإضافة إلى هذه هناك صورة شخصية مبدع

تشونغتشينغ قديم | منزل قديم الأجداد في هذا أحفاد يزال جيانغ جذور الخزف ciqikou

هي الدهون وقبيحة، الشريك الذي لعبته ها جي وون "مطاردة" بين الأخوات؟ وكانت ابنته