لمواجهة "العملاق متجانسة" عهد جديد: اليابان الدجاجة العملاق GPU والأجهزة FPGA نعمة مزدوجة

[استعراض فاز جي الجديدة لقد حان الوقت العملاق غير المتجانسة. في الآونة الأخيرة، خط الدجاجة في جامعة تسوكوبا، أصبحت اليابان أول GPU العملاق العملاق يدخل قائمة top500، تسارع FPGA العملاق الخلط. كيفية جعل وحدة المعالجة المركزية، GPU، الأجهزة FPGA وأكثر تنسيقا وكفاءة متزامن مع توفر عدد خطوة هامة على القوة.

إذا قلنا أن عصر "العملاق متجانسة" قد حان، ثم خط في وقت سابق من هذا الشهر في جامعة تسوكوبا اليابانية وحدة المعالجة المركزية، GPU، FPGA نظام الأجهزة الهجينة الخارقة هي واحدة من المستكشفين الأول من هذا العصر.

هذا العملاق اسمه الدجاجة، المصنعة من قبل NEC، ويعمل حاليا في اليابان، مركز تسوكوبا للعلوم الحاسوبية (CCS) التي تديرها شركة إنتل زيون وحدة المعالجة المركزية، نفيديا تسلا GPU وإنتل Stratix 10 FPGA معا لتوفير دعم الأجهزة.

الدجاجة نظام العمارة: 80 الدجاجة كلها مجهزة العقد مع اثنين من زيون "Skylake" الذهب وأربعة CPU تسلا V100 GPU، في حين تم تجهيز عقدة 32، وأيضا مع اثنين من GPU Stratix 10 FPGA. يسمى عقدة الخاصة 48 CPU-GPU "العقدة دينيب" (لألمع النجوم اسمه الدجاجة A)، و 32 وحدة المعالجة المركزية GPU-FPGA عقدة يسمى منقار الدجاجة عقدة (اسمه في كوكبة الدجاجة وثنائي).

نموذج FPGA بطاقة Bittware 520N بكيي، الموردين Nallatech، وهذه "ثقيلة" عروض بطاقات FPGA 10 تيرافلوب من أداء الدقة واحد، فضلا عن أربع مجموعات من ذاكرة DDR4. على وجه الخصوص، وقد تم تجهيز البطاقة مع أربعة منافذ 100G الشبكة البصرية، وتوفير عرض النطاق الترددي الكلي لل400Gbps، وهيكل نفسه يمكن الاتصال مباشرة مع غيرها من 520N FPGA. في كوكبة الدجاجة، وخاتم يمكن مترابطة 2D 8 8 شبكة 64 في FPGA. تضم Bittware حزمة دعم اللوحة (BSP)، للمطورين OpenCL.

الدجاجة مزدوجة الدقة أداء الفاصلة العائمة من كل عقدة 30 تيرافلوب، حيث يتم توفير قوة حافلة 28 قبل أربعة V100 GPU. أنه يوفر 20 تيرافلوب الدقة واحدة على FPGA مع جهازين Stratix 10 عقدة. قد توفر مشغلي قوة الجهاز 2.4 سرعتها بيتافلوب (نقطة عائمة 64 بت) أو 5.12 سرعتها بيتافلوب (32 بت النقطة العائمة) قوة المشغل.

المستخدمة حاليا من قبل، الدجاجة واستبدال غيبوبة وكالة، والدافع غيبوبة قبل وحدة المعالجة المركزية وزيون فاي شارك في المعالج كراي CS300 عنقود إنتل زيون. تأسست في عام 2014، وتقاعد في نهاية مارس من هذا العام، لإفساح المجال لكوكبة الدجاجة.

Mellanox HDR بتقنية InfiniBand نظام ربط المسؤول عن كوكبة الدجاجة، FPGA والشبكات المستقلة، ومصمم النظام لضمان عرض النطاق الترددي الكافية للتواصل بين العقدة. يستخدم كل عقدة أربعة اتصال قناة 100Gbps HDR لكامل الثنائية شبكة شجرة الدهون. استضافت شبكة بتقنية InfiniBand تستخدم أيضا للوصول على معدات DataDirect شبكات ES14KX 2.5 نظام الملفات PB بريقا.

على الرغم من أن إعداد "تسريع الأجهزة المزدوج" هو عصري جدا، ولكن في الواقع الدجاجة وليس آلة الاختبار. والغرض الرئيسي من إنشائها هو توفير الإنتاجية لحقل البحث العلمي في علم الكونيات والفيزياء الجسيمات وعلوم الحياة والذكاء الاصطناعي. من خلال الجمع بين وحدة المعالجة المركزية \ GPU \ FPGA، والسعي لمعظم لعب بشكل فعال مزايا الحسابية الأجهزة كل منها في البحث العلمي الفعلي.

على وجه التحديد، GPU هي المسؤولة عن توفير الحوسبة المتوازية الحبيبات الخشنة متخصصة أساسا في مجال الحوسبة الصديقة SIMD، و FPGA توفير الحوسبة المتوازية الحبيبات غرامة، أكثر ملاءمة لخوارزميات غير SIMD. لنمذجة المناخ، المعلوماتية الحيوية، وديناميات الجزيئية والجيوفيزياء والخوارزميات المحددة المستخدمة في الجبر الخطي، وقد ثبت FPGA الممكن تحقيق من وحدة المعالجة المركزية، GPU أسرع وأكثر كفاءة العمليات. ومع ذلك، في العلم يمكن استخدامها بكفاءة في وقت واحد من كل من أبنية خلال التعليمات البرمجية.

العمارة نظام الدجاجة

هو محاكاة تطبيق هدف واحد الدجاجة الكون المبكر، والإشعاع محاكاة مصدر الإرسال. يتم تنفيذ المحاكاة في مجموعة من التعليمات البرمجية ARGOT، والذي يدعى "ART" (نقل الإشعاعي ريال مدريد) الخوارزمية تعقب الشعاع هو جزء مهم من المحاكاة، جزء ART هو أكثر ملاءمة للتشغيل على نطاق واسع على FPGA منصة الأجهزة.

ومع ذلك، وأجزاء أخرى من ARGOT تعمل الأنسب على GPU، لذلك أصبح استخدام "تسريع الأجهزة المزدوج" أفضل حل. هذا التنسيق يتحقق باستخدام تطبيق يستند إلى الوصول المباشر للذاكرة بين GPU وبكيي FPGA، يتسبب في وحدة المعالجة المركزية لتجنب تأثر وتأخر.

وحققت ART تستخدم على مستوى عال نسبيا من تنفيذ OpenCL، يشير إلى أن المطورين الآخرين يمكن أن تفعل الشيء نفسه. وقال الجانب Bittware قورنت نفذت وجد المستخدم تنفيذ OpenCL والاستخدام الدقيق للغة وصف الأجهزة المستخدم (HDL) أنه في كثير من الحالات، تنفيذ OpenCL من حيث الأداء والتي هي "بما فيه الكفاية وثيقة".

على مدى السنوات القليلة الماضية، دفعت تطوير البرمجيات FPGA تقدم مايكروسوفت وأمازون وبايدو وغيرها من عمالقة متزايد تستخدم على نطاق واسع الأجهزة FPGA، خصوصا في تطبيقات مثل آلة التعلم والتفكير.

ومع ذلك، في عالية الأداء منصة الحوسبة، وذلك باستخدام عدد أقل من الأجهزة FPGA. جامعة تسوكوبا، وهذا سوف تكون واحدة فقط لدخول الدجاجة العملاق قائمة TOP500 من أجهزة الكمبيوتر العملاقة مع تسارع FPGA. جامعة بادربورن في ألمانيا تثبيت العام الماضي استخدام FPGA الخارقة، كراي CS500 العملاق، ومجهزة 32 بطاقة Bittware 520N، ولكن لم يتم تزويد الجهاز مع GPU.

وهناك غيرها من كتلة HPC القائم على FPGA في جميع أنحاء العالم، بما في ذلك ولاية فلوريدا CHREC (التي أعيدت تسميتها الآن SHREC) نوفا-G # النظام، Maxeler مركز هارتري المملكة المتحدة HPC-X والمنجنيق 1 ومجموعة V2 HARP الكمبيوتر TACC ل.

هل سيكون هناك أكثر وأكثر قوة العملاق متجانسة ولدوا في المستقبل؟ ذلك يعتمد ليس فقط على احتياجات المستخدمين، وسوف تعتمد على ما إذا كان المزيد من الشركات المصنعة للأجهزة والمطورين الاستمرار في تعزيز نظام البناء البيئي من أعلى إلى أسفل.

من وجهة نظر Bittware، فإن الدافع الرئيسي يجب أن يأتي من المستوى المتوسط، في حين أن لغة عالية المستوى وتعتمد على تطوير أدوات أكثر تطورا لمزيد من الدعم بشكل كامل. والخبر السار هو أن الحالي اثنين من أكبر الشركات المصنعة FPGA الصناعة - إنتل وSailin سي وتوفر أدوات أفضل للمطورين ودمج هذه الأدوات مع منتجات FPGA الجيل القادم.

من وجهة النظر هذه، يبدو أننا غير متجانسة المستقبل الخارقة للحفاظ على التفاؤل الحذر.

الروابط المرجعي:

https://www.nextplatform.com/2019/04/18/supercomputer-mixes-streams-with-cpu-gpu-and-fpga/

مازدا 3 الجديدة يمكن أن يحرك سوق السيارات فئة السيارات المدمجة هذه المياه الموحلة؟

أكل اهتمام البضائع! سجل هونغ كونغ البحر صيد "صناعة وعاء ساخن".

جيدة إقناع راي أخبار جيدة، في المرة القادمة نحن لا قطع الانفجارات، ولم يكن لديك وجه طويل، يانغ يانغ

البنوك أغنية جينغ شيان تحت حقول القمح والمجرمين يلة سرقة أربعة أطنان من العملات القديمة!

جيا يويتينغ يحملون هذه الخطوة الكبيرة، متمنيا الموسيقى، والقيمة السوقية لأكثر من 3 مرات "الطموح" لتحقيق ذلك؟

"هذا هو الضرب فقط ويأمل أي Baiai ......" مايو عالم الحب والتسامح يمكن لها أن تعوض تلك الإصابات والدافع

قسم تقييم لمسافات طويلة 2019 Baojun 530: لا تغيير بعد مجلس القصير "الأساسية"

الإعلاميين الساخن قاو شياو سونغ C لو الحادث غير سارة، وانتقد ترجمة تضيف المعرض الخاصة بهم، حتى وراء قاو شياو سونغ

الفساد أن الفساد جدد؟ الدخان فلكي تصل إلى أعلى سعر 3800 يوان!

الظلام ثوب أزرق مع الإخوة الداعمة رايات

كا جديدة جولف جولة: بعد الترقية الداخلية والخارجية، والمبيعات يمكن مرة أخرى على الأرض؟

هان Pingsai النهائي معاينة: أول لقب الفردي المفتوح Liangjing كون تشونغ، فردي السيدات شكا المباراة