صدر "الثقيلة" جوجل أوراق TPU، 75 مؤلفي، فاتحة GPU في معظم المعارضين الأقوياء

الأنفس جي تقرير جديد

تطبيقات التعلم عمق بأعداد كبيرة لجعل هندسة الحاسوب العملاق لتحسين عمق التعلم تدريجيا التطبيقات، من GPU القائم على وحدة المعالجة المركزية التقليدية، على أن تستكمل من قبل GPU وحدة المعالجة المركزية التي تستند إلى المعالج إنتل يصبح هيكل تستكمل. ومع ذلك، فإن المستقبل لفترة طويلة من الزمن، سيظل نظام الحوسبة وحدة المعالجة المركزية المختلطة + العمارة حدة التشغيل. ومع ذلك، في السوق تجهيز التعاون، مع تطبيق الذكاء الاصطناعي، تعلم الآلة، وخاصة في أعداد كبيرة، المصنعين رقاقة لها لتحسين المنتج، وإطلاق منتجات جديدة، ويريد أن يصبح قائدا في عصر ذكي شارك في المعالج - ولكن السؤال هو الذي سيتولى هذا المنصب ذلك؟

قبل حوالي أربع سنوات، بدأت جوجل لاحظت عمق المحتملين الحقيقي للشبكات العصبية في مختلف الخدمات، والطلب مما أدى لحساب السلطة - متطلبات الأجهزة، فمن الواضح جدا. على وجه التحديد، وحدة المعالجة المركزية والجرافيك لنموذج التدريب الجيد، تحتاج جوجل لتسريع مزيد من التفكير رقاقة (الاستدلال)، وبعد هذه الخطوة، والشبكة العصبية يمكن أن تستخدم في السلع والخدمات.

ومع ذلك، عندما جوجل أن يعلم انهم في حاجة الى بنية الأجهزة الجديدة، ولكن فكرة محددة غير واضح. هذا هو السبب في أجهزة جوجل من ذلك العام، دانيال نورمان Jouppi سبب لحفر الماضي. Jouppi هو واحد من كبار مهندسي المعالج MIPS، وخلق الكثير من التكنولوجيا الجديدة في ذاكرة النظام، ويشار إلى تصميم المعالجات الدقيقة، اسم Jouppi بالكاد معروف. Jouppi في مقابلة مع مقابلة منصة التالي أنه عندما انضم إلى جوجل في منذ أكثر من ثلاث سنوات على يد بالفعل لديها العديد من الخيارات، لكنه لم يعتقد مشى في نهاية المطاف إلى الأجهزة CISC الطريق.

العمارة TPU

نتحدث بالتأكيد عن TPU جوجل. رقاقة هو أول ظهور علني في مؤتمر جوجل I / O العام الماضي، ولكن لم يتم الكشف عن مزيد من التفاصيل. في الهندسة المعمارية هذا الأسبوع عقد فوق الجزء العلوي سوف ISCA 2017، ويصف ورقة TPU وكان اسمه أفضل ورقة، ونحن قادرون على فهم التفاصيل الفنية للTPU أخيرا. في ورقة، وجوجل الأداء TPU والكفاءة هسول وحدة المعالجة المركزية وNVIDIA GPU تسلا K80 للقيام مقارنة تفصيلية، والتي يمكن أن نفهم أسباب الأداء المتفوق على منطق TPU.

Jouppi في مقابلة مع مقابلة منصة التالي فرق جوجل الأجهزة الهندسية قبل أن تقرر اعتماد نهج أسيك مخصصة، في وقت مبكر من المشروع قد نظرت، باستخدام محلول FPGA لرخيصة وفعالة ومشاكل المنطق عالية الأداء. وقال Jouppi منصة التالي، اتخذ نزوة لاستخدام المرونة FPGA FPGA، "من السهل التغيير / التعديل"، ولكن نظرا لالبرمجة وغيرها من العوائق، مقارنة مع ASIC FPGA في الأداء والأداء لكل واط لديهم الكثير من الخلافات. Jouppi قائلا: "TPU مع نفس CPU أو GPU هو .TPU برمجة ليست مصممة لمعين نموذج الشبكة العصبية، ويمكن TPU (شبكة شبكة الالتواء، ونماذج LSTM ونماذج الشبكة العصبية في مجموعة متنوعة واسعة النطاق بالكامل متصلة ) تعليمات CISC التي تنفذ على. لذلك، TPU للبرمجة، ولكن TPU بدائية (بدائية) بدلا من استخدام مصفوفة أو ناقلات العددية ل".

علق منهاج التالي ذلك، ليست معقدة TPU، مشتق تبدو أشبه إشارة الرادار تطبيقات معالجة المحرك، بدلا من الهندسة المعمارية X86 القياسية. وقال Jouppi أنه على الرغم من أن هناك العديد من وسائل TPU ضرب المصفوفات، ولكن "GPU أقرب على النقطة العائمة وحدة وحدة التشغيل الأفكار" نسبة TPU، TPU لا تخزن البرنامج، تنفيذ الأمر تنتقل فقط من المضيف.

بسبب الحصول على عدد كبير من الأوزان وهذه الأوزان إلى وحدة مضاعفة المصفوفة، DRAM على TPU باعتبارها التشغيل وحدة مستقلة في نفس الوقت. وفي الوقت نفسه، مصفوفة وحدة الضرب للحد من استهلاك الطاقة عن طريق الحد من قراءة عازلة موحدة والكتابة، وهو ما يسمى ب "عملية نبض" (تنفيذ الانقباضي).

TPU اثنين من الذاكرة، وDRAM خارجي لتخزين معالم النموذج. بعد تأتي المعلمات من الطبقة العليا تبدأ وحدة تحميل ضرب المصفوفات. في نفس الوقت، ويمكن تحميله من اليسار إلى تفعيل، أو "الخلايا العصبية" الانتاج. وهذه هي في وسائل "الانقباضي" بطريقة النبض في مصفوفة، وضرب المصفوفات، كل دورة ويمكن أن يتم 64،000 مرات التراكم.

وبالنظر إلى أن معظم الشركات تستخدم آلة التعلم (باستثناء الفيسبوك) استخدام وحدة المعالجة المركزية للقيام المنطق، وبالتالي أوراق جوجل TPU سيكون إنتل "هسول" زيون E5 معالج V3 وTPU للقيام المقارنة، ويمكن رؤيتها من البيانات، والذي هو في متعدد الأبعاد المنطق أداء من السابق. وبالتالي منهاج التالي وتعليقات، ولا عجب جوجل لإجراء البحوث الخاصة بها وتطوير آلة التعلم لشريحة جديدة للقيام المنطق المستخدمة إلى الكتلة معالج X86.

في اختبارات جوجل، وذلك باستخدام 64 بت الفاصلة العائمة مشغل الرياضي 18، النواة هسول زيون E5-2699 V3، على التوالي في 2.3 غيغاهرتز في حالة يمكن معالجتها في الثانية الواحدة، و 1.3 TOPS (تريليون عملية في الثانية الواحدة)، لتوفير 51 GB / ثانية عرض النطاق الترددي الذاكرة، واستهلاك الطاقة 145 واط هسول رقاقة، ونظام (بما في ذلك 256 GB من ذاكرة الوصول العشوائي) 455 واط من الطاقة مشغولة.

في المقابل، TPU باستخدام 8 بت عدد صحيح الرياضيات، ذاكرة المضيفة إلى 256 GB و 32 GB من الذاكرة نفسها، عرض النطاق الترددي على رقاقة ذاكرة 34 جيجابايت / ثانية، ذروة 92 TOPS، المنطق أعلى 71 مرات الإنتاجية، وTPU استضافة الخادم الطاقة الحرارية هو 384 واط.

أيضا مقارنة جوجل اختبار وحدة المعالجة المركزية، GPU وTPU الاستدلال في الثانية سرعة تجهيز دفعات مختلفة (دفعة) الحجم.

بكميات صغيرة، والحالة التي يكون فيها مبلغ ال 16، أن تكتمل هسول وحدة المعالجة المركزية قبل 99 من قريب زمن الاستجابة إلى 7 أجزاء من الثانية، المنطق 5482 مرة في الثانية الواحدة (في آي بي إس)، المقابلة لقيمة الحد الأقصى (13194 IPS، دفعة 64) 42 ، يتم استخدام الذروة لتحقيق 21.3 ميلي ثانية. في المقابل، TPU يمكن القيام به في حالة وجود حجم دفعة من 200 ميلي ثانية ومازال تلبية الحد الأعلى من 7، وIPS 225،000 مرات، ذروة الأداء من 80. TPU في حالة وجود حجم دفعة من 250، بعد 10 ميلي ثانية ظهر قبل 99 من الاستجابة.

وتجدر الإشارة إلى، وجوجل اختبار في وقت مبكر نسبيا هسول زيون، ومن المتوقع أن تغير مع صدور هذا الصيف العمارة "Skylake" زيون E5، سوف IPC الارتفاع. وبالإضافة إلى ذلك، Skylake هو (18 النواة مقارنة هسول) 28 النواة، وزيون أيضا زيادة الإنتاجية الإجمالية (يقدر منصة التالي لتكون 80 زيادة). وحتى مع ذلك، وحدة المعالجة المركزية وTPU لا تزال لديها فجوة كبيرة.

وقالت بعض وسائل الاعلام ان غوغل إنشاء رقاقة الخاصة بهم، لا بد أن يكون لها تأثير كبير على صناعة الرقائق. في الواقع، لتعلم آلة مخصصة رقاقة المعالج هو اتجاه التنمية للصناعة، ومستقبل الشركات رقاقة الكبيرة من المحتمل أيضا أن تشكيل فريق لتصميم رقاقة مخصصة الخاصة.

النصف الأخير من الجملة أمر مشكوك فيه. وقال GPU العملاقة نفيديا الرئيس التنفيذي لشركة جين هسون هوانغ مؤخرا "وول ستريت جورنال" قبل عامين، أدرك جوجل GPU هو أكثر ملاءمة للتدريب، ولكن ليست جيدة في التحليل والقرار بعد التدريب . يمكن أن ينظر إليه، الدافع جوجل لخلق TPU ترغب فقط في إجراء تحليل أكثر ملاءمة للرقاقة صنع القرار . هذا في بيان رسمي جوجل كان قد أكد أيضا: TPU فقط كعامل مساعد لاستخدامها في جهاز معين تطبيقات التعلم، وستقوم الشركة الاستمرار في استخدام وحدة المعالجة المركزية وجعل GPU من قبل الشركات المصنعة الأخرى.

وتجدر الإشارة إلى، هو المنطق رقاقة TPU، وليس المقصود من TPU ليحل محل ظهور جديد تشى يوان GPU-- في مقابلة مع الرئيس التنفيذي لشركة نفيديا جين هسون هوانغ ذكر أيضا هذا. TPU لا يزال يتطلب مزيجا من GPU وحدة المعالجة المركزية استخدامها جنبا إلى جنب، في بداية هذه المقالة يفسر أيضا، لتدريب نموذج الشبكة العصبية، لا يمكن الاستغناء GPU وحدة المعالجة المركزية. لمصنعي وحدة المعالجة المركزية، فإن التحدي الحقيقي هو توفير أخذ في الحسبان استهلاك الطاقة وكفاءة فرضية، المنطق مع شريحة عالية الأداء.

27 مارس، عقد تشي يوان جديدة مفتوحة المصدر البيئية القمة وفاز جي AI التكنولوجيا حفل 2017 جوائز مسابقة أفضل خطة عمل جديدة، بما في ذلك "BAT" التيار منظمة العفو الدولية، بما في ذلك الشركات الصينية، تجمع أكثر من 600 النخبة الصناعة معا من أجل الصين 2017 تنمية الذكاء الاصطناعي رسمت أثرا لا يمحى.

انقر لقراءة النص الأصلي، واستعراض الجمعية العامة إصدار نص سجل

هذه الجزيرة هي أكثر رائعة من جزر المالديف، بي Palao مثل السماء، ولكن فقط شو تشونغهوا الذين دخلوا!

النظام السياسي والقانوني رقم ثمانية عشر بعد أول تضحية العامة!

والد "مقالات" العالم فاز الشبكة جائزة تورينج، لإحياء تاريخ الذكاء الاصطناعي يضيء الماجستير عشرة تنزه

متجر العد متى سيارة الأسهم، في النهاية لا يمكنك شراء؟ ويمكن اعتبار أن نفهم كليا

كتب مليون كلمة الملاحظات، "الثورة الذكية"، والتفكير لي AI ربما الحصول على العموم

الكندي "مابل" جميلة بعد جنون! أقول لكم مع خريطة

لصوص متنكرين في زي مالك للشرطة ترسل لافتة، كانت المركبات المسروقة تلقي على الفور لنرى من خلال

بعد ثلاث دول يتسارع أو إلى الدولرة، يرفض بلد للاستثمار بالدولار، على مقربة من الرنمينبي

يمكن السفر بالسيارة تكون المسرحية الأصلية إلى هذا الحد؟ 2019 نماذج الهروب معكم في كل فريق متعة السفر

زلة الركوع هنري خلق الفن، وبطبيعة الحال، المقلدين آسف جدا غالبا ما انقلبت!

علي، رئيس أركان تسنغ مينغ: بعدين الرئيسية S2b2c

إيلون ماسك (ايلون موسك) BCI فريق السرية