أصبحت GPU عالية الطاقة لينة بطن من أكبر أزمة؟ سوف GPU العقد هيمنة كانت "تطويق"

( "معهد ماساتشوستس للتكنولوجيا تقنية مراجعة" في إصدار اللغة الإنجليزية من APP هو الآن على الخط، المستخدم الاشتراك السنوي الإنجليزية تكنولوجيا الفصول الدراسية الحية أسبوعيا والعلوم والتكنولوجيا وكذلك المجتمعات تعلم اللغة الإنجليزية يا ~)

مع تقدم التكنولوجيا والتغيير من منظمة العفو الدولية، والاستفادة من عدد من شركات التكنولوجيا الجديدة الارتفاع، أكثر تمثيلا في الخارج، بما في ذلك Graphcore، موجة الحاسبات وغيرها، ولكن أيضا تم العثور على بلد في الأفق، مثل الروبوت والعلوم والتكنولوجيا الكمبري والعلوم والتكنولوجيا عميقة كام الشركات الناشئة. رقائق الذكاء الاصطناعي الرئيسية والشركات المبتدئة الحلول ذات الصلة هي أيضا في مجال AI لعمالقة الحوسبة التقليدية مثل تحديا NVIDIA، نريد شريحة من السوق.

لكن شركات تصميم IC تريد GPU التحدي، سيتم تنفيذها من عدة الاتجاه العام لكفاءة الطاقة، وحجم وهلم جرا يمكن تطبيقها على المشهد، ولكن الواقع لا يزال تحديا، ويرجع ذلك إلى GPU الرائدة الحالي الحوسبة AI، حتى تبدأ. أولا، والهندسة المعمارية GPU، وإن لم يكن مثاليا تماما، ولكن في ظل التحسن المستمر من NVIDIA، مشهد التي يمكن استخدامها في تزايد أيضا، والمصنعين وحدة المعالجة المركزية التقليدية، مثل إنتل، الذي استقال أيضا تعزيز بنية CPU المقدمة بعد القوات المشتركة من FPGA، تريد المضاد AI صناعة الحوسبة.

GPU NVIDIA الشكل شو في الحوسبة الحلول لا تزال هي السائدة الحوسبة AI، ولكن التحدي هو أكثر كثافة

لتحدي هذه الشركات العملاقة، ونحن يجب أن يكون المستهدفة للغاية على البنية التحتية، ويمكن تحقيق المزيد من القيمة للعملاء، أو البدء في تمييزها عن إنشاء خوارزميات البرمجيات أو بيئة التطوير، إذا كنت مجرد الذهاب إزاء عدم وجود الدعم البيئي، فإنه من الصعب البقاء على قيد الحياة لفترة طويلة.

منظمة العفو الدولية حاليا GPU شعبية بنية الحوسبة، ولكن تحتاج هذه الصناعة المزيد من الحلول الموفرة للطاقة

منذ كبيرة تظهر في السوق، لم يؤد فقط إلى تطوير الحوسبة والهندسة المعمارية وموارد الحوسبة والتطبيقات وحتى البرنامج من أجل الاستفادة من هذه القدرة الحاسوبية وتطور ملحوظ. الصناعة في استخدام البرنامج، سوف تحفز متطلبات الأجهزة الجديدة على التصميم. ومنذ واحد من الخادم الرئيسي تطبيق التعلم الآلي، والحوسبة بنية الأجهزة المرتبطة ديها تغيرات كبيرة خضعوا، على سبيل المثال، في الماضي بنية الخادم سحابة هي دائما العمارة وحدة المعالجة المركزية، وخاصة إنتل X86 وحدة المعالجة المركزية، بحكم المزايا البيئية والتكلفة، قد فاز بأكثر من تسعين في المئة من السوق الخادم.

ومع ذلك، في مواجهة آلة التعلم، والهندسة المعمارية وحدة المعالجة المركزية نفسها أوجه القصور في قوة المعالجة المتوازية الباطل بالإضافة إلى حجم الأساسية هي كبيرة جدا، وعدد من النوى صغير جدا، في حدود النطاق الترددي تلعب لأداء الحوسبة بشكل عام. وعلى الرغم من نواة كبيرة ويمكن أن يتم ذلك بسرعة مع خيط واحد من العمل المعقد، ولكن على وجه كمية صغيرة من التنوع، وحساب المحتوى آلة الحوسبة بسيطة نسبيا الوضع التعلم، وتصميم خط أنابيب وحدة المعالجة المركزية نفسها لن تكون قادرة على التعامل بسرعة مع هذا النوع من العمل ذات الحجم الكبير، والنتيجة هي رد الفعل زيادة الاستهلاك وانخفاض كفاءة الحسابية.

الشكل شو وحدة المعالجة المركزية والخصائص الأساسية GPU تحدد كفاءة الحسابية الطلبات الفردية.

وGPU انها أصبحت رئيسية حسابات منظمة العفو الدولية المعاصرة، هو أن لديها آلاف الأساسية الصغير، على الرغم من أن أقل بكثير من حجم نواة وحدة المعالجة المركزية، ويمكن القيام بذلك إلا حسابية بسيطة نسبيا، فإنها لا يمكن بدء تشغيل نظام التشغيل مباشرة. انها بسيطة ولكن تم معالجة أكبر سلاحها، وهذه مجموعة أساسية كبيرة في ومضة يمكن مزامنة آلاف إلى عشرات الآلاف من بسيطة المواضيع عامل حساب، ولها نهاية المباشرة ذاكرة GPU رقاقة المحلية الضخمة، وعرض النطاق الترددي، ولكن أيضا أكبر بكثير من وحدة المعالجة المركزية .

وبالإضافة إلى ذلك، فإن هذه الشركات مثل NVIDIA GPU لCUDA مع البيئة ولكن أيضا يقلل بدرجة كبيرة من التعقيد التنمية المرتبطة برنامج حساب منظمة العفو الدولية، لذلك تقوم التطبيقات GPU على قدم وساق في مجال AI، AI لعرض سحابة الحوسبة الرئيسية أبنية على أساس GPU- .

ولكن GPU لا يخلو من عيوب، لا سيما في استهلاك الطاقة، وGPU الحوسبة بطاقة في كل منعطف مئات واط من الطاقة، وإذا كان على نطاق واسع، ثم السيطرة على السلطة من مركز الحوسبة بأكمله سيكون مزعجا بشكل خاص . على سبيل المثال، جامعة كارنيجي ميلون (جامعة كارنيجي ميلون) على الرغم من أنها هي إحدى الشركات الرائدة مؤسسات بحوث الذكاء الاصطناعي، ولكن حتى لا بد أنها تتطلب الباحثين لاختصار الوقت للرقاقة، وهذا سيعطي النظام المدرسي مع السلطة لضغوط شديدة. وقال أستاذ جامعة كارنيجي ميلون فرانز Franchetti أن الجامعة تبحث عن مصادر بديلة للطاقة للتخفيف من حدة هذه المشكلة.

الشكل شو GPU الحوسبة بطاقة استهلاك الطاقة بشكل كبير مع زيادة الحجم والشركات ذات الصلة لإدارة الطاقة يشكل عبئا كبيرا.

خصوصا بعد أن أطلقت جوجل العمارة TPU، استهلاكها للطاقة ممتاز أكثر من أن يدفع استهلاك الطاقة GPU إلى المرحلة.

في مجالات التطبيق الفردية، مثل الطيار الآلي، محرك PX والأداء كزافييه NVIDIA، وعلى الرغم من قوتها، ولكن استهلاك الطاقة الكلي سوف يسبب بعض الضغوط على نظام الطاقة في السيارة، وبالإضافة إلى السيارات الكهربائية والسيارات البنزين تحت الحالة العادية فقط من أجل تعزيز وظائف جهاز زيادة إنتاج الطاقة الكهربائية عند بدء تشغيل المحرك، مثل تكييف الهواء، وإذا مركز التحكم الطيار الآلي يجب أن تستهلك مئات واط من الطاقة، وعلى الرغم من الناحية النظرية يمكن إيقاف تشغيل أكثر من وظائف الحوسبة لالطيار الآلي لتوفير الطاقة عند الخمول، ولكن للمركبات الوقود التقليدية البطارية سوف يسبب ضغطا كبيرا.

الشكل شو مركز التحكم الطيار الآلي يجب أن تكون موحدة بيانات ضخمة من أجل تحديد بيئة القيادة وقررت قيادة الاستراتيجية.

ومع ذلك، والمركبات حتى الكهربائية، وإذا في حاجة إلى أجزاء غير الحركية تستهلك الكثير من الطاقة، أن لالأميال سيكون لديك أيضا بعض الانخفاض في القيمة. وإذا تم تشغيل الطيار الآلي على، والسيطرة على جوهر من أجل حساب البيئة الخارجية، فهم التغييرات، والحفاظ على رد فعل لظروف القيادة، من الناحية النظرية، على أن يتم دون انقطاع، والقدرة الكاملة، ليس هناك الكثير من الفرص مثل الهاتف المحمول أو منصة لوحي سيكون لديهم الفرصة للدخول إلى وضع بقية يمكن أن تقلل من استهلاك الطاقة.

المرونة والكفاءة في استهلاك الطاقة من الصعب التعايش؟

GPU، على الرغم من أن درجة معينة من قدرات التكوين البرنامجية، يمكن تكييفها لمعظم بيئة الحوسبة، ولكن معظم الحوسبة AI أصبح المستهدفة للغاية، وخاصة في العديد من التطبيقات الرئيسية، مثل استخدام التعرف البصري من CNN (التلافيف العصبية الشبكة) والطبيعي معالجة اللغة المشتركة RNN (الشبكات العصبية المتكررة)، وعادة ثابتة في نموذج الحساب المستخدمة في عدة طرق، وبعبارة أخرى، إذا كان جزء من حساب المرونة، وهذه الأنماط الشائعة في شكل ASIC لتسريع، ولكن في المقابل لكفاءة الطاقة يمكن تحسنت كثيرا، في الواقع، فإن غالبية قبول العملاء ليست منخفضة.

وبالإضافة إلى ذلك، ومحطة لديها أصبحت قوة الحوسبة AI تدريجيا الاتجاه، مثل الأساسية لمنظمة العفو الدولية على الهاتف، أو مكبرات الصوت الذكية في ويمكن أيضا أن يتم تكوين AI وحدة حساب المستقبل، والذي هو جزء من الهندسة المعمارية GPU قد لا مساعدة، لا سيما السلطة مشكلة، خصوصا في GPU الحالي على منصة متحركة وقوة وحدة المعالجة المركزية هي مماثلة تقريبا، أو حتى أسوأ من ذلك، وعادة ما تكون مسؤولة أيضا عن استخدام واجهة GPU تقديم، أن يتلهى، فمن الممكن لحساب منظمة العفو الدولية نظام تأخير القضية، لذلك سوف تكون جزءا لا يتجزأ هذا جزء من اتجاه وحدة الحوسبة مخصصة الذهاب ASIC ل.

لمواجهة تحديات FPGA وأسيك

كما أشرت إليه أعلاه، وGPU لرسم ولدت في الماضي، ولكن لأنها مصممة لحساب متجه رسم وحدة قد نقل على الفور للقيام بذلك، ولأن لديها القدرة الهائلة المعالجة المتوازية، وبالتالي لحساب GPGPU تحقيق ولد، و في وقت لاحق، أدى التطور الصناعي AI.

وسائل لحساب GPU نفسها تشغيل AI ربما تشكل نحو 40 من مساحة الشريحة، من أجل الحفاظ على قدرات المرونة والرسومات الموجودة، أكثر من الترانزستور إلى مقبض ولا حساب منظمة العفو الدولية، بالإضافة إلى وصلات أسيك اللازمة الخارجية وجزء الرقابة الداخلية من الترانزستورات المتبقية يمكن استخدامه بالكامل في حساب، وبالتالي فإن انخفاض في كفاءة الطاقة الكلية وجاء أيضا عنه.

ولكن التخطيط لGPU البيئي الرئيسي حاليا في السحب، سوى عدد قليل من عينة التطبيق محطة الوجود، على سبيل المثال، أطلقت NVIDIA مجال للطيار ومنصة كزافييه محرك PX. وعموما، على الرغم من أن أداء رائعا للغاية، ولكن استهلاك الطاقة لا تزال مرتفعة، ويجب استخدام طريقة التبريد الفعال، وإلا فإنه من الصعب التكيف مع البيئة القاسية السيارات.

الشكل شو NVIDIA محرك PX وكزافييه

في المقابل، تتضمن Mobileye، رينيساس، NXP وغيرهم من الخصوم دائما تقريبا باستخدام الملكية العمارة تسارع ASIC الطريق للصورة أو كائن الاعتراف، Mobileye أداس في السوق استحوذ على حصة في السوق ما يقرب من 70، وكان أول من وضع مزودي الحلول الطيار الآلي واحدة من EyeQ4 أحدث برنامج الطيار الآلي لها يمكن أن توفر 2.5TOPS الأداء في قيود الطاقة 3W، ويقوم على أساس عملية 28nm، وعلى النقيض، NVIDIA أحدث كزافييه حين توفير ما يصل إلى 20TFOPS الأداء في عملية 16nm الأداء، ولكن استهلاك الطاقة من 80W. وسيكون الجيل القادم أداء البرنامج الطيار الآلي Mobileye سيرتفع إلى 17TOPS، ولكن فقط لزيادة الطاقة 5W، وهي بنية غير أسيك من NVIDIA الصعب تحقيقه.

على الرغم من أن تصميم أسيك والإنتاج والإدارة وتنمية البيئة، لديك لقضاء الكثير من التكاليف، مما يجعل تكلفة شريحة واحدة من المرجح أن تكون أعلى في الكثير من GPU، ولكن إذا كنت تأخذ في الاعتبار القدرة على تحقيق وفورات كفاءة استخدام الطاقة وزيادة الكفاءة عموما فإنه يمكن أن يحقق الحفاظ على / التقليل من تكاليف التشغيل، في الواقع، على المدى الطويل يبدو مثل هذا الاستثمار المجدي.

كما بدأت FPGA للحاق بما في ذلك إنتل وXILINX أطلقت برامج AI بيئة الحوسبة. مع Stratix إنتل 10 على سبيل المثال، وأداء الحسابية تصل إلى 10TFLOPS، واستهلاك الطاقة من 120W فقط، مع تسلا V100 NVIDIA على سبيل المثال، على الرغم من أعلى قليلا أداء 14TFLOPS Stratix10، ولكن استهلاك الطاقة يصل إلى 300W. إنتل على وشك طرد الجيل القادم من الحوسبة بطاقة AI فرسان الهبوط وبحيرة كريست الهندسة المعمارية الحوسبة، ومن المتوقع أن تكون قادرة على النمو المتسارع في الأداء واستهلاك الطاقة للحفاظ على التناسق.

يتطلب أكثر كفاءة بنية الحوسبة GPU التخلي تدريجيا

في الوقت الحاضر، أكثر وأكثر شعبية محطة AI الاتجاه الحوسبة، أصبحت GPU ضعيفة على نحو متزايد، البرامج الأساسية الرئيسية، مثل أبل A11، هواوي كيرين 970، وحتى مستقبل AI ميديا تيك المحمول تخطيط شريحة الهاتف، وسوف تذهب وحدة حسابية حصرية ، المدمج في AI وحدة الحوسبة مستقل في الرقاقة، مثل هذه الحسابات وحدة سيحل محل معظم الحسابات AI الماضية تتطلب GPU GPGPU الحوسبة القدرات والقدرة على دعم أكدت OpenCL.

FIG شو هواوي ماتي 10 تتكامل مع اي فون X AI وحدة حساب شريحة منفصلة.

ولكن مثل إنتل مجتمعة أيضا مع قوة FPGA، وحدة المعالجة المركزية نفسها مع تحسين اللياقة البدنية وزيادة مجموعة التعليمات، في محاولة لإرضاء NVIDIA سحابة، والتركيز، ولكن أيضا في كفاءة استخدام الطاقة. ومثل الصين الكمبري الأفق، وعرض العميق، وإدخال نظام أيضا لكفاءة الطاقة العالية، يمكن القول العمارة GPU أن تكون محاطة من قبل العدو.

أدناه يمكننا أن تهدد GPU لمجموعة متنوعة من تحليل بسيط في عدة العمارة القادمة لديه القدرة على السيطرة AI.

1. Graphcore الاتحاد البرلماني الدولي

Graphcore التفكير، وحسابات منظمة العفو الدولية إلى أن تقسم إلى التدريب والمنطق نفسه لا تصنف بشكل صحيح الاتجاه، من المفترض أن تكون قادرة على التعامل مع عمل كل من الطبيعي AI أبنية الحوسبة ولاستدامة مستقبل التعلم (التعلم المستمر) آلية، يجب أن يكون مستقبل AI مثالية لدراسة تطور يمكن أن يستمر بعد نشر نموذج.

شو الرسم البياني للاتحاد البرلماني الدولي نموذج Graphcore، لا توجد أي إشارة من جانب تدريب إضافي، ولكن محرك الاستدلال واحد.

الاتحاد البرلماني الدولي هو رقاقة القياسية معالجة الشبكة العصبية، وعلى نطاق واسع، عادة لديهم الآلاف إلى الملايين من القمم وبالإضافة إلى الشبكة العصبية القياسية، ينطبق أيضا على شبكات النظرية الافتراضية (المعروف أيضا باسم موثوقية الشبكة، والشبكة السببية، فإنه يشير إلى تحليل احتمالي على أساس نموذج، ونظرية الرسم البياني، تمثيل المعرفة والمنطق غير مؤكد) و شبكة ماركوف (شبكة ماركوف شبكة النظرية الافتراضية المستخدمة للإشارة إلى تبعيات مماثلة، إلا أنها قد تمثل بعض جوانب لا يمكن أن يمثله شبكة النظرية الافتراضية، مثل تبعيات دائرية التبعيات، ومن ناحية أخرى، فإنه لا يمكن أن يمثله شبكة النظرية الافتراضية يمكن أن تكون بعض العلاقات الممثلة، مثل اشتقاق العلاقة)، ولكن لأن العمارة لتوفير مرونة النموذج الجديد المستقبل وخوارزمية يمكن دعم مثالي من الناحية النظرية.

قارن تخطيط شريحة مخطط شو الاتحاد البرلماني الدولي وغيرها من البنى الحوسبة.

بسبب العدد الكبير من القمم، وهناك عدة مئات من المرات حجم أكبر GPU أكثر بكثير من المظهر، وهذا يعني أيضا أنها مزعجة جدا المحتملة في العلاج يعمل بالتوازي . وعلاوة على ذلك، فإن هذه القمم هي متفرق، ويقترن الغالبية العظمى من قمة سوى جزء صغير من القمم الأخرى. وبالإضافة إلى ذلك، الاتحاد البرلماني الدولي أيضا لانخفاض الدقة الأمثل نموذج البيانات، وهذا هو، مع تقريب مفهوم البيانات الإحصائية، وهذا المفهوم هو مختلف تماما عن الحاسوب العملاق الماضي. وبالإضافة إلى ذلك، كما يدعم الاتحاد البرلماني الدولي إعادة استخدام المعلمات النموذج. بعبارات بسيطة، والالتواء هو مضاعفة المكاني، كانت عودته-المضاعفة وقتا طويلا. هذه الخصائص يمكن الحصول على البيانات المضاعفة في المكان أو الزمان ثبات، سوف يكون الأداء بشكل ملحوظ المنطق التدريب والمساعدة.

الاتحاد البرلماني الدولي أيضا على مخبأ كبير على الرقاقة، وعلى رقاقة ذاكرة متصلة بواسطة HBM، وهو خادم العمارة التقليدية لتصل إلى وحدة المعالجة المركزية أو GPU، وعادة ما تكون مصممة للوصول إلى الحافلة وافر من طبقات، طبقة بعد نقل طبقة إلى أسفل، سيتم نقل عملية توليد تأخير كبير، وطبقات مختلفة من الذاكرة يتطلب أيضا وحدة تحكم منفصلة، وإمدادات الطاقة، وكفاءة الطاقة الكلية تكون فقيرة.

الشكل شو الاتحاد البرلماني الدولي مخطط العمارة

ولكن إذا كان معظم العمل يمكن أن يكون على رقاقة، رقاقة على معالجتها حتى، فإنه يمكن أن تقلل إلى حد كبير الكمون. الاتحاد البرلماني الدولي نظرية تصميم وضعت في نهاية المطاف جميع النماذج في الذاكرة على الرقاقة، وعدد كبير من ذاكرة متكاملة في الشريحة، لتحقيق تم تعديل تصميم الذاكرة مركزية وعلى نطاق ولتطبيق وحدات الحوسبة، واستهلاك الطاقة وتحسين في نهاية المطاف.

وبالإضافة إلى ذلك، الاتحاد البرلماني الدولي أيضا لكثير من نقل البيانات والحوسبة الأمثل، مثل الحوسبة والاتصالات باستخدام معالجة المسلسل، من الناحية النظرية، يتيح العمل المختلفة ويمكن الاستفادة من الحد الأقصى للطاقة بغض النظر عن موازنة عبء العمل الفعلي، ويمكن حساب العمل الانتهاء في أقرب وقت ممكن.

يتوقع الاتحاد البرلماني الدولي تحت معيار استهلاك الطاقة 300W، وسوف توفر أكثر بكثير من أحدث الأداء V100 NVIDIA.

Graphcore على تصميم الاتحاد البرلماني الدولي مع الكثير من فكرة متطرفة نوعا ما، وعلى الرغم من الناحية النظرية حجمها ينبغي أن تكون أكثر مناسبة للسحابة، ولكن أعتقد Graphcore الاتحاد البرلماني الدولي العمارة ديها قابلية جيدة، حافة أو يمكن أن تحسب محطة في نفس خير العمل. ومن المتوقع أن تكون متاحة في أوائل 2018 إنتاج Graphcore الاتحاد البرلماني الدولي .

2. الموجة الحاسبات كفاءة الطاقة رفع ما وراء العمارة FPGA GPU

موجة الحاسبات هي شركة تأسست في عام 2010. كانت تعرف سابقا باسم الموجة أشباه الموصلات، بدلا موجة الحاسبات في عام 2016. موجة من التوجه الاستراتيجي من شركة أشباه الموصلات الأولى لتوفير حل رقاقة، إلى شركة التي توفر الحوسبة الحلول التقنية. هذه الشركة ليس فقط تريد ويمكن الآن أن تقوم أنظمتها على تدريب أداء الشبكة GPU العصبي بنسبة 10 مرات، ولكن أيضا لتتجاوز FPGA في كفاءة استخدام الطاقة.

وضعت موجة رقاقة اسمه DPU (تدفق البيانات المعالج). في نظام حساب أربعة مجلس مسرع الأجهزة DPU، كل DPU DPU على متن أربع رقائق البطاطس. يمكن أن تستخدم موجة يسمى مخطط تسارع مباشرة في بنية الخادم لمركز البيانات الموجودة.

الشكل شو موجة من DPU الحوسبة حل العمارة الرسم

نفذت DPU باستخدام المنطق غير متزامن حساب الأساسي حدة PE. لا تتكامل إشارة على مدار الساعة، PE تلقيت للتو عملية البيانات، مما أثار المحسوبة، والنتائج التي حصل عليها. متكاملة DPU ضمن 16000 PE. ويمكن علاج كل PE كما معالج مستقل، والذاكرة التعليمات الخاصة بها، ذاكرة البيانات والسجلات، وحدة المعالجة، مخبأ تعليمات خط الأنابيب قد تصدر تعليمات جديدة كل 0.1ns، PE قد تصل إلى الذروة يتوافق تردد إلى 10GHz. كل PE ديه 1KB منفذ واحد ذاكرة البيانات سرعة الوصول يمكن أن تصل إلى 5GHz. ومن الجدير بالذكر أن هناك 16000 PE في DPU، وهذا هو القول، كل DPU ديه 8MB من إرم (الذاكرة تعليمات) و16MB من DRAM (دينامية RAM)، وعلى نطاق ومخيف جدا.

FIG شو في DPU، كل أربع PE تتكون من رباعية مرتبطة ارتباطا كاملا، رباعية 4 تتكون من كتلة. كل PE تشترك في 8 بت الأفعى اثنين. أنه يحتوي على ثمانية وحدة حسابية (بما في ذلك اثنين من 32 بت MAC، 2 تشرين BMU 32 بت وأربعة وحدة الأفعى 16-بت) في كل مجموعة، لتكوين 8/16/24/32 / 64BIT عمليات كلما تطلب الأمر ذلك. ودعم لSIMD وميمد التعليمات.

DPU لأنه لا يوجد شجرة التوزيع على مدار الساعة، منطقة رقاقة يمكن أن تقلص إلى حد كبير، والحوسبة وحدة العمل إلا عند الضرورة، واستهلاك الطاقة ويمكن أيضا أن يخفض إلى حد كبير. على سبيل المثال، حجم كل الأساسية PE حتى أفضل من ARM اللحاء-M أصغر، DPU بنيت أيضا واحدة من تايوان الأنديز التكنولوجيا (الأنديز) 32-بت وحدة المعالجة المركزية الأساسية.

ووفقا لبيانات الاختبار الكشف عنها، WAVE وقت التدريب DPU AlexNet يمكن خفضها الى 12 دقيقة، مقارنة مع NVIDIA GPU (باسكال) 120 دقيقة. وبالإضافة إلى ذلك، الموجة يمكن تسريع البيانات التدريب لعرض شبكة التأسيس تصل إلى 25 مرات.

3. إنتل وحدة المعالجة المركزية + FPGA مع الحق في الكلام إلى أن تكون محسوبة إعادة AI

وعلى الرغم من إنتل منذ 50 عاما يمكن أن يسمى في الشركات المبتدئة، ولكن الحوسبة AI، وإنتل يعتبر في الواقع منافسه.

إنتل الحوسبة لتحسين القدرة التنافسية للبطريقتها ريال مدريد من الطراز القديم جدا، ولكنها فعالة جدا. على سبيل المثال، لتعليمات من وحدة المعالجة المركزية التي وضعت تحسينات عليها، بما في ذلك زيادة في عرض الوسائط المتعددة AVX مجموعة التعليمات، وذلك لاستيعاب تدفق بيانات أكبر، ثانيا، هو زيادة مجموعة QFMA QVNNI والتعليم، وعمق يمكن تسريع كفاءة التعلم وهذا هو لأحدث جيل من المنتجات العمارة زيون فاي فرسان الهبوط بها. فرسان الهبوط 72 اتوم الأساسية المتكاملة، كل الأساسية يمكن تنفيذ أربعة المواضيع، وثلاث مجموعات من خلال AVX، QFMA والتعليم QVNNI والاستخدام، ويمكن تحقيق مواز الحوسبة والعمل GPU حجم مماثل، كفاءة توليد 4-8 مرات.

الشكل شو فرسان الهبوط الهندسة المعمارية، من الجيل السابق النمو عالية جدا من الكفاءة.

حصلت شركة إنتل في عام 2015، واحدة من أكثر FPGA قوية ألتيرا شركة تصميم، مع مستقبل تخطيط FPGA، يمكن أن توفر حلولا مختلفة للحوسبة ذات الأغراض العامة والتعلم الحوسبة البيئة العميقة ، على سبيل المثال، عروضها العمارة كريست مع النهج المعماري مماثل الاتحاد البرلماني الدولي وGraphcore، الذي يجمع بين عناصر الحوسبة ضخمة، ويضيف كميات كبيرة من ذاكرة التخزين المؤقت على رقاقة والذاكرة على الرقاقة.

وبالإضافة إلى ذلك، وإنتل يجلب أيضا لشركة إنتل من خلال الحصول على Nervana قدرات أكثر تنوعا دعم بيئة، وتقديم الدعم لمجموعة متنوعة من مختلف الأساسية بنية الحوسبة AI بواسطة Nervana، يمكن للعملاء استخدام GPGPU، زيون فاي وFPGA الوقت نفسه، ومع ذلك، ما دام من خلال Nervana، يمكن لهذه الحسابات تكون القدرة سلس لتحقيق أداء أعلى، أو وضع التطبيق أكثر تنوعا .

الشكل شو جنبا إلى جنب Nervana وFPGA، وإنتل يريد أن يحقق اليوم مرات AI حساب الأداء في عام 2020.

عموما، وإنتل لديها ثروة من الموارد المعمارية، وبالتالي أراد أن إنشاء منصة مختلفة لتطبيقات الحوسبة المختلفة، وNervana، يمكن أن تكون إنتل بيئة تطوير موحدة بين هذه أبنية مختلفة، وبناء نظام بيئي قوي.

4. الكمبري، عميقة كام

الكمبري هو واحد من أبنية الحوسبة أبرزها مؤخرا AI الصينية، وأكثر من ذلك مؤخرا للضغط على الحكومة لاستثمار ما يصل إلى 100 مليون $ في العصبية بنية رقاقة شبكة التعلم العميق ليس فقط بشكل جيد جدا على الأداء الفاعل في استهلاك الطاقة، وأكبر ميزة هو أنه يدعم تقريبا جميع المنابر وجميع AI مستوى الحوسبة، ويمكن مقارنة ومنصة عالمية المستوى على مدى اتساع نطاق التطبيقات.

لم يقم رقاقة أسيك الكمبري واستندت هندسة الشبكات العصبية القدرة على إعادة تعريف، ولكن عمق التركيز على الحوسبة دراسة الأداء.

العروض الكمبري كل من صناعة أكثر فريدة من نوعها ترخيص الملكية الفكرية ورقاقة نموذج المبيعات التجارية، يمكن للعملاء وفقا لاحتياجاتها وحجمها، واختيار موضوع البرنامج، أو استخدام الترخيص IP، الكمبري تفعل رقائق الخاصة كما كيرين 970 هواوي، قال هواوي من خلال NPU الكمبري، والذي يحسب AI GPU أداء الحوسبة من 6 مرات أسرع.

وسيتم نشر الرقم شو الكمبري رقاقة 1A المكشوف في مواصفاتها.

التكنولوجيا عمق كام هي الصينية الساخنة AI حلول الحوسبة بائع آخر، أكبر ميزة ولكن ليس في تصميم رقاقة، ولكن خوارزمية قبل العميق حصرية خوارزمية ضغط، ونحن يمكن أن تقلل بشكل كبير من حجم النموذج بعد التدريب، بحيث الميزانية مساحة التخزين المحدودة للأنظمة المدمجة يمكن الاستمتاع أيضا تطبيقات AI.

DNNDK الرسم العميق شو كام المقترحة يمكن أن تقلص إلى حد كبير عندما AI عملية تطوير التطبيقات.

ضغط ليس فقط يجلب مزايا هذا النموذج هو للحد من مساحة التخزين فقط، اذا كان النموذج يمكن أن يكون ضغط مباشرة عدة مرات، مما يقلل من عدد من الأوزان ثلاث مرات، فهذا يعني أنك يمكن أن تقلل من الحمل عرض النطاق الترددي لواحدة من عدة أعشار، في حين أن لتحسين أداء 3 مرات. لتعزيز مزايا الخوارزمية برنامج، صناعة كام عميقة يمكن أن يقال لبذل المزيد من الخير.

تواجه GPU مع التغيير، وربما سوف التخلص تماما من جزء من المؤامرة؟

كما ألمح إليها أعلاه، GPU الحوسبة جلبت حقا الترانزستور ولكن تمثل نحو 4 في المئة من جميع الترانزستورات، على الرغم من الاعتماد على مقياس النصر، لا يزال هناك واحد من أفضل كفاءة الحوسبة، ولكن لمواجهة تحديات المستقبل من الهيكل الجديد لمختلف الاستخدامات ASIC أو FPGA، في الواقع، كما بدأت بعض الشيء تمدد.

في بدء الهندسة المعمارية NVIDIA تسلا V100 استنادا فولتا في AI بيئة الحوسبة لزيادة TensorCore هذه الوحدة تسارع ناقلات إضافية، وتستخدم لحساب تسارع خاص نموذج الشبكة العصبية، حيث يمكن مقارنة حتى قوة الحوسبة الكاملة والجيل الثاني من TPU. ومع ذلك، مقارنة قوة اثنين فقط، تسلا V100 استهلاك الطاقة 300W، TPU الجيل الثاني، على الرغم من أبطأ، ولكن يستهلك فقط 130W، وانخفاض كبير في كفاءة الطاقة، وربما تنظر في الحد من NVIDIA شيء، ولكن ليس دائما وضع أكثر تراكب القدرة الحاسوبية يصل.

أما بالنسبة لخفض شيء، وربما لأول مرة أن يكون الخفض هو تجهيز الطاقة من الجزء الرسم التقليدي، بعد كل شيء، فقد كان تصميم GPU NVIDIA والرسومات قدرات حدات للغاية محفوظة لGPU المستهلك في السوق.

الوضع الحالي هو أن مفاهيم معمارية جديدة للحوسبة AI مستمرة في الظهور، ولكن في وقت قصير CUDA الإيكولوجية يزال من الصعب التخلص منها. بالإضافة إلى العديد من حلول الحوسبة بائع ذكر في وقت سابق، أسطوري مؤخرا وCerebras أيضا البنية التحتية الحاسوبية بدء الشركات AI مشهورة جدا، الذي فاز أيضا لصالح المستثمرين.

ولكن من الجدير بالذكر أن هذه الشركات تعتمد على العمارة كلها جديدة وأكثر الحوسبة على خطوات لتعزيز أداء الحوسبة، GPU أو رخصة طريقة وون كثيرا في هذه المرحلة لا يمكن حذف الخطوات الحساب، ولكن الأول هو الغالب لتطبيقات محددة بعد من هو التركيز على التنوع. لكن الشركات الناشئة هي أيضا عرضة للخطر، إذا كانت المنتجات الجديدة للعديد من التطبيقات السوق، قد تضحي الأداء أو التركيز الأصلي على المرونة، بهذه الطريقة، وأنا أخشى أنك لا يمكن محاربة ورائدة في هذه الصناعة الحالية، قد يكون في نهاية المطاف لوجه يجري الحصول عليها، أو حتى قريبة أسفل القدر.

وبالإضافة إلى ذلك، فإن الهيكل الجديد من استهلاك الطاقة والموردين قد يكون لها بعض مزايا الأداء، ولكن نعول على CUDA GPU الحوسبة بيئة التطوير تم تطويرها على مدى 10 عاما من صلب الإيكولوجية، ولدت في جميع أنحاء هذه التطبيقات ذات الصلة بيئة كانت عديدة عدد، وكيفية تبرز من أجل إقامة خاصة بهم الإيكولوجية وسهلة، ولكن لحسن الحظ هناك بالفعل TensorFlow، كافيه، MXNet والصناعات الأخرى واجهات القياسية يبدو، ببساطة اتبع معايير لتطوير المنتجات وتقديم الأداء الجيد الطاقة بما فيه الكفاية، إلى الاستيلاء على من أيدي من حصة السوق NVIDIA، هو لم يكن مستحيلا.

NVIDIA في AI البيئة تهيمن على ما يقرب من 10 عاما، وخلال السنوات ال 10 المقبلة، لا يزال قادرا على لعب دور قيادي؟ المخضرم حزمة الصاعد واللعب، والتي يمكن أن يكون حتى التشويق، ولكن من المؤكد أن، AI الهندسة المعمارية الحوسبة من عصر الممالك المتحاربة حان بالفعل.

واستنادا إلى بيانات كبيرة الأولية ونظام التربية البدنية في المدارس الثانوية والجسدية دفعة تعليم تكنولوجيا المعلومات مع التكنولوجيا الرياضة

الصلب الورود في الكتابة على علم النضال من أجل الشباب - زيارة جيش المرأة التحضير لمشهد النقل العسكري

اليوم كنت الأهتزاز حتى الآن؟ الأهتزاز النسخة الدولية Tiktok الساخنة، وتحميلها أكثر من اعتصامات!

السينما بالوعة قناة عودة فرضه تأثير؟ 2019 سيمثل الأقوى أو كشك السنة الصينية الجديدة

التنينات الشباب، وفريق أتلتيكو الأطفال الذين يعانون من تشوهات خلقية اطلاق النار المشتركة السنة الجديدة التقويم

القضاء على ارسنال 2-1 باريس 4-2 ريال مدريد 1-2 تشيلسي الخروج المبكر - كأس

بواسطة "عفوا، والدي غير قادر على" تحديث حتى الآن؟ لعب المستدر للدموع الأب

ارتفعت شياو 660 طائرة جديدة إلى 3999 يوان، والأصدقاء: السمك ليونغ هو إعطاء لكم الشجاعة؟

أنا أحب هذا الرجل، لأنني أحب الكمأ!

بانتشيهوا تقديرا ل23 مؤسسات القطاع الخاص، 24 أصحاب المشاريع الخاصة

الدخن أول "متجر" ولدت عشرة ملايين المشجعين، ليو تشيانغ الشرق أعرب علنا تهانينا!

"لا يجوز" عام الشبكة 'بعد' استثنائية '، الشعر يدعو لإعادة الإعمار "فاز لو جين" جائزة المساهمة البارزة للشاعر الصيني المعاصر ".