الماضي والحاضر في تطوير شرائح الذكاء الاصطناعي

المؤلف | رن يوان ، بان جون ، ليو جينغ جينغ ، هي ياندونغ ، هي جين

المصدر | مجلة "Micro-Nano Electronics and Intelligent Manufacturing"

لقد حسنت المنتجات والأجهزة الإلكترونية الحديثة من جودة حياتنا في العديد من المجالات مثل الاتصالات والترفيه والأمن والرعاية الصحية ، ويرجع ذلك أساسًا إلى أن تطوير تكنولوجيا الإلكترونيات الدقيقة الحديثة قد غيّر بشكل كبير طريقة عمل الناس وتفاعلهم على أساس يومي. على مدى العقود القليلة الماضية ، كان قانون مور يدور حول زيادة قوة الحوسبة من خلال تقليص حجم ميزات الجهاز على الشريحة باستمرار ، مما يؤدي إلى مزايا في الإلكترونيات مثل السرعة العالية والتكلفة المنخفضة وانخفاض استهلاك الطاقة. كانت الملاحظة الأصلية لجوردون مور هي أن عدد الترانزستورات في الشريحة يتضاعف كل عامين تقريبًا ، وتوقع ديفيد هاوس كذلك أن أداء الشريحة سيتضاعف كل 18 شهرًا بسبب ترانزستورات أكثر وأسرع. بينما كانت تنبؤات جوردون مور ناجحة لأكثر من 50 عامًا ، تقترب تقنية CMOS السليكونية الحالية من الحدود المادية الأساسية لحجمها ، وأصبحت استمرارية قانون مور صعبة بشكل متزايد.

هذا يعني أن مكاسب أداء المنتجات والمعدات الإلكترونية لم تعد تعتمد فقط على تقليل حجم ميزات الجهاز. فمن الضروري ابتكار تقنيات جديدة لتكنولوجيا المعلومات أو مبادئ حوسبة جديدة لتلبية الطلب المتزايد على قوة الحوسبة وانخفاض استهلاك الطاقة في التطبيقات . الطلب ، وظهور الذكاء الاصطناعي يوفر إمكانيات لا حصر لها لاختراق هذا القيد. يشير الذكاء الاصطناعي (AI) إلى التكنولوجيا التي تقدم الذكاء البشري بواسطة الآلات التي صنعها البشر ، بينما تشير رقائق الذكاء الاصطناعي إلى رقائق أشباه الموصلات التي يمكنها تشغيل تكنولوجيا الذكاء الاصطناعي والخوارزميات ذات الصلة. ستعرض هذه المقالة التقدم البحثي وتطوير السوق لرقائق الذكاء الاصطناعي.

تطوير رقائق الذكاء الاصطناعي

من المفهوم أن تطوير وتطبيق تكنولوجيا الذكاء الاصطناعي (AI) قد أصبح استراتيجية وطنية في الدول الكبرى في العالم مثل الولايات المتحدة والصين والاتحاد الأوروبي ، وتحتل مكانة متزايدة الأهمية في التطور العلمي والتكنولوجي للبلاد. والمنافسة الصناعية. في الوقت نفسه ، تكتسب تقنيات الذكاء الاصطناعي أرضية في التعرف على الكتابة اليدوية (مثل مجموعة بيانات MNIST) ، والتعرف على الوجوه (مثل Facebook's DeepFace) ، والتعرف على الكلام (مثل Amazon's Alexa ، Apple's Siri ، Microsoft Cortana) ، الروبوتات (مثل نظام تشغيل الروبوت) ، مستقل تُستخدم على نطاق واسع القيادة (مثل Tartan Racing) ، وحتى ألعاب العقل (مثل AlphaGo من Google) وألعاب الفيديو (مثل Pac-mAnt). مع تطور الذكاء الاصطناعي ، ظهرت تقنيات أكثر تخصصًا ، مثل نماذج الشبكة العصبية ، والتعلم الآلي ، وما إلى ذلك ، والتي تعتمد على التعلم التجريبي بدلاً من البرمجة لاتخاذ القرارات. يضع التعلم الآلي ، بدوره ، الأساس للتعلم العميق ، والذي يتضمن وضع خوارزميات لفهم البيانات بشكل أفضل.

منذ الخمسينيات من القرن الماضي ، لم يتوقف الاستكشاف البشري لتكنولوجيا الذكاء الاصطناعي أبدًا. مصطلح "الذكاء الاصطناعي" صاغه العلماء جون مكارثي ، وكلود شانون ، ومارفن مينسكي في مؤتمر دارتموث عام 1956 ، وهذه بداية أبحاث الذكاء الاصطناعي. في عام 1962 ، نشر روزنبلات "مبادئ الديناميكيات العصبية" وآله الحاسبة التناظرية المصممة في عام 1957 ، والتي تعتبر النموذج الأولي للخوارزمية لنموذج الشبكة العصبية العميقة. في عام 1969 ، نشر مينسكي وبابيرت "Perceptron" ، مشيرين إلى أن خوارزمية التعرف على الصور المدربة بواسطة شبكة عصبية أحادية الطبقة لا يمكنها تحديد الأنماط المتماثلة بشكل صحيح.

بالنسبة للشبكة العصبية متعددة الطبقات ، نظرًا لأن حد الحوسبة للخلايا العصبية الاصطناعية كان محدودًا بشدة بسبب قوة الحوسبة غير الكافية للكمبيوتر في ذلك الوقت ، لا يمكن تحقيق الشبكة العصبية متعددة الطبقات من خلال كفاءة الحوسبة الرقيقة للكمبيوتر في ذلك الوقت في وقت لاحق ، مما تسبب في مجال الشبكة العصبية الاصطناعية ، خلال شتاء السبعينيات.

في عام 1982 ، بدأت اليابان خطة بحث مشروع الكمبيوتر من الجيل الخامس ، كما استثمرت الولايات المتحدة أيضًا الكثير من الموارد في البحث والتطوير لأجهزة الكمبيوتر من الجيل الخامس ، لكنها في النهاية لا تزال غير قادرة على حل المشكلات الرئيسية لـ التعرف على الصور والصوت. في عام 1985 ، نشر هينتون وسيجنوفسكي "الشبكات العصبية متعددة الطبقات" استنادًا إلى آلات بولتزمان ، والتي كانت تعتبر في السابق مستحيلة التحقيق. أداة التعرف على الكود في شبكة عصبية متعددة الطبقات باستخدام خوارزمية الانتشار الخلفي. في نفس العام ، نشر Mead نظير VLSI والأنظمة العصبية ، رائدًا في مجال هندسة الأشكال العصبية القائمة على الرقائق الإلكترونية.

في عام 1993 ، استخدم فريق Yann Le Cun DSP لتنفيذ خوارزميات التعلم العميق على جهاز كمبيوتر 486 ، والذي ، باعتباره شريحة استدلال ، يمكنه بالفعل التعرف على الأرقام المكتوبة بخط اليد. حتى الآن ، تم تحسين قوة الحوسبة لوحدات المعالجة المركزية ذات الرقائق ذات الأغراض العامة بشكل كبير ، لكنها لا تزال غير قادرة على تلبية متطلبات طاقة الحوسبة للشبكات العصبية متعددة الطبقات. في عام 1994 ، استخدم Michael Gschwind وآخرون FPGAs لتنفيذ تطبيق الخوارزمية للشبكات العصبية. في عام 1998 ، نشر YannLe Cun و Yoshua Bengio ورقة بعنوان "التعلم القائم على التدرج المطبق للتعرف على المستندات" المتعلق بالشبكات العصبية للتعرف على الكتابة اليدوية وتحسين الانتشار العكسي ، مما أدى إلى إنشاء الحجم وصول عصر الشبكات العصبية التراكمية.

في عام 2006 ، اقترح Hinton نموذج آلة Boltzmann المقيد وشبكة الاعتقاد العميق ، ونجح في تدريب شبكة عصبية متعددة الطبقات ، وحل مشكلة الحل الأمثل المحلي لخوارزمية backpropagation ، ودعا الشبكة العصبية متعددة الطبقات "التعلم العميق". "، مما يدل لأول مرة على إمكانية التعلم على نطاق واسع للشبكة العصبية العميقة. في عام 2007 ، طورت NVIDIA بنية الحوسبة الموحدة (CUDA) ، والتي من خلالها يمكن للباحثين استخدام لغة C بسهولة لتطوير وحدات معالجة الرسومات ، بحيث تتمتع وحدات معالجة الرسومات ببيئة برمجة ملائمة لكتابة البرامج مباشرة. في عام 2008 ، أطلقت NVIDIA شريحة Tegra ، باعتبارها أقدم وحدة معالجة رسوميات يمكن استخدامها في مجال الذكاء الاصطناعي ، والآن أصبحت واحدة من أهم شرائح الذكاء الاصطناعي من NVIDIA ، والمستخدمة بشكل أساسي في مجال القيادة الذكية. في عام 2009 ، نشر Rajat Raina و Wu Enda بالاشتراك ورقة بعنوان "التعلم العميق غير الخاضع للإشراف على نطاق واسع باستخدام معالجات الجرافيك" حول استخدام وحدة معالجة الرسومات لإكمال تدريب التعلم العميق. في عام 2010 ، أصدرت شركة IBM لأول مرة نموذجًا أوليًا لشريحة تشبه الدماغ لمحاكاة بنية الدماغ ، والتي تتمتع بقدرات إدراكية معرفية وقدرات حوسبة متوازية بشكل كبير.

في عام 2012 ، استخدم فريق Krizhevsky و Hinton بنية GPU جنبًا إلى جنب مع خوارزمية الشبكة العصبية التلافيفية (CNN) لتقليل معدل خطأ التعرف على الصور إلى 18 في مسابقة ImageNet ، ونشروا ورقة التعرف على الصور "Image NetClassification with Deep" في مؤتمر NIPS. الشبكات العصبية التلافيفية ". هذا الإنجاز الرائع هو المفاجأة الأولى للأشخاص الذين يرون أن متطلبات الطاقة الحاسوبية للشبكات العصبية يمكن تلبيتها بواسطة معدات الحوسبة الحالية. ومع ذلك ، فإن هذا الإنجاز له أثره أيضًا: شرائح معمارية GPU التي يستخدمونها ليست مصممة لمعماريات الشبكات العصبية ، والتي تحتوي على العديد من التصميمات المعمارية غير المطلوبة لتشغيل الشبكات العصبية ، وبالتالي فإن تحسين الكفاءة محدود. في نفس العام ، استخدم Google Brain نظامًا أساسيًا للحوسبة المتوازية مع 16000 نواة GPU لتدريب نماذج DNN وحقق نجاحًا كبيرًا في مجالات مثل التعرف على الكلام والصورة. في عام 2013 ، بدأ استخدام وحدات معالجة الرسومات على نطاق واسع في مجال الذكاء الاصطناعي ، و أصدرت كوالكوم Zeroth. في عام 2014 ، نشر فريق الدكتور تشين تيانشي (مؤسس كامبريان) التابع للأكاديمية الصينية للعلوم سلسلة من الأوراق البحثية المسماة DianNao مخصصة لرقائق تسريع الذكاء الاصطناعي (بما في ذلك DaDianNao و PuDianNao و ShiDianNao و Cambricon-X) ، وفتحها. رقائق مخصصة لمجالات بحث تسريع الذكاء الاصطناعي (ASIC). في نفس العام أيضًا ، أصدرت Nvidia Pascal ، وهي أول بنية GPU مصممة للتعلم العميق ، وأصدرت IBM الجيل الثاني من TrueNorth.

في عام 2015 ، نشر Jason Cong ورقة بعنوان "Optimizing FPGA-based Accelerator Design for Deep Convolutional Neural Networks" على خوارزمية DNN المعجلة FPGA في المؤتمر الدولي FPGA في ذلك العام ، مما جعل FPGAs سرعان ما أصبحت شائعة. قريبًا ، في عام 2016 ، أصدرت Google شريحة TPU المصممة بإطار TensorFlow ، وفي نفس العام ، ظهر AlphaGo باستخدام بنية TPU وهزم لاعب الشطرنج البشري العالمي Li Shishi. في نفس العام أيضًا ، طور Cambrian DIANNAO ، واستخدمت رقائق FPGA على نطاق واسع في منصات الحوسبة السحابية. فقط في عام 2017 ، تم إصدار Google TPU 2.0 ، مما عزز كفاءة التدريب ؛ أصدرت NVIDIA بنية Volta ، مما أدى إلى تحسين أداء GPU بشكل كبير ؛ أصبح Huawei Kirin 970 أول شريحة AI للهاتف المحمول ؛ فريق البروفيسور Wei Shaojun من جامعة Tsinghua طورت النموذج الأولي Thinker ، والذي تم إطلاقه لاحقًا سلسلة من رقائق الذكاء الاصطناعي Thinker ذات المستوى الدولي من حيث قوة الحوسبة وكفاءة الطاقة.

تصنيف رقائق الذكاء الاصطناعي

2.1 معضلة وحدة المعالجة المركزية التقليدية

منذ أوائل الستينيات ، ظهرت وحدات المعالجة المركزية (وحدات المعالجة المركزية) واستخدمت في صناعة الكمبيوتر. اليوم ، على الرغم من أن وحدات المعالجة المركزية قد خضعت لتغييرات هائلة في التصميم والتنفيذ ، إلا أن مبادئ العمل الأساسية لوحدات المعالجة المركزية القائمة على بنية فون نيومان لم تتغير كثيرًا. كما هو مبين في الشكل 1 ، تنقسم بنية فون نيومان إلى وحدة معالجة مركزية (CPU) وذاكرة ، وتتكون وحدة المعالجة المركزية بشكل أساسي من مكونين رئيسيين: وحدة تحكم ووحدة حسابية. في العمل ، في كل مرة تنفذ فيها وحدة المعالجة المركزية تعليمات ، فإنها تحتاج إلى قراءة البيانات من الذاكرة ، وإجراء العمليات المقابلة على البيانات وفقًا للتعليمات. لذلك ، فإن وحدة المعالجة المركزية ليست مسؤولة فقط عن عمليات البيانات ، ولكنها تحتاج أيضًا إلى تنفيذ الأوامر مثل قراءة التخزين ، وتحليل التعليمات ، والقفز على الفروع. في نفس الوقت ، يمكن تحسين سرعة الحساب عن طريق زيادة عدد التعليمات المنفذة لكل وحدة زمنية ، أي التردد الرئيسي. ومع ذلك ، في مجال التعلم العميق للذكاء الاصطناعي ، هناك عدد قليل نسبيًا من تعليمات البرنامج ، لكن طلب الحوسبة على البيانات الضخمة كبير جدًا ، كما أن معالجة البيانات الضخمة مطلوبة. عند استخدام وحدة المعالجة المركزية لتنفيذ خوارزميات الذكاء الاصطناعي ، ستقضي وحدة المعالجة المركزية الكثير من الوقت في قراءة البيانات / التعليمات وتحليلها. في ظل فرضية استهلاك طاقة معين ، لا يمكن تحقيق سرعة تنفيذ التعليمات من خلال التسريع غير المقيد لتردد وحدة المعالجة المركزية وعرض النطاق الترددي للذاكرة . حد رفع. لذلك ، في هذه الحالة ، فإن بنية وحدة المعالجة المركزية التقليدية بها أوجه قصور واضحة ، ويصعب حل عنق الزجاجة في مجال طاقة الحوسبة في مجال رقائق الذكاء الاصطناعي.

2.2 عصر ما بعد وحدة المعالجة المركزية في رقائق الذكاء الاصطناعي

استنادًا إلى القوة الحاسوبية لوحدة المعالجة المركزية ، أجرى العلماء في مجال رقائق الذكاء الاصطناعي أبحاثًا مثمرة ومكثفة في السنوات الأخيرة ، ركزوا بشكل أساسي على اتجاهين لتطوير رقائق الذكاء الاصطناعي الحاليين. يتمثل أحد الاتجاهات في مواصلة هندسة الحوسبة الكلاسيكية لـ Von Neumann ، بهدف تسريع قوة الحوسبة ، مقسمة بشكل أساسي إلى GPU (وحدة معالجة الرسومات) الحوسبة المتوازية المتسارعة ، FPGA شبه المخصصة (مجموعة بوابة قابلة للبرمجة الميدانية) ، ASIC مخصص بالكامل (تطبيق- دائرة متكاملة محددة). هناك اتجاه آخر يتمثل في تخريب بنية حوسبة فون نيومان التقليدية واستخدام شرائح عصبية تعتمد على الهياكل العصبية الشبيهة بالدماغ لحل مشاكل القدرة الحاسوبية. سيتم وصف خصائص رقائق الذكاء الاصطناعي في هذين الاتجاهين بالتفصيل أدناه.

2.2.1 التصنيف حسب العمارة

(1) وحدة معالجة الرسومات (وحدة معالجة الرسومات ، GPU). GPU هو معالج حوسبة سريع مبكر نسبيًا ، يتميز بخصائص السرعة العالية ، والمرونة ، وبرمجة الرقائق البسيطة. نظرًا لأن تعليمات الحوسبة الخاصة بوحدة المعالجة المركزية التقليدية تتبع وضع التنفيذ التسلسلي ، فلا يمكن استخدام الإمكانات الكاملة للشريحة ، في حين أن وحدة معالجة الرسومات لديها بنية متوازية عالية وأكثر كفاءة من وحدة المعالجة المركزية في معالجة بيانات الرسومات والخوارزميات المعقدة. من الناحية الهيكلية ، تتكون وحدة المعالجة المركزية بشكل أساسي من وحدات تحكم وسجلات ، بينما تحتوي وحدة معالجة الرسومات (GPU) على المزيد من وحدات المنطق الحسابي (ALU) لمعالجة البيانات. هذه البنية أكثر ملاءمة للمعالجة المتوازية للبيانات المكثفة. غالبًا ما تكون سرعة التشغيل على نظام GPU عشرات أو حتى آلاف المرات أسرع من وحدة المعالجة المركزية أحادية النواة. في الوقت نفسه ، تتمتع وحدة معالجة الرسومات (GPU) بقدرات حوسبة أكثر قوة بالنقطة العائمة ، والتي يمكن أن تخفف من مشاكل التدريب لخوارزميات التعلم العميق وتحرر إمكانات الذكاء الاصطناعي. لكن وحدات معالجة الرسومات لها أيضًا قيود معينة. تنقسم خوارزمية التعلم العميق إلى قسمين: التدريب والاستدلال ، وتعتبر منصة GPU فعالة للغاية في تدريب الخوارزمية. ومع ذلك ، عند معالجة إدخال واحد في الاستدلال ، لا يمكن ممارسة مزايا الحوسبة المتوازية بشكل كامل.

(2) مصفوفة البوابة الميدانية القابلة للبرمجة (مجموعة البوابة القابلة للبرمجة الميدانية ، FPGA). FPGA هو نتاج لمزيد من التطوير على أساس الأجهزة القابلة للبرمجة مثل PAL و GAL و CPLD. يتمثل المبدأ الأساسي في دمج عدد كبير من دوائر البوابة الأساسية والذكريات في شريحة FPGA ، ويمكن للمستخدمين تحديد الاتصال بين دوائر البوابة هذه والذكريات عن طريق تحديث ملف تكوين FPGA (أي حرق في). هذا الاحتراق ليس لمرة واحدة ، لذلك فهو لا يحل فقط نقص مرونة الدوائر المخصصة ، ولكنه يتغلب أيضًا على أوجه القصور في العدد المحدود لدارات البوابة للجهاز الأصلي القابل للبرمجة. على عكس GPU ، فإن FPGA لديها القدرة على أداء البيانات المتوازية والحوسبة المتوازية للمهام في نفس الوقت.إنها مناسبة لمعالجة جزء من البيانات في خط أنابيب الأجهزة ، ولها أداء تشغيل أعلى عدد صحيح ، لذلك غالبًا ما تستخدم في مرحلة الاستدلال من خوارزميات التعلم العميق. ومع ذلك ، تنفذ FPGA خوارزميات برمجية من خلال تكوين الأجهزة ، لذلك من الصعب تنفيذ خوارزميات معقدة.

بمقارنة FPGA ووحدة المعالجة المركزية ، يمكن العثور على سمتين: الأولى هي أن FPGA لا تحتوي على أجزاء التخزين والقراءة التي تم إحضارها بواسطة الذاكرة والتحكم ، والسرعة أسرع. والأخرى هي أن FPGA ليس لديها عملية تعليمات قراءة ، وبالتالي فإن استهلاك الطاقة أقل. العيب هو أن السعر مرتفع نسبيًا ، والبرمجة معقدة ، وقوة الحوسبة الإجمالية ليست عالية جدًا. من حيث استهلاك الطاقة ، تتمتع FPGAs أيضًا بمزايا متأصلة من حيث الهندسة المعمارية. في بنية Fung التقليدية ، تحتاج وحدة التنفيذ (مثل نواة وحدة المعالجة المركزية) إلى ذاكرة تعليمات ، ووحدة فك ترميز ، ومشغلي تعليمات متنوعة ، ومنطق معالجة الفرع والقفز للمشاركة في العملية. وقد تم تحديد الوظيفة أثناء إعادة البرمجة (أي ، احتراق) ، لا توجد تعليمات مطلوبة ، ولا يلزم وجود ذاكرة مشتركة ، مما يمكن أن يقلل بشكل كبير من استهلاك الطاقة لكل تنفيذ للوحدة وتحسين نسبة استهلاك الطاقة الإجمالية. ربما يكون المثال الأكثر بروزًا على FPGA هو CNP ، والذي تم تحسينه وإعادة تسميته NeuFlow وتم تكييفه لاحقًا مع nn-X. يمكن أن تحقق هذه التصميمات عملية تشغيل من 10 إلى 100 كم / ثانية (GOPS) بقوة أقل بقليل من 10 وات.

(3) دارة متكاملة خاصة بالتطبيقات (ASIC). في الوقت الحالي ، تستخدم متطلبات حوسبة الذكاء الاصطناعي التي يمثلها التعلم العميق بشكل أساسي GPU و FPGA والرقائق العامة الأخرى الحالية المناسبة للحوسبة المتوازية لتحقيق التسارع. عندما لا تظهر التطبيقات الصناعية على نطاق واسع ، فإن استخدام مثل هذه الرقائق ذات الأغراض العامة لوحدات معالجة الرسومات (GPU) و FPGAs يمكن أن يتجنب الاستثمار المرتفع والمخاطر العالية للتخصص في تطوير الرقائق المخصصة (ASIC). ومع ذلك ، نظرًا لأن النية الأصلية لهذه الرقائق ذات الأغراض العامة ليست مخصصة للتعلم العميق ، فهناك قيود متأصلة في الأداء واستهلاك الطاقة. مع توسع نطاق تطبيقات الذكاء الاصطناعي ، أصبحت مثل هذه المشاكل بارزة بشكل متزايد.

كمعالج للصور ، تم تصميم وحدة معالجة الرسومات في الأصل للتعامل مع الحوسبة المتوازية واسعة النطاق في معالجة الصور. لذلك ، لا يمكن استغلال مزايا الحوسبة المتوازية بشكل كامل عند تطبيقها على خوارزميات التعلم العميق. يتضمن التعلم العميق رابطين للحوسبة: التدريب والاستدلال. GPU فعالة للغاية في تدريب خوارزمية التعلم العميق ، ولكن في حالة الاستدلال بمدخل واحد ، لا يمكن الاستفادة من مزايا التوازي بشكل كامل. ثانيًا ، تعتمد وحدة معالجة الرسومات (GPU) وضع الحوسبة SIMT ، وبنية الأجهزة ثابتة نسبيًا ، ولا يمكن تكوين هيكل الأجهزة بمرونة. أيضًا ، تشغيل خوارزميات التعلم العميق أقل كفاءة في استخدام الطاقة من FPGAs.

على الرغم من أن FPGA ذو قيمة عالية ، إلا أنه لم يتم تطويره خصيصًا لتطبيق خوارزميات التعلم العميق. في التطبيقات العملية ، من أجل تحقيق خصائص قابلة لإعادة التكوين ، هناك عدد كبير من الوحدات الأساسية الدقيقة للغاية داخل FPGA ، ولكن قوة الحوسبة لكل منها الوحدة أقل بكثير. وحدة ALU في وحدة المعالجة المركزية ووحدة معالجة الرسومات ؛ ثانيًا ، من أجل تحقيق خصائص قابلة لإعادة التكوين ، يتم استخدام عدد كبير من الموارد داخل FPGA للتوجيه والتوصيل على الشريحة القابلة للتكوين ، وبالتالي فإن نسبة موارد الحوسبة منخفضة نسبيًا ؛ ثالثًا والسرعة واستهلاك الطاقة لا تزال هناك فجوة كبيرة مقارنة بالرقائق المخصصة المخصصة (ASICs) ؛ و FPGAs أغلى ثمناً ، وتكلفة FPGA واحدة أعلى بكثير من تكلفة الرقائق المخصصة المخصصة في حالة الإنتاج على نطاق واسع .

لذلك ، مع التطور المتزايد لخوارزميات الذكاء الاصطناعي وتقنيات التطبيق ، والنضج التدريجي لبيئة صناعة ASIC لرقائق الذكاء الاصطناعي ، أظهرت أجهزة ASIC للذكاء الاصطناعي المخصصة بالكامل بشكل تدريجي مزاياها الخاصة. ASIC عبارة عن شريحة مخصصة مخصصة. تساعد الميزات المخصصة على تحسين نسبة الأداء إلى الطاقة في ASIC. والعيب هو أن تصميم الدائرة يحتاج إلى التخصيص ، ودورة التطوير طويلة نسبيًا ، والوظيفة يصعب توسيعها. ومع ذلك ، فإن لها مزايا في استهلاك الطاقة ، والموثوقية ، والتكامل ، وما إلى ذلك ، خاصة في تطبيقات الهاتف المحمول التي تتطلب أداءً عاليًا واستهلاكًا منخفضًا للطاقة. على سبيل المثال ، تعد كل من TPU و Cambrian GPU و Horizon BPU من Google شرائح ASIC.

(4) الرقائق ذات الشكل العصبي (الرقائق الشبيهة بالدماغ). في رقائق الذكاء الاصطناعي ، هناك "عنق زجاجة فون نيومان" في بنية فون نيومان التقليدية ، مما يقلل من الكفاءة العامة وأداء النظام. للتغلب على هذه المشكلة بشكل أساسي ، ظهرت الحوسبة العصبية في السنوات الأخيرة باعتبارها البديل الأكثر جاذبية لهياكل الحوسبة التقليدية القائمة على أنظمة فون نيومان. صاغ Mead مصطلح "الحوسبة العصبية" لأول مرة في عام 1990 كنموذج حوسبي جديد مستوحى من الوظائف المعرفية للدماغ. على عكس وحدات المعالجة المركزية / وحدات معالجة الرسومات التقليدية ، فإن الأدمغة البيولوجية (مثل أدمغة الثدييات) قادرة على معالجة كميات كبيرة من المعلومات بالتوازي في مناطق صغيرة بكفاءة عالية واستهلاك منخفض للطاقة. لذلك ، فإن الهدف النهائي للحوسبة العصبية هو تطوير مسرعات الأجهزة العصبية التي تحاكي معالجة المعلومات البيولوجية الفعالة لسد فجوة الكفاءة بين الشبكات والأدمغة الحقيقية ، والتي تعتبر القوة الدافعة الرئيسية للجيل القادم من الذكاء الاصطناعي.

لا تستخدم الشريحة العصبية الشكل بنية فون نيومان الكلاسيكية ، ولكنها مصممة على أساس الهندسة المعمارية العصبية. إنها آلية حاسوبية تحاكي شبكة عصبية بيولوجية. إذا اعتبرت الخلايا العصبية والمشابك "المعالج" و "الذاكرة" في الدماغ ، التي يتم توزيعها في جميع أنحاء القشرة العصبية. تقترب الحوسبة العصبية من الدماغ من المستوى الهيكلي ، ويمكن تقسيم عملها البحثي إلى مستويين ، أحدهما مستوى الشبكة العصبية ، والبنية والمعالج العصبي المقابل ، الذي يمثله IBM Truenorth ، هذه الشريحة مخصصة. معالجة الأرقام تعمل نوى النظام كخلايا عصبية والذاكرة كمشابك عصبية.

يختلف هيكلها المنطقي عن هيكل von Neumann التقليدي: تم دمج مكونات الذاكرة ووحدة المعالجة المركزية والاتصال بشكل كامل ، لذلك تتم معالجة المعلومات محليًا ، متغلبًا على اختناق السرعة بين الذاكرة ووحدة المعالجة المركزية في أجهزة الكمبيوتر التقليدية. في الوقت نفسه ، يمكن للخلايا العصبية أن تتواصل مع بعضها البعض بسهولة وبسرعة. طالما أنها تتلقى نبضات (إمكانات فعل) من الخلايا العصبية الأخرى ، فإن هذه الخلايا العصبية ستعمل في نفس الوقت ؛ والثاني هو مستوى الخلايا العصبية والمشابك. ابتكار على مستوى المكون. على سبيل المثال ، أعلن مركز أبحاث آي بي إم في زيورخ عن إنشاء أول عصبونات انتقالية عشوائية نانوية النطاق في العالم ، مما يتيح التعلم عالي السرعة غير الخاضع للإشراف.

في الوقت الحالي ، لا تزال أحدث الشرائح العصبية بعيدة كل البعد عن حجم الدماغ البشري (1010 خلايا عصبية ، لكل منها 103-104 مشابك عصبية) ، حتى 104 مرة ، كما هو موضح في الجدول 1. لتحقيق المقياس في الدماغ البشري ، يجب دمج شرائح متعددة الأشكال العصبية على لوحة دوائر كهربائية أو لوحة الكترونية معززة لتشكيل نظام حوسبة فائق النطاق. لم يعد الغرض من تصميم الرقائق العصبية الشكل يقتصر على تسريع خوارزميات التعلم العميق ، ولكن لتغيير التصميم في الهيكل الأساسي للرقاقة وحتى على مستوى الجهاز ، على أمل تطوير هياكل حاسوبية جديدة تشبه الدماغ ، مثل استخدام memristors وأجهزة ReRAM لزيادة كثافة التخزين. هذا النوع من تقنيات الرقائق لم ينضج بشكل كامل بعد ، ولا يزال بعيدًا عن التطبيق واسع النطاق ، ولكن على المدى الطويل ، قد تحدث الرقائق الشبيهة بالدماغ ثورة في هندسة الكمبيوتر.

2.2.2 التصنيف حسب الوظيفة

وفقًا لخطوات خوارزمية التعلم الآلي ، يمكن تقسيمها إلى قسمين: التدريب والاستدلال. تتطلب عملية التدريب عادةً كمية كبيرة من إدخال البيانات لتدريب نموذج شبكة عصبية عميقة معقدة. نظرًا لأن عملية التدريب تتضمن بيانات تدريب ضخمة وبنية معقدة للشبكة العصبية العميقة ، فإن الحمل الحسابي ضخم ، ويتطلب نطاقًا حوسبيًا ضخمًا. في الوقت الحالي ، تُستخدم مجموعات GPU الخاصة بـ NVIDIA عادةً في السوق لإكمالها ، كما يدعم TPU2.0 / 3.0 من Google تسريع الشبكة العميق في عملية التدريب.

يشير ارتباط الاستدلال إلى استخدام النموذج المدرب "لاستنتاج" استنتاجات مختلفة باستخدام بيانات جديدة. مقدار الحساب في هذا الارتباط أقل بكثير من ارتباط التدريب ، لكنه لا يزال يتضمن الكثير من عمليات المصفوفة. في عملية الاستدلال ، بالإضافة إلى استخدام وحدة المعالجة المركزية أو وحدة معالجة الرسومات للحوسبة ، يمكن أن تلعب FPGA و ASIC دورًا رئيسيًا. الجدول 2 هو مقارنة شرائح البنى التقنية الأربعة في تطوير أنظمة الذكاء الاصطناعي.

2.2.3 التصنيف حسب سيناريوهات التطبيق

وهي مقسمة بشكل أساسي إلى فئتين: جانب الخادم (سحابي) وجانب متنقل (طرفي).

جانب الخادم: في مرحلة التدريب من التعلم العميق ، نظرًا للكم الهائل من البيانات والحسابات ، يكاد يكون من المستحيل على معالج واحد إكمال عملية التدريب لنموذج بشكل مستقل. لذلك ، فإن الشريحة المسؤولة عن خوارزمية الذكاء الاصطناعي تتبنى المسار التقني للحوسبة عالية الأداء. فمن ناحية ، يجب أن تدعم أكبر عدد ممكن من هياكل الشبكات لضمان المعدل الصحيح وقدرة التعميم للخوارزمية ؛ ومن ناحية أخرى ، يجب أن تدعم عمليات النقطة العائمة ؛ و من أجل تحسين الأداء ، يجب أن تدعم بنية مصفوفة (أي ، يمكن دمج شرائح متعددة في نظام حساب واحد). مجموعة لتسريع العمليات). في مرحلة الاستدلال ، نظرًا لأن نموذج الشبكة العصبية العميقة المدرب لا يزال معقدًا للغاية ، فإن عملية الاستدلال لا تزال حسابية وتخزينية مكثفة ، ويمكن نشرها على جانب الخادم.

المحطات الطرفية المتنقلة (الهواتف المحمولة ، والمنازل الذكية ، والمركبات غير المأهولة ، وما إلى ذلك): تختلف أفكار تصميم رقائق الذكاء الاصطناعي المحمولة اختلافًا جوهريًا عن رقائق الذكاء الاصطناعي من جانب الخادم. أولاً ، يجب ضمان كفاءة طاقة الحوسبة العالية ؛ ثانيًا ، في حالة ADAS المتقدمة بالقيادة المساعدة والأجهزة الأخرى التي تتطلب أداءً عاليًا في الوقت الفعلي ، يجب إكمال عملية الاستدلال في الجهاز نفسه ، لذلك يجب أن يكون لدى الأجهزة المحمولة ما يكفي قدرات الاستدلال. في بعض الحالات ، ستكون هناك أيضًا متطلبات لاستهلاك منخفض للطاقة وزمن انتقال منخفض وتكلفة منخفضة ، مما ينتج عنه مجموعة متنوعة من شرائح الذكاء الاصطناعي على الجانب المحمول.

حالة البحث عن رقائق الذكاء الاصطناعي

3.1 الخلفية البحثية

جوهر شريحة الذكاء الاصطناعي هو تحقيق خوارزمية الشبكة العصبية. حققت الشبكات العصبية العميقة (DNNs) اختراقات كبيرة في العديد من مجالات الذكاء الاصطناعي مثل معالجة اللغة الطبيعية ورؤية الآلة والتعرف على الكلام وتحليل الصور الطبية. ينقسم التعلم العميق بشكل أساسي إلى الشبكة العصبية التلافيفية التقليدية (CNN) والشبكة العصبية المتكررة (RNN) ، والتي تعتمد على التدريب المتكرر لمجموعات البيانات الكبيرة وعدد كبير من عمليات الاستدلال بالنقطة العائمة ، والتي تتطلب قوة حوسبة عالية ووقت تدريب طويل . ، استهلاك الطاقة ضخم. خذ Alpha Go كمثال ، والذي يعتمد على 1920 وحدة معالجة مركزية و 280 وحدة معالجة رسومات ويستهلك 1 ميجاوات ، وهو ما يقرب من 50000 ضعف استهلاك طاقة الدماغ البشري (~ 20 واط). في السنوات الأخيرة ، يُنظر إلى الذكاء الاصطناعي على أنه يتمتع بإمكانيات كبيرة للتطبيق في مجال إنترنت الأشياء والحوسبة المتطورة ، لذلك يحتاج إلى القدرة على أن يكون موفرًا للطاقة ، والتنبؤ السريع ، والتعلم عبر الإنترنت لتجنب إرسال كميات كبيرة من البيانات إلى الخلفية أو الخادم.

تم تحسين وتحسين خوارزميات الذكاء الاصطناعي والبنى والدوائر والأجهزة والمستويات الأخرى بشكل كبير لتقليل استهلاك الطاقة للاستدلال مع الحفاظ على مؤشرات الأداء مثل دقة التصنيف. حقق العمل على مسرعات أجهزة الاستدلال الموفرة للطاقة من خلال تصميمات ASIC المخصصة كفاءة طاقة عالية إلى حد ما (1 TFlops / W) ، لكن خوارزميات التعلم العميق القائمة على الانتشار الخلفي تتطلب انتشارًا متكررًا لإشارات الخطأ من مسافات طويلة ، مما يجعل من الصعب تحقيق الكفاءة الدراسة عبر الإنترنت. نظرًا لانخفاض كفاءة الطاقة والافتقار إلى أساليب التعلم الفعالة عبر الإنترنت ، فإن العديد من خوارزميات التعلم العميق التي تمثلها CNN و RNN ليست مناسبة لتطبيقات الذكاء الاصطناعي الناشئة القائمة على الأحداث والموفرة للطاقة ، مثل أجهزة الاستشعار الذكية لإنترنت الأشياء والحوسبة المتطورة.

في هذا السياق ، اقترح العلماء في مجال الذكاء الاصطناعي الشبكة العصبية المتصاعدة (SNN) ، والتي تُعرف بالجيل الثالث من الشبكة العصبية الاصطناعية.

تستخدم شبكات SNN قطارات سبايك زمنية لتمثيل المعلومات ونقلها ومعالجتها بين نماذج الخلايا العصبية ، مما يضمن تعلمًا أسرع عبر الإنترنت وكفاءة أعلى في استخدام الطاقة. بالمقارنة مع الشبكات العصبية الاصطناعية التقليدية (CNN و RNN) ، تتمتع SNN بخصائص فريدة تشبه الدماغ ، بما في ذلك تمثيل نبض المعلومات ، ومعالجة المعلومات المدفوعة بالحدث ، وقواعد التعلم المحلية القائمة على النبض ، والتي هي أقرب إلى الشبكات العصبية البيولوجية. آليات الذاكرة. لذلك ، نظرًا للتعلم السريع عبر الإنترنت ، وكفاءة الطاقة العالية للغاية ، والتشابه الكبير مع الدماغ البشري ، فقد أصبحت الشبكات العصبية المتصاعدة موضوعًا بحثيًا ذا أهمية علمية كبيرة في مجال الذكاء الاصطناعي في السنوات الأخيرة.

3.2 حالة البحث

في السنوات الأخيرة ، تقوم مؤسسات البحث الأكاديمي الشهيرة في العالم وشركات أشباه الموصلات الدولية بنشاط بالبحث وتطوير الدوائر العصبية القائمة على النبض. كما هو موضح في الجدول 3 ، تعد أجهزة الحوسبة العصبية المستندة إلى SNN أكثر كفاءة في استخدام الطاقة من مسرعات الأجهزة التقليدية القائمة على DNN. تعتمد معظم رقائق الحوسبة العصبية الحديثة على تقنية السيليكون CMOS الناضجة لتصميم ASIC لـ SNN ، والمشابك الاصطناعية من خلال محاكاة الذاكرة مثل SRAM ، والخلايا العصبية الاصطناعية باستخدام الدوائر الرقمية أو التناظرية الرئيسية. أكثرها تمثيلا هي شريحة TrueNorth المبنية على بنية CMOS متعددة النواة التي طورتها شركة IBM. عند محاكاة مليون خلية عصبية و 250 مليون نقطة تشابكية ، تستهلك الشريحة 70 ميجاوات فقط من استهلاك الطاقة ، ويستهلك كل حدث متشابك فقط 70 ميجاوات من الطاقة. كفاءة طاقة عالية للغاية تبلغ 26 pJ. ومع ذلك ، من أجل محاكاة الخصائص الشبيهة بالدماغ للمشابك البيولوجية والخلايا العصبية ، تتطلب المشابك الإلكترونية والخلايا العصبية دوائر CMOS شديدة التعقيد لتحقيق الوظائف المطلوبة من المشابك الاصطناعية والخلايا العصبية ، كما هو موضح في الشكل 2.

خذ شريحة TrueNorth من شركة IBM ، على سبيل المثال ، والتي تحتوي على 5.4 مليار ترانزستور وتحتل مساحة 4.3 سم 2 على عملية 28 نانومتر. لذلك ، يستخدم هذا النوع من دوائر أجهزة CMOS العصبية القائمة على النبض عددًا كبيرًا من الترانزستورات ويؤدي إلى استهلاك مساحة شريحة كبيرة جدًا. بالإضافة إلى ذلك ، لا تزال معظم الشرائح العصبية الموجودة منفصلة جزئيًا بسبب وحدة الحوسبة ووحدة التخزين الخاصة بها ، والتي لا يزال لديها حاجز تخزين محلي بين الدائرة المنطقية CMOS للخلايا العصبية ودائرة SRAM للمشابك.القضايا وقضايا كفاءة الطاقة ، لذلك إنها في الواقع ليست بنية غير فون نيومان بالمعنى الحقيقي. ومع ذلك ، من المتوقع أن تحل هذه المشكلة أحدث تقنيات الذاكرة غير المتطايرة (NVM) أو تقنية الحوسبة في الذاكرة ذات القدرة على التراص ثلاثي الأبعاد.

أظهرت شريحة وظيفية أخرى للشبكة العصبية تعتمد على تقنية NVM الجديدة التي طورتها شركة IBM أن تقنية NVM المبتكرة يمكن أن تحقق استهلاكًا منخفضًا للغاية للطاقة (0.9 pJ / bit فقط). يتكون هيكل المصفوفة المتقاطعة من مقاومات ذاكرة تغيير الطور التي تشغل التقاطعات ، جنبًا إلى جنب مع الدوائر التناظرية CMOS ، ووظيفة اللدونة المشبكية لقاعدة التعلم التي تعتمد على توقيت النبض (STDP) ووظيفة الخلايا العصبية مع التسرب التفريغ المتكامل (LIF) تتحقق ، كما هو موضح في الشكل 3. ومع ذلك ، نظرًا لمشكلة دقة التنبؤ ، لا يمكن للرقاقة سوى أداء مهام تطبيق بسيطة وإكمال التعلم الترابطي للأنماط الأساسية. تعكس شريحة IBM العصبية القائمة على النبض أحدث التطورات العلمية في مجال الخلايا العصبية الاصطناعية والمشابك العصبية ، فضلاً عن تقنية NMV الناشئة.

أثناء التعلم من العمل البحثي الأجنبي ، يعمل بلدي أيضًا بقوة على تطوير أبحاث الرقائق العصبية القائمة على النبض. اقترح فريق جامعة تسينغهوا شريحة تيانجي -1 معمارية متعددة النواة تشبه الدماغ تعتمد على تقنية CMOS ، والتي أدركت وظيفة الخلايا العصبية الاصطناعية التي تدعم LIF. اقترح فريق جامعة بكين شريحة عصبية الشكل تعتمد على مصفوفة memristor التي تنفذ وظيفة LIF مبسطة وآلية تعلم هيبر بسيطة. يعد memristor نوعًا جديدًا من أجهزة NVM ذات الخصائص التناظرية الفريدة وقابلية التوسع ، وبسبب كفاءته الممتازة في استخدام الطاقة وخصائص الجهاز ، يمكنه تحسين مقياس التكامل والأداء العام للرقائق العصبية.

حتى الآن ، فإن طريقة البحث الرئيسية للرقائق العصبية القائمة على النبض هي من خلال المحاكاة المباشرة والإدراك الإلكتروني لخصائص السلوك البيولوجي الموجودة في علم الأعصاب البيولوجي ، بما في ذلك البحث والاستكشاف على مستويات مختلفة مثل نمذجة الخوارزمية ، وابتكار الدوائر ، وتكنولوجيا الأجهزة الجديدة. على الرغم من أن تقنية شرائح الذكاء الاصطناعي القائمة على خوارزميات الحوسبة العصبية قد تم تطويرها بشكل كبير وتقدمت في السنوات الأخيرة ، إلا أنه لا يزال من الصعب تحقيق جميع آليات التعلم البيولوجي المعروفة ، فقط من خلال تحسين نموذج SNN لتقريب أو تقليد بعض الظواهر البيولوجية. تنفيذ بعض التعلم البسيط وظائف ، مثل تخطيط المسار والتعرف على خط اليد. تتضمن هذه النماذج المبسطة التي تشبه الدماغ نماذج متشابكة تعتمد على قواعد التحديث المعتمدة على توقيت النبض ونماذج الخلايا العصبية بناءً على ديناميكيات إطلاق خطي حتمية متكاملة.

الوضع الراهن لصناعة رقائق الذكاء الاصطناعي

4.1 مراجعة الوضع الحالي للصناعة

رقائق الذكاء الاصطناعي هي مفتاح التكامل بين صناعة الرقائق وصناعة الذكاء الاصطناعي ، وخاصة رقائق أنظمة الذكاء الاصطناعي. وفقًا لبيانات توقعات Gartner ، فإن حجم سوق رقائق الذكاء الاصطناعي العالمي سوف يرتفع في السنوات الخمس المقبلة ، حيث يرتفع من 4.27 مليار دولار في عام 2018 إلى 34.3 مليار دولار ، أي بزيادة أكثر من 7 مرات. ويمكن ملاحظة أن الذكاء الاصطناعي سوق الرقائق لديه مجال كبير للنمو ، كما هو موضح في الشكل 4.

بالنسبة لسوق شرائح الذكاء الاصطناعي في الصين ، وفقًا لتقرير بيانات من الأكاديمية الصينية لتكنولوجيا المعلومات والاتصالات ، من المتوقع أن يتجاوز سوق الذكاء الاصطناعي في الصين 30 مليار يوان في عام 2018 ، وأن يتجاوز 50 مليار يوان بعد عام 2019. وسيرتفع معدل النمو السنوي للسوق من 52.8 في عام 2017 إلى 56.3 في عام 2018 ، ثم ينخفض عامًا بعد عام إلى 42.0 في عام 2020. من بينها ، شكلت مبيعات الرقائق في عام 201722 من حجم سوق الذكاء الاصطناعي ، حوالي 4.77 مليار يوان ، كما هو موضح في الشكل 5.

يوجد اليوم أكثر من 20 شركة جديدة لتصميم شرائح الذكاء الاصطناعي في الصين ، بتمويل إجمالي يزيد عن 3 مليارات دولار أمريكي. لا تزال دورة حياة صناعة رقائق الذكاء الاصطناعي في مهدها ، وينمو السوق بسرعة ، من 4.27 مليار دولار في 2018 إلى 34.3 مليار دولار بحلول عام 2022 ، لكن نموذج التعاون بين شركات الرقائق والعملاء لا يزال قيد الاستكشاف. من أجل البقاء ، ظهرت الصناعة تدريجياً في اتجاه التكامل المنبع والمصب. تعد السيناريوهات الثلاثة للخادم السحابي (بما في ذلك الحافة) والهواتف الذكية ومعدات إنترنت الأشياء هي الأسواق الرئيسية لشركات شرائح الذكاء الاصطناعي حاليًا ، بينما يواجه عدد قليل من الشركات سوق المركبات المستقلة في المستقبل. تتميز هذه الأسواق بعشرات الملايين من الشحنات أو مبيعات بعشرات المليارات من الدولارات.

ومع ذلك ، فقد واجهت الصين منذ فترة طويلة موقفًا يتمثل في أن قيمة استيراد الدوائر المتكاملة أكبر من قيمة الصادرات.وفقًا لإحصاءات الإدارة العامة للجمارك ، كما هو موضح في الشكل 6 ، تجاوز إجمالي قيمة الواردات في عام 2018 رسميًا 300 مليار دولار أمريكي. دولار ، ليصل إلى ما يقرب من 312.1 مليار دولار أمريكي ، بزيادة على أساس سنوي لعام 2017. بزيادة قدرها 19.8. بالمقابل بلغت قيمة الصادرات الإجمالية للدوائر المتكاملة 84.6 مليار دولار فقط في 2018 أي أقل من ثلث قيمة الواردات ، بينما بلغت قيمة واردات النفط الخام في نفس العام نحو 240 مليار دولار. ويمكن ملاحظة ذلك أن الصين تعتمد بشكل كبير على الدول الأجنبية. في الوقت الحالي ، تحتاج تكنولوجيا تصنيع الرقائق المحلية إلى التحسين ، ولكن نظرًا لأن تقسيم وضع العمل لأشباه الموصلات أصبح ناضجًا تمامًا ، فلا داعي لشركات تصميم الرقائق المحلية للقلق بشأن إنتاج الرقائق.

4.2 سلسلة صناعة شرائح الذكاء الاصطناعي

تنقسم سلسلة صناعة رقائق الذكاء الاصطناعي بشكل أساسي إلى نظام تصميم - تصنيع / اختبار - تغليف.

(1) المنبع: تصميم الرقائق بشكل أساسي ، والذي يمكن تقسيمه إلى ثلاثة أنواع وفقًا لنموذج العمل: تصميم IP ، ومسبك تصميم الرقائق ، وتصميم الرقائق. تصميم IP هو جوهر IP المستخدم في تصميم الشريحة.

(2) منتصف الطريق: وهي تشمل فئتين ، وهما تصنيع الرقائق واختبار التعبئة والتغليف ، ولا يتم اختبار الرقاقة أثناء التعبئة فحسب ، بل يتم اختبارها أيضًا مرة واحدة بعد التصنيع ومرة بعد التعبئة.

(3) المصب: مقسم إلى شركات مبيعات وتكامل الأنظمة ، حيث ستُنسب الشركات التي تقدم حلول تكامل البرامج والأجهزة إلى شركات تكامل الأنظمة ، مثل موفري حلول الذكاء الاصطناعي.

4.3 نموذج عمل شرائح الذكاء الاصطناعي

وفقًا لتكامل أشباه الموصلات المنبع والوسطى ، ينقسم السوق إلى نموذجين للأعمال.

(1) وضع التكامل العمودي: المعروف أيضًا باسم IDM ، تشمل أعمال المؤسسة التي تنتمي إلى هذا الوضع أيضًا التصميم والتصنيع / التغليف والاختبار. الشركات التمثيلية لنموذج IDM هي Intel و Samsung.

(2) التقسيم الرأسي لنموذج العمل: تتخصص الشركات التي تتبنى نموذج تقسيم العمل في عمل واحد فقط. على سبيل المثال ، تمتلك NVIDIA و Huawei HiSilicon تصميم رقاقة فقط ولا يوجد نشاط تصنيع ، وهو ما يسمى Fabless ؛ في حين أن TSMC و SMIC هما فقط OEM ولا تتضمن تصميم رقاقة ، يسمى مسبك.

4.4 نموذج صناعة تصميم شرائح الذكاء الاصطناعي

ينقسم النموذج الصناعي لتصميم الرقائق إلى ثلاثة أنواع: تصميم IP ، وتصميم الرقائق ، وتصميم الرقائق.

(1) تصميم IP: بالمقارنة مع تصميم الرقائق ، يحتل تصميم IP أعلى مستوى في سلسلة الصناعة ، ويستند أساسًا إلى رسوم الترخيص الأساسية للملكية الفكرية. يتم تمثيل شركات الترخيص الأساسية التقليدية للملكية الفكرية بواسطة Arm. وعلى الرغم من أن شركات شرائح الذكاء الاصطناعي الجديدة يمكنها أيضًا تصميم نوى IP جديدة ، إلا أن نموذج الترخيص ليس من السهل تحقيق إيرادات كبيرة مع تأثيرات الحجم. هذا هو نموذج الربح الرئيسي. بالإضافة إلى ذلك ، فإن Cadence و Synopsys ، اللتان توفران تصميمًا آليًا (أداة EDA) وأدوات للتحقق من تصميم الرقائق ، تنشران بنشاط أيضًا رقائق خاصة بالذكاء الاصطناعي.

(2) مسبك تصميم الرقائق: مسبك تصميم الرقائق هو نفسه مسبك التصنيع ، ولا يمكن للشركات التي تقدم خدمات مسابك التصميم وضع ملصقاتها الخاصة على المنتجات ، ولا يمكنها الادعاء بأن المنتجات مصممة بنفسها. شاركت VeriSilicon في الخدمات ذات الصلة لسنوات عديدة ولديها أيضًا علاقة تعاونية مع NXP.

(3) تصميم الشرائح: تعتمد معظم الشركات الناشئة في مجال الذكاء الاصطناعي على تصميم الرقائق ، ولكن هناك أعداء تقليديون أقوياء في هذا المجال ، مثل NVIDIA و Intel و Xilinx و NXP ، لذلك لا يوجد سوى عدد قليل من شركات تصميم شرائح الذكاء الاصطناعي الجديدة التي ستدخل في هذا المجال. مجال المنتج لشركات الرقائق التقليدية. على سبيل المثال ، تتنافس Cambrian و Nvidia في سوق شرائح الخادم ، وتتنافس Horizon مع Nvidia و NXP في سوق شرائح القيادة المستقلة ، وتنشر بقية الشركات في سيناريوهات إنترنت الأشياء. على سبيل المثال ، Yunzhisheng ، التي توفر شرائح التعرف على الكلام ، Zhongxingwei ، التي توفر شرائح التعرف على الوجوه ، وتكنولوجيا Kine ، التي توفر شرائح حوسبة متطورة.

على الرغم من أن التقسيم الرأسي لوضع العمل لأشباه الموصلات مفيد لبقاء شركات تصميم الرقائق الخالصة ، إلا أنه من الصعب على شريحة واحدة تحقيق الوظائف المعقدة بمفردها. لذلك ، تبدأ بعض الشركات في تقديم خدمات تكامل الرقائق. تسمى المنتجات المتكاملة الأنظمة أو وحدات IC (الدوائر المتكاملة) ، ويسمى مجال الذكاء الاصطناعي أنظمة الذكاء الاصطناعي أو وحدات الذكاء الاصطناعي. بشكل عام ، ستوفر مؤسسات الذكاء الاصطناعي خدمات تكامل الخوارزميات والرقائق في نفس الوقت.غالبًا ما يشار إلى هذه المؤسسات باسم "موفري حلول الذكاء الاصطناعي" ، أو نظام تسليم المفتاح AI.

4.5 أنواع منتجات رقاقة AI

وفقًا لنوع المنتجات المتكاملة ، يمكن تقسيمها إلى فئتين ، وهما تكامل الأجهزة وتكامل البرامج. (1) تكامل الأجهزة: يسمى دمج الرقائق بوظائف مختلفة على نفس لوحة الدائرة (PCB) تكامل الأجهزة ، والذي سيشمل المعالجات الأساسية والمعالجات المشتركة (رقائق التسريع) والذاكرة وأجزاء أخرى. المنتج الأساسي لتكامل الأجهزة هو نظام مدمج ، ولكن الهدف النهائي هو دمج شرائح متعددة على شريحة واحدة لتشكيل نظام على شريحة ، أو نظام على شريحة ، كما هو موضح في الشكل 7.

(2) تكامل البرامج: وفقًا لاحتياجات الأجهزة المتكاملة أو تكامل البرامج البحت ، يقوم مهندسو البرمجيات بدمج البرامج المختلفة (البرامج) والبرامج الثابتة (البرامج الثابتة) في النظام الموجود على اللوحة أو النظام الموجود على الشريحة. نظرًا لأن صعوبة تصميم شرائح الذكاء الاصطناعي ليست عالية مثل تلك التي واجهتها وحدات المعالجة المركزية في الماضي ، ومن أجل زيادة القدرة التنافسية للصناعة ، بدأت شركات الذكاء الاصطناعي في الاندماج في اتجاه تصميم الشرائح بالإضافة إلى خدمات تكامل النظام المقدمة بأنفسهم. في الوقت نفسه ، من أجل تسريع هبوط المنتجات وتقليل صعوبة العثور على العملاء ، ستعمل شركات شرائح الذكاء الاصطناعي كشركات شرائح ومتكامل في نفس الوقت. نتيجة لذلك ، تُظهر الصناعة حاليًا تكاملًا ثنائي الاتجاه للذكاء الاصطناعي وصناعة الرقائق. يمكن لمتكامل نظام الذكاء الاصطناعي المتكامل أن يوفر للعملاء حلولاً أعلى وأسعارًا أقل واستهلاكًا أقل للطاقة.

4.6 المشاكل الموجودة

نظرًا لتعقيد تقنية تطوير شرائح النظام ، أصبحت فجوة المواهب هي المشكلة الأساسية. تشمل التقنيات الرئيسية لتصميم SoC ، على سبيل المثال لا الحصر ، العناصر الستة التالية: (1) تقنية هندسة الحافلات ؛ (2) تقنية إعادة استخدام جوهر IP ؛ (3) تكنولوجيا التصميم المشترك للبرامج والأجهزة ؛ (4) تقنية تحليل التوقيت ؛ (5) تكنولوجيا التحقق (6) تكنولوجيا تصميم القابلية للاختبار. تتضمن جميع التقنيات الرئيسية المذكورة أعلاه معرفة متعددة التخصصات ، وعملية التطوير معقدة ، بما يصل إلى 40 عملية. تتطلب كل عملية مهندسًا محترفًا لأداء العمل. تتطلب عملية التطوير التحقق المتكرر من التصميم قبل وبعد لتجنب انسداد الشريط خزي.

بالمقارنة مع تصميم رقاقة تسريع الذكاء الاصطناعي (ASIC) ، فإن تصميم النظام على الرقاقة (SoC) أكثر صعوبة في التصميم. وينعكس الفرق بين الاثنين بشكل أساسي في النقطتين التاليتين: أولاً ، يتطلب تصميم النظام على الرقاقة أفضل فهم تشغيل النظام بأكمله ، بحيث يمكن تعريف بنية الشريحة بشكل أكثر منطقية ، بحيث يمكن لتكامل البرامج والأجهزة تحقيق أفضل حالة عمل للنظام. ثانيًا ، يعتمد تصميم شرائح النظام على إعادة استخدام نوى IP ، ويعتبر تصميم الدوائر المتكاملة على نطاق واسع استنادًا إلى وحدات IP هو المفتاح لتحقيق شريحة النظام. باختصار ، يواجه فريق تصميم شرائح النظام أو شركة شرائح الذكاء الاصطناعي التي تم إنشاؤها بهدف شريحة النظام أولاً مشكلة الموهبة والاحتياطي الفني ، ثم تأتي مشكلة المتابعة.

4.7 تحليل هبوط رقائق الذكاء الاصطناعي

اليوم ، كل من السحابة والمحطة بهما شرائح AI على الأرض. من بينها ، الخوادم ، والهواتف المحمولة ، والمنازل الذكية ، والقيادة الذاتية هي سيناريوهات الهبوط الرئيسية. نظرًا لأن رقائق الذكاء الاصطناعي عبارة عن شرائح مخصصة للذكاء الاصطناعي أو تطبيقات التعلم العميق ، ودرجة التكامل بين الرقائق والخوارزميات عالية ، فستتم مناقشة تنفيذ رقائق الذكاء الاصطناعي وحجم السوق ذي الصلة في الأقسام التالية وفقًا لاستخداماتها ومواقع نشرها ، وسيناريوهات التطبيق.

على أساس تكنولوجيا الذكاء الاصطناعي ، فإن خوارزميات التعلم العميق لها غرضان للمستخدمين: "التدريب" و "التفكير". وذلك لأن خوارزميات التعلم العميق ، مثل الدماغ البشري ، تحتاج إلى تعلم كيفية إصدار الأحكام. تمامًا كما لو كان الناس يريدون ذلك لتكون قادرًا على التعرف على القطط والكلاب ، فعليهم أولاً أن يتعلموا فهم خصائص القطط والكلاب. لذلك ، عندما تنشر المؤسسات معدات ذكاء اصطناعي ، فإنها ستخضع أيضًا لتدريب على الخوارزمية / النموذج قبل تطبيقات الاستدلال. بشكل عام ، كما هو موضح في الشكل 8 ، سيتم نشر شرائح الذكاء الاصطناعي التي تؤدي مهام تدريبية فقط على السحابة والحافة ، بينما سيتم نشر شرائح الذكاء الاصطناعي التي تؤدي مهام الاستدلال على السحابة والحافة والمحطات ، ولديها نطاق أوسع من التطبيقات ، وذلك لأن الاستدلال يتطلب طاقة حوسبية أقل. يرتبط سيناريو التطبيق بنوع خوارزمية التعلم العميق.

تستخدم الرؤية الحاسوبية عادة الشبكات العصبية التلافيفية (CNN) لتدريب النماذج ، بينما تستخدم معالجة اللغة الطبيعية (NLP) الشبكات العصبية المتكررة (RNNs) لتدريب النماذج ، كما تستخدم رقائق الذكاء الاصطناعي بشكل أساسي في الرؤية واللغة. ومع ذلك ، بالمقارنة مع الخوارزميات القديمة مثل CNN و RNN ، تستمر خوارزميات التعلم العميق في التطور ، لذلك لا تقتصر تطبيقات الصناعة على النوعين المذكورين أعلاه من الخوارزميات. تمتلك كل شركة ذكاء اصطناعي خوارزمية فريدة خاصة بها ، وينطبق الشيء نفسه على شركات شرائح الذكاء الاصطناعي ، التي ستصمم شرائح الذكاء الاصطناعي وفقًا لخوارزمياتها المحسّنة.

4.7.1 سوق السحابة

مع تزايد الطلب في السوق السحابية ، فإن توقعات السوق لرقائق الذكاء الاصطناعي للخادم متفائلة. وفقًا لموقع نشر رقائق الذكاء الاصطناعي ، يمكن تقسيم سوق شرائح الذكاء الاصطناعي ببساطة إلى نوعين: السوق السحابية (الحافة مدمجة في السحابة) وسوق المحطة الطرفية. الصناعات التي تحتاج إلى الحوسبة السحابية هي بشكل أساسي الصناعة المالية ، صناعة الخدمات الطبية والتصنيع والتجزئة / البيع بالجملة وخمس صناعات رئيسية مثل الدوائر الحكومية.

وفقًا لبيانات IDC ، كما هو موضح في الشكل 9 ، فإن الطلب على الحوسبة السحابية ينمو بسرعة. في 2018-2019 ، سيؤدي الإنفاق العالمي على الحوسبة السحابية إلى زيادة كبيرة. حققت الصناعات الخمس الرئيسية نموًا بحد أدنى 17.3 وبحد أقصى 26.3 من بينها ، الصناعة الطبية الطلب هو الأعلى ، حيث يتجاوز 10 مليار دولار أمريكي. في الوقت نفسه ، وفقًا لبيانات IDC ، في الربع الثالث من عام 2018 ، وصلت شحنات معدات الخوادم العالمية إلى 3.2 مليون وحدة ، وبلغت الإيرادات أكثر من 23.4 مليار دولار ، ومن منظور معدل نمو الشحنات ، بلغت الإيرادات السنوية في عام 20181000. أكثر من 100 مليون دولار ، وهو ما يتجاوز بكثير عائدات 2017 البالغة 66.9 مليار دولار.

يمثل النمو السريع في الإنفاق على الحوسبة السحابية طلبًا قويًا على الحوسبة السحابية. الزيادة المستمرة في شحنات الخوادم تعني أيضًا أن الطلب على شرائح الذكاء الاصطناعي لنشر الخوادم قد ازداد أيضًا. يمكن ملاحظة أن سوق الرقائق السحابية سينمو بسرعة في المستقبل.

4.7.2 نهاية السوق

في سوق المحطات الحالي ، هناك سيناريوهان رئيسيان للهبوط ، أحدهما الهواتف الذكية والآخر أجهزة إنترنت الأشياء. تسمى الهواتف المحمولة أيضًا بالمحطات الطرفية المحمولة.في الهواتف الذكية ، تتمثل المهام الرئيسية لرقائق الذكاء الاصطناعي في معالجة الصور بعد التقاط الصور ومعالجة الصوت لمساعدة المساعدين الأذكياء. وفقًا لبيانات IDC ، تجاوزت شحنات الهواتف الذكية العالمية 1.4 مليار وحدة لمدة عامين متتاليين ، منها 3 من أكبر 5 شركات مصنعة في العالم هي شركات صينية .206 مليون ، و Xiaomi 123 مليون ، و OPPO 113 مليون.

بالإضافة إلى الهواتف المحمولة ، تعد إنترنت الأشياء أيضًا جزءًا مهمًا من السوق النهائي الحالي. وفقًا لبيانات IDC ، يتركز سوق إنترنت الأشياء بشكل أساسي في التطبيقات الصناعية ، حيث بلغ إجمالي التصنيع والنقل والمرافق العامة أكثر من 329 مليار دولار ، منها المنتجات الاستهلاكية (بما في ذلك المنازل الذكية والأجهزة القابلة للارتداء ومقصورات القيادة الذكية وما إلى ذلك) بلغت قيمتها 108 مليار دولار. إن تطبيق رقائق الذكاء الاصطناعي في منتجات إنترنت الأشياء له غرضان رئيسيان ، أحدهما عبارة عن شريحة AI مرئية ، والآخر عبارة عن شريحة صوت AI. ومع ذلك ، نظرًا للصعوبة الكبيرة في تطوير منتجات AI لمعالجة اللغة الطبيعية ، فإن شركات شرائح AI الجديدة يدخل السوق حاليًا ، إنه مشهد هبوط أجهزة الرؤية الحاسوبية ، مثل معدات الأمن المنزلي. وفقًا لبيانات IDC ، وصلت شحنات أجهزة الأمن المنزلي في سوق المنزل الذكي العالمي إلى 97.7 مليون وحدة ، كما تحتوي مكبرات الصوت الذكية أيضًا على 99.8 مليون جهاز ، وكلاهما سينمو بأكثر من 200 مليون بحلول عام 2022. بشكل عام ، يمكن أن يضمن تنفيذ إنترنت الأشياء في سيناريوهات المنزل الذكي وجود سوق بعشرات الملايين من المبيعات.

في المستقبل ، ستكون القيادة الذاتية سيناريو مهمًا آخر لتطبيقات الرقائق الطرفية. وفقًا لبيانات MARKLINES ، بلغت مبيعات السيارات في الصين 23.492 مليون في عام 2014 ، والتي نمت إلى 28.081 مليون في عام 2018. تعد سوق مبيعات السيارات في الصين التي تبلغ قيمتها عشرات الملايين من الجاذبية الشديدة للشركات التي تعمل على تطوير تكنولوجيا القيادة الذاتية. على الرغم من أن مبيعات السيارات في الصين قد وصلت إلى مبلغ 10 ملايين ، إلا أن مبيعات السيارات الكهربائية الحالية لا تزال أقل من 10 من إجمالي مبيعات السيارات.إن تطوير تكنولوجيا القيادة الذاتية هو في الأساس السيارات الكهربائية ، وسوق السيارات الكهربائية لديه الكثير من مجال للنمو.

ختاماً

في الوقت الحاضر ، لا يزال تطوير صناعة شرائح الذكاء الاصطناعي في بلدي في مهده. لفترة طويلة ، كانت الصين تلحق بالركب في تصميم معالجات CPU و GPU و DSP. تعتمد معظم شركات تصميم الرقائق على نوى IP الأجنبية لتصميم الرقائق ، وهو أمر مقيد إلى حد كبير في الابتكار المستقل. ومع ذلك ، فإن ظهور الذكاء الاصطناعي يوفر بلا شك فرصة ممتازة للصين لتحقيق تجاوز المنعطفات في مجال المعالجات. لا يزال التطبيق في مجال الذكاء الاصطناعي في مرحلة التطبيق الصناعي ، ولم يتم تشكيل الاحتكار البيئي حتى الآن ، ويتواجد مصنعو المعالجات المحليون والمنافسون الأجانب على نفس خط البداية في الساحة الجديدة للذكاء الاصطناعي. لذلك ، بناءً على التقنيات الناشئة وأسواق التطبيقات ، سيكون أمام الصين الكثير لتفعله في بناء نظام بيئي للذكاء الاصطناعي.

نظرًا للبيئة الخاصة والسوق في بلدي ، يُظهر تطوير رقائق الذكاء الاصطناعي المحلية حاليًا اتجاهًا للزهور المتفتحة ومئات المدارس الفكرية المتنافسة.توجد مجالات تطبيق رقائق الذكاء الاصطناعي أيضًا في العديد من المجالات مثل تداول الأسهم والتمويل ، التوصية بالسلع ، الأمن ، روبوتات التعليم المبكر والقيادة بدون طيار.عدد كبير من الشركات الناشئة في مجال الذكاء الاصطناعي ، مثل Beijing Horizon Information Technology Co.، Ltd. ، Beijing Shenjian Technology Co.، Ltd. ، Beijing Zhongke Cambrian Technology Co. ، المحدودة ، إلخ. على الرغم من ذلك ، لم تقم الشركات المحلية بتشكيل نطاق سوقي مثل الشركات الأجنبية الكبيرة ، ولكن بدلاً من ذلك لديها وضع تنموي متقطع. بالإضافة إلى الشركات الناشئة الناشئة ، أجرت المؤسسات البحثية المحلية مثل جامعة بكين وجامعة تسينغهوا والأكاديمية الصينية للعلوم أبحاثًا متعمقة في مجال رقائق الذكاء الاصطناعي ؛ بينما أجرت شركات أخرى مثل Baidu و Beijing Bitmain Technology Co.، Ltd. تعمل أيضًا بنشاط على نشر صناعة شرائح الذكاء الاصطناعي. من المتوقع أنه في المستقبل ، من يتقن النظام البيئي في مجال الذكاء الاصطناعي أولاً سوف يتقن المبادرة في هذه الصناعة.

المراجع YANN L C، CORTES C. قاعدة بيانات MNIST للأرقام المكتوبة بخط اليد .. TAIGMAN Y، YANG M، RANZATO M A، et al. Deep- Face: سد الفجوة أمام أداء المستوى البشري في التحقق من الوجه // مؤتمر IEEE حول رؤية الكمبيوتر والتعرف على الأنماط. IEEE، 2014: 1701-1708. Amazon Alexa. طرق الإنشاء باستخدام Alexa. https://developer.amazon.com/alexa. Apple Siri. يقوم Siri بعمل أكثر من أي وقت مضى ، حتى قبل أن تطلب. مساعد Microsoft Cortana الشخصي. Cortana. مساعدك الذكي طوال حياتك. https://www.microsoft.com/en-us/cortana. QUIGLEY M، CONLEY K، GERKEY B، et al. ROS: نظام تشغيل روبوت مفتوح المصدر // ورشة عمل ICRA حول البرامج مفتوحة المصدر .2009: 5. URMSON C، BAGNELL J A، BAKER C R، et al. سباق الترتان: نهج متعدد الوسائط لتحدي DARPA الحضري ، تقرير تقني ، جامعة كارنيجي ميلون ، 2007. SILVER D، HUANG A، MADDISON C J، et al. إتقان لعبة go مع الشبكات العصبية العميقة والبحث عن الأشجار. Nature، 2016، 529 (7587): 484-489. EMILIO M ، MOISES M ، GUSTAVO R ، وآخرون. Pac-mAnt: التحسين بناءً على مستعمرات النمل المطبقة على تطوير وكيل لـ Ms. Pac-Man // IEEE Symposium on Computational Intelligence and Games (CIG). IEEE، 2010: 458-464. CHEN T، DU Z، SUN N، et al.DianNao: مسرع صغير الحجم عالي الإنتاجية للتعلم الآلي في كل مكان // 128 المؤتمر الدولي للدعم المعماري للغات البرمجة وأنظمة التشغيل (ASPLOS). 2014: 269-284. CHEN Y، LUO T، LIU S، et al. DaDianNao: كمبيوتر عملاق للتعلم الآلي // 2014 الندوة الدولية السنوية السابعة والأربعون IEEE / ACM حول الهندسة المعمارية الدقيقة (MICRO). IEEE، 2014: 609-622. LIU D، CHENT، LIU S، et al. PuDianNao: مسرع التعلم الآلي متعدد التكافؤ // المؤتمر الدولي للدعم المعماري للغات البرمجة وأنظمة التشغيل (ASPLOS). 2015: 369-381. DU Z ، FASTHUBER R ، CHEN T ، وآخرون. ShiDianNao: تحويل معالجة الرؤية أقرب إلى المستشعر // الندوة الدولية حول هندسة الكمبيوتر (ISCA) .2015: 92-104. JOUPPI NP ، YOUNG C ، PATIL N ، وآخرون.تحليل أداء مركز البيانات لوحدة معالجة الموتر // الندوة الدولية حول هندسة الكمبيوتر (IS-CA). 2017: 1-12. KAPOOHT مخطط هندسة فون نيومان ، رفيق الابتكار في الحوسبة ، 257-259 ، https://en.wikipedia.org/wiki/Von_Neumann_architecture. FARABET C، POULET C، HAN J Y، et al. CNP: معالج قائم على fpga للشبكات التلافيفية // المؤتمر الدولي حول المنطق والتطبيقات القابلة للبرمجة (FPL) 2009: 32-37. FARABET C، MARTINI B، CORDA B، et al. Neu Flow: معالج تدفق بيانات قابل لإعادة التكوين لوقت التشغيل للرؤية // مؤتمر IEEE Computer Society حول ورش عمل رؤية الكمبيوتر والتعرف على الأنماط (CVPRW). IEEE ، 2011: 109-116. GOKHALE V، JIN J، DUNDAR A، et al. معالج مشترك متنقل 240 G-ops / s للشبكات العصبية العميقة // مؤتمر IEEE حول رؤية الكمبيوتر ورش عمل التعرف على الأنماط (CVPRW). IEEE، 2014: 682-687. نيومان ج ف.مبادئ آلات الحوسبة واسعة النطاق ، حوليات تاريخ الحوسبة ، 1981 ، 3 (3): 263-273. MEAD C. الأنظمة الإلكترونية Neuromorphic وقائع IEEE، 1990، 78 (10): 1629-1636. STRUKOV D B. تقنية النانو: اتصالات ذكية الطبيعة ، 2011 ، 476 (7361): 403-405. JEFF H، BLAKESLEE S. On Intelligence. London: Macmillan، 2007. BENJAMIN، VARKEY B، GAO P، et al. Neurogrid: نظام متعدد الرقائق تمثيلي رقمي مختلط للمحاكاة العصبية على نطاق واسع. إجراءات IEEE، 2014، 102 (5): 699-716. MEROLLA P A، ARTHUR J V، ALVAREZ-ICAZA R، et al. مليون دائرة متكاملة من الخلايا العصبية المتصاعدة مع شبكة اتصال وواجهة قابلة للتطوير العلوم ، 2014 ، 345 (6197): 668-673. CASSIDY A S، ALVAREZ-ICAZA R، AKOPYAN F. الحوسبة القشرية القابلة للتطوير في الوقت الحقيقي بسرعة 46 جيجا-متشابك OPS / واط مع تسريع ~ 100 في الوقت للحل و ~ 100،000 تقليل في الطاقة إلى الحل // SC '14: وقائع المؤتمر الدولي للحوسبة عالية الأداء والشبكات والتخزين والتحليل. IEEE ، 2014. FURBER S B، GALLUPPI F، TEMPLE S، et al. The spinnaker projec. Proceedings of the IEEE، 2014، 102 (5): 652-665. SCHEMMEL J ، BRIIDERLE D ، GRIIBL A ، وآخرون.نظام الأجهزة العصبية الشكل الرقيق للنمذجة العصبية واسعة النطاق // وقائع ندوة IEEE الدولية لعام 2010 حول الدوائر والأنظمة IEEE ، 2010. LECUN Y، BENGIO Y، HINTON G، et al. التعلم العميق. Nature، 2015، 521 (7553): 436-444. KELLER J ، PEREZ O. تحسين MCTS واتصالات الشبكة العصبية في الكمبيوتر. معهد ورسستر للفنون التطبيقية ، 2016. ZHANG S J، DU Z D، ZHANG L، et al. Cambricon- X وهو مسرع للشبكات العصبية المتفرقة. الندوة الدولية السنوية التاسعة والأربعون IEEE / ACM حول الهندسة المعمارية الدقيقة (MICRO) لعام 2016. KOWALIK J S. الحوسبة الموازية وأجهزة الكمبيوتر للذكاء الاصطناعي. Springer Science and Business Media ، 2012. VERHELST، M، MOONS B. خوارزمية معالجة الشبكة العصبية العميقة وتقنيات المعالج تجلب التعلم العميق لأجهزة إنترنت الأشياء والأجهزة المتطورة. مجلة IEEE Solid-State Circuits ، 2017 ، 9 (4): 55-65. JOUPPI N P ، YOUNG C ، PATIL N ، وآخرون.تحليل أداء مركز البيانات لوحدة معالجة الموتر. الندوة الدولية الرابعة والأربعون حول هندسة الكمبيوتر (ISCA) ، 2017. SZE V، CHEN Y H، YANG T J، et al. المعالجة الفعالة للشبكات العصبية العميقة برنامج تعليمي ومسح وقائع IEEE، 2017، 105 (12). ستصبح الهواتف الذكية BENNIS M. أكثر ذكاءً مع التعلم الآلي على الجهاز. IEEE Spectrum ، 2018. https://spectrum.ieee.org/tech-talk/telecom/wireless/smart-phones-will-get-even-smarter-with - التعلم الآلي للجهاز. MAASS W. شبكات العصبونات المتصاعدة: الجيل الثالث من نماذج الشبكات العصبية ، الشبكات العصبية ، 1997 ، 10 (9): 1659-1671. MEAD C. نظام الإلكترونيات العصبية. وقائع IEEE، 1990، 78 (10): 1629-1636. PAINKRAS E، PLANA L A، GARSIDE J، et al. SpiNNaker: 1- نظام W 18- على شريحة لمحاكاة الشبكة العصبية المتوازية على نطاق واسع. IEEE Journal of SolidState Circuits Page (s)، 2013، 48 (8) : 1943-1953. BENJAMIN B V، GAO P، MCQUINN E، et al. Neu- rogrid نظام رقمي متعدد الرقائق مختلط تناظري أو محاكاة عصبية واسعة النطاق وقائع IEEE، 2014، 102 (5): 699-716. MEROLLA P A، ARTHUR J V، ALVAREZ-ICAZA R، et al. مليون دائرة متكاملة من الخلايا العصبية المتصاعدة مع شبكة اتصال وواجهة قابلة للتطوير العلوم ، 2014 ، 345 (6197): 668-673. DAVIES M ، SRINIVASA N ، LINT H ، وآخرون. Loihi ، معالج متعدد النواة مع التعلم على الرقاقة. IEEE Micro ، 2018 ، 38 (1): 82-99. KIM S. NVM نواة عصبية مع 64 k- خلية (256 256) صفيف متشابك للذاكرة متغيرة الطور مع دوائر عصبية على الرقاقة للتعلم المستمر في الموقع // اجتماع الأجهزة الإلكترونية الدولية IEEE (IEDM). IEEE ، 2015. CHUM ، KIM B ، PARK S ، وآخرون. نظام الأجهزة العصبية للتعرف على الأنماط المرئية مع مجموعة memristor وخلايا CMOS. معاملات IEEE على الإلكترونيات الصناعية ، 2015 ، 62 (4): 2410 - 2419. SHI LP، PEI J، DENG N، et al. تطوير نظام الحوسبة العصبية // اجتماع الأجهزة الإلكترونية الدولية IEEE (IEDM). IEEE ، 2015. JIANG Y N، HUANG P، ZHU، D B، et al. تصميم وتنفيذ الأجهزة للأنظمة العصبية مع المشابك RRAM. معاملات IEEE على الدوائر والأنظمة I: الأوراق العادية ، 2018 ، 65 (9): 2726-2738. YU S M، CHEN P Y. تقنيات الذاكرة الناشئة: الاتجاهات والآفاق الحديثة. وقائع IEEE ، 2016 ، 8 (2): 43-56. أجهزة SURI M. CBRAM كمشابك ثنائية للأنظمة العصبية العشوائية منخفضة الطاقة: تطبيقات المعالجة المعرفية السمعية والبصرية // وقائع اجتماع IEEE الدولي للأجهزة الإلكترونية (IEDM) ، 2012: 3-10. WANG Z. Memristors مع ديناميكيات انتشارية كمحاكيات متشابكة للحوسبة العصبية.مواد الطبيعة ، 2017 ، 16 (1): 101-108. YANG J J ، STRUKOV D B ، STEWART D R. أجهزة Memristive للحوسبة. Nature Nanotechnology ، 2013 ، 8 (1): 13-24. JO S H. Nanoscale memristor device as synapse in neuro-morphic systems. Nano letter، 2010، 10 (4): 1297-1301. OHNO T. 2011 ، 10 (8): 591-595. WANG، Z R، JOSHI S، SAVELEV S E، et al. Memristors ذات الديناميكيات المنتشرة كمحاكيات متشابكة للحوسبة العصبية. Nature Materials، 2017، 16 (1): 101-108.

المصدر: Ren Yuan، Pan Jun، Liu Jingjing، et al. تقدم البحث في رقائق الذكاء الاصطناعي. Micro-nano Electronics and Intelligent Manufacturing، 2019، 1 (2): 20-34.

REN Yuan، PAN Jun، LIU Jingjing، et al. نظرة عامة على تطوير شرائح الذكاء الاصطناعي. Micro / nano Electronics and Intelligent Manufacturing ، 2019 ، 1 (2): 20-34.

إصدار "Micro-Nano Electronics and Intelligent Manufacturing": CN10-1594 / TN

المشرف: شركة Beijing Electronics Holdings Co.، Ltd.

الراعي: معهد بكين لمعلومات العلوم والتكنولوجيا الإلكترونية ، شركة Beijing Fanglue Information Technology Co.، Ltd.

العمل من المنزل، وأنا أذهب إلى العمل متعب أيضا من كنت تعتقد ذلك؟

وزارة الدعاية التعليم 200 الحادي عشر مفتشي الدولة، و 300 خاص المشرف التعليم قائمة Nipin

أهنئ! 7 حصل خريجو جامعة بكين على جائزة سلون للأبحاث

بطاريات الحالة الصلبة، والطب عمياء لتعزيز صناعة الطاقة الجديدة

سوف بورش دفع السيارات الصغيرة منخفضة التكلفة؟ ربما كنت ترغب ليست هي نفسها

تحت الوباء، لماذا لا تحذو حذو دائرة سيارة "البائعين Hengda"؟

لجلب سيارة "قناع N95"، أوو قتال طويل ضد السارس ما زال يدفع خمسة الصفقة الجديدة

وباء لا يمكن أن يكون ذريعة لتأخير تنفيذ أسعار السيارات الوطنية الست

مرسيدس بنز في استكشاف أعلى خمسة فقدت يوي في المركز الثاني، SUV الجانب قائمة كاملة في يناير

طلاب مدرسة الأوسط مقدما، "جامعة تسينغهوا"

5 Q جيلي الهندسة C: ما هو مستوى من دون طيار L4 يمكن القيام به؟

تعليق الفصول الدراسية والتعلم المستمر ، فلنستمع إلى الرسائل الدافئة لهؤلاء المدراء