[اعتراف التيتانيوم] Geling Deep Deep Deng Yafeng: كيف تجعل الآلة ترى المزيد والمزيد؟

بعد "Let the Machine يفهم صوتك" ، دعا Confession Titanium ستة عملاء من التيتانيوم لمناقشة كيفية السماح للجهاز بفهم العالم. بناء على هذه المقالة دنغ يافنغ ، نائب الرئيس المشاركة والتشطيب في اعتراف التيتانيوم.

لدى Deng Yafeng 15 عامًا من الخبرة في مجال البحث والتطوير في الذكاء الاصطناعي ، وخاصة رؤية الكمبيوتر ، نشرت أكثر من عشر أوراق ، وحصلت على 95 ترخيص براءات الاختراع. لقد كان عالماً في معهد أبحاث التعلم العميق في بايدو ، حيث قاد الفريق إلى تطوير الكشف الأول عن الوجه في العالم ، وخوارزمية التعرف على المواجهة ، وطور الخوارزميات والأنظمة لخدمة 100 مليون من منتجات المستخدمين. Guling Deep Pupil عبارة عن منتج للبيانات ومزود حلول بالفيديو. إنه ملتزم بتطبيق رؤية الكمبيوتر وتكنولوجيا التعلم العميق على مجال الأعمال.

فيما يلي اعتراف دنغ يافينغ في التيتانيوم:

مرحبًا بالجميع ، الموضوع الذي شاركته الليلة هو "كيفية جعل الماكينة ترى المزيد والمزيد؟"

دعونا نقدم بإيجاز. تأسس مؤسس شركة Guling Deep Deep من قبل المؤسس تشاو يونغ في بكين في أبريل 2013. وهي شركة لها تكنولوجيا رؤية الكمبيوتر ، وتكنولوجيا التعلم العميق ، وقدرات الأبحاث والتطوير على الأجهزة المدمجة. الأمن ، مثل الأمن ، في نفس الوقت ، الشركة كما يوجد في التصميم العمق في الطائرات بدون طيار والروبوتات والرعاية الطبية الذكية.

الأهداف البحثية واتجاهات التطبيق لرؤية الكمبيوتر

يعلم الجميع أن الرؤية هي الطريقة الأكثر أهمية بالنسبة لنا للحصول على المعلومات. في الرؤية ، والسمع ، والرائحة ، والمس ، والذوق ، تكون نسبة معلومات القبول البصري حوالي 80 ، ونحن في وضع رائد مطلق.

في عام 1966 ، كان هناك رائد في مجال الذكاء الاصطناعي المسمى Marvin Minsky. لقد كان مدرسًا في معهد ماساتشوستس للتكنولوجيا. لقد نشر عملًا مثيرًا للاهتمام "ربط كاميرا بجهاز كمبيوتر والحصول الصينية هي "دع الكمبيوتر يفهم العالم". في ذلك الوقت ، كان يعتقد أن هذه مهمة جامعية في عطلة صيفية. ومع ذلك ، لأكثر من 50 عامًا ، بعد جهود عدد لا يحصى من الزملاء الأكاديميين والصناعيين ، وجدنا أن رؤية الكمبيوتر لا تزال حارة ساخنة للغاية ولكنها ليست ناضجة حقًا.

بالنسبة لأنظمة رؤية الكمبيوتر ، فإن الإدخال هو في الواقع مستشعر بصري ، بما في ذلك أجهزة استشعار RGB أكثر شيوعًا ، وكذلك أجهزة استشعار أخرى مثل العمق (العمق) و LIDAR (LIDAR). بعد أن يتلقى نظام رؤية الكمبيوتر إدخال إشارة ، يكون إخراج العالم هو إخراج ، وهو فهم للعالم. هذا هو في الواقع هدف رؤية الكمبيوتر جوهر

في عصر اليوم ، هناك العديد من الاتجاهات الجديدة في مجال رؤية الكمبيوتر. والأهم من ذلك هو النمو المتفجر للتطبيقات. بالإضافة إلى الهواتف المحمولة ، وأجهزة الكمبيوتر الشخصية والاختبارات الصناعية ، ظهرت تكنولوجيا رؤية الكمبيوتر في مجالات الأمن الذكي والروبوتات والقيادة المستقلة والرعاية الطبية الذكية والطائرات بدون طيار والواقع المعزز (AR). وشرت رؤية الكمبيوتر في عصر النمو المتفجر.

التحديات والفرص التي تواجه تكنولوجيا رؤية الكمبيوتر

  • تحدي

بالنسبة لرؤية الكمبيوتر ، على الرغم من أنها خضعت لستين عامًا من التطوير ، إلا أنه لا يزال هناك عدد قليل من التطبيقات الناضجة الكبيرة الناضجة ، مثل التعرف على بصمات الأصابع ، أو التعرف على لوحة الترخيص ، أو بعض تقنيات اكتشاف الوجه في الكاميرات الرقمية. السبب الكبير هو قيود التكنولوجيا. في السنوات الأخيرة ، مع تطبيق التعلم العميق في مجال الرؤية ، تم تحسين العديد من التقنيات بشكل كبير ، لكننا نجد أننا ما زلنا نواجه العديد من التحديات التقنية.

على سبيل المثال ، ILSVRC2016 (أي ، مسابقة ImageNet التي ذكرناها غالبًا ، إنها واحدة من أهم المسابقات في المجال المرئي ، والتي ستعقد مرة واحدة في السنة) الكشف عن الكائنات كمثال. ما سبق يعني أن الكمبيوتر يعطي تلقائيًا مربع مستطيل الحافة الخارجي لمختلف الكائنات في الصورة. يبلغ متوسط معدل الدقة لهذه النتيجة حوالي 66 . تمثل هذه النتيجة في الواقع أعلى مستوى في العالم ، لكننا نعرف هذه النتيجة ، لا يمكن استخدامه إلا لبعض السيناريوهات التي ليست عالية بشكل خاص للدقة ، وهي بعيدة عن الوصول إلى درجة التطبيق الكبير. جوهر

في الوقت نفسه ، على مستوى التطبيق ، ما ندركه في النهاية هو قيمة المستخدم. من ناحية ، لا يكفي أن تكون التكنولوجيا المرئية. ناضجة لاستخدامها. يرجع ذلك بالتحديد إلى التكنولوجيا البصرية غير الناضجة وغير الكاملة التي يجب دمجها مع التقنيات الأخرى. يجب دمجها مع تطبيق المنتج لجعل التكنولوجيا المرئية تولد حقًا قيمة التطبيق جوهر

خلاصة القول ، حتى بعد 60 عامًا من العمل الشاق ، ما زلنا على الطريق ، ولم نحقق الهدف حقًا.

  • فرصة

الفرص التي واجهها في مجال رؤية الكمبيوتر في السنوات الأخيرة هي:

أولاً ، لقد بدأ مجال رؤية الكمبيوتر بأكمله في الاهتمام والاستثمار غير المسبوق. تأتي هذه المخاوف من رأس المال الاستثماري وشركات الإنترنت والشركات التقليدية ، ولكنها تجذب أيضًا اهتمامًا غير مسبوق من حكومة الولاية ، وحتى الأشخاص العاديين بدأوا في الانتباه إلى هذا المجال ومناقشته. هذه المخاوف والاستثمار المتتالي ستعزز حتما التقدم التكنولوجي وتطوير التطبيقات في هذا المجال.

ثانياً ، يقدم التطبيق في مجال رؤية الكمبيوتر اتجاه نمو متفجر. لقد ذكرنا للتو أن هناك العديد من تطبيقات رؤية الكمبيوتر في مجالات مراقبة الأمان ، والقيادة العالية الأتمتة ، والواقع المعزز ، والصور الطبية ، والرؤية الصناعية الآلية ، والإنترنت المتنقل. البيانات الضخمة التي تم إنشاؤها في هذه التطبيقات ستعزز رؤية الكمبيوتر على التطوير المعدل من التكنولوجيا ، والمزيج من التكنولوجيا والتطبيق سوف يعزز أيضا نضج التكنولوجيا.

ثالثًا ، فيما يتعلق بالمنظور العالمي ، فإن الصينيين لدينا في وضع رائد في مجال رؤية الكمبيوتر من حيث التأثير الأكاديمي والشركات الناشئة. إنها فرصة كبيرة تواجه الصين في المستقبل.

باختصار ، بالنسبة لأولئك منا الذين يقومون برؤية الكمبيوتر ، هذا هو أفضل عصر رؤية الكمبيوتر.

كيف تجعل الماكينة ترى المزيد والمزيد؟

  • كيف تجعل التعلم العميق والبيانات تشكل دورة حميدة؟

إذا كنت قد تعلمت دورة تسمى "التعرف على النماذج" ، فسيخبر القسم الأول عملية معالجة أساسية ، والتي تتضمن ثلاثة جوانب -التحضير ، واستخراج الميزات ، وتعلم البيانات الأصلية. يمكن تقسيم استخراج الميزة إلى ثلاث وحدات: المعالجة المسبقة ، واستخراج الميزات ، واختيار الميزات. الميزة الأكثر وضوحا في هذا هي أنه في هذه العملية ، فإن الخصائص والتعلم هما الجزءان من الفصل. هذه طريقة التعرف على الوضع التقليدي. وبعبارة أخرى ، إنها عملية التعرف على الصور المرئية التقليدية للكمبيوتر. في عصر التعلم العميق ، ما هو الفرق الأكبر؟ أي يمكننا دمج الميزات والتعلم في التعلم المميز إنها عملية استبدال المعالجة المسبقة الأصلية ، والاستخراج المميز واختيار الميزات ، وعملية التعلم بناءً على خصائص التعلم العميق. هذا في الواقع تقدم كبير.

أكبر فائدة من هذا التقدم هي أن الخصائص الأصلية تم تصميمها من قبل مجال الحقل وفقًا لفهمه للحقل. بالنسبة للكائنات المختلفة مثل لوحات الوجه والترخيص ، استخدموا خصائصتين مختلفتين. من ناحية ، يجب إجراء طريقتان للوجوه أو لوحات الترخيص. من ناحية أخرى ، تعتمد هذه الميزة نفسها على فهم البيانات. بالإضافة إلى تصوير جيد وبيانات ، فإن القدرة الأسية النهائية ليست قوية بشكل خاص ، مما يحد من أداء الخوارزمية. في عصر التعلم العميق ، تعتمد الخصائص تمامًا على قيادة البيانات. للتعلم من الناس أو للأشخاص أو السيارات ، قد تكون متشابهة جدًا أو حتى من حيث الهندسة المعمارية أو الطريقة. إنها أنيقة للغاية. في الوقت نفسه ، لأن هذه الميزة تعلمها البيانات ، وهو طبقة من التمثيل غير الخطي ، يمكن إضافة هذه الطبقة بشكل مستمر ، لذلك قد يكون من المريح للغاية الحصول على تمثيل قوي للغاية للبيانات جوهر هذه في الواقع أكبر ميزة للتعلم العميق.

في الواقع ، 2012 هي عقدة للتعلم العميق في مجال رؤية الكمبيوتر. على الرغم من أنه منذ عام 2006 ، تم تطبيق التعلم العميق من حيث التعرف على الصوت ، في ذلك الوقت ، كان الجميع يشككون في مجال رؤية الكمبيوتر لأن الجميع شعروا أنه ليس لديه توضيح. لكن التأثير الحقيقي هو أنه في عام 2012 ، جعل هينتون ، أحد منشئ التعلم العميق ، أن طالبه أليكس قد وصلت أخيرًا إلى 15 في مسابقة ImageNet. في عام 2011 ، كان حوالي 25 من معدل الخطأ ، بانخفاض قدره 10 ، وفي عام 2010 ، كان معدل الخطأ حوالي 30 .

في عصر الأساليب التقليدية ، يكون الانخفاض في معدل الخطأ السنوي صغيرًا جدًا ، و بعد استخدام التعلم العميق حقًا ، وجد الجميع أن الانخفاض في معدل الخطأ أصبح سريعًا جدًا. 201220132014

PCA1991LFWLabeled face in the wild40%20137%2020147%3%50%201510

GPU

PASCAL VOC2007ImageNet100

learning of representation

  • depth

RGBRGBdepthRGBDRGBD3D

RGB2D2DRGB

depth proposal جوهرdepth3DRGBproposalproposal

depth

RGB3D2Ddepth sensorRGB

ATMdepth sensordepth

sensor

لهذا السبب ، أجرينا أيضًا سلسلة من التجارب ، وسأشاركك هذه النتائج. نستخدم كاميرا SLR لتحليل دقة الوجه للوجه عندما يكون الوجه مختلفًا عن الكاميرا على مسافات مختلفة. في الصورة الأولى ، يبعد الشخص على بعد حوالي عشرة أمتار من الكاميرا. في هذا الوقت ، يكون الدقة على الوجه حوالي 36 36. في الصورة الثانية ، يبعد الأشخاص على بعد حوالي 20 مترًا من الكاميرا ، ودقة الوجه حوالي 18 18. في الصورة الثالثة ، عندما يكون الشخص على بعد حوالي 30 مترًا من الكاميرا ، يكون معدل التعرف على الوجه حوالي 12 12. باختصار ، في هذه الخرائط الثلاث ، يظهر تغيير دقة الوجه للوجه على مسافات مختلفة أنه عندما يكون الأشخاص حوالي 30 مترًا ، يمكن الحكم على الدقة على الوجه فقط أن هذه صورة لورقة واحدة. الوجه ، لكنه لم يستطع معرفة من كان على الإطلاق. هذا هو موقف SLR. بالنسبة لكاميرا المراقبة العادية 1080 بكسل ، لا يمكن الاعتراف بها إلا على مسافة ثلاثة أو خمسة أمتار ، ومن الصعب تحديدها قدر الإمكان.

من أجل التحقيق في تأثير حل الوجه البشري على معدل التعرف على الوجه ، نشير إلى أوراق عامة. تستخدم هذه الورقة نموذج VGG كلاسيكي للتعبير عن الوجوه البشرية ، ثم دراسة معدل التعرف على الوجوه البشرية حول انخفاض في حل الوجه. في الصورة التالية ، يكون المحور الأفقي هو الدقة ، من 0 ، 25 ، 50 ، 75 إلى 100 إلى 250 بكسل. المحور العمودي هو دقة التحقق من الوجه (الحساب). سيكون له تأثير كبير على الدقة. على سبيل المثال ، عندما يصل دقة الوجه إلى 50 ، يكون معدل الدقة هذا حوالي 80 فقط. إذا وصل إلى 25 بكسل ، فإن معدل الدقة هو أكثر من 70 فقط. عندما يكون حل الوجه البشري أكثر من 100 بكسل ، يمكن أن تصل الدقة إلى حوالي 95 . تتحقق هذه التجربة من حل الصور للتعرف على الوجه من الجانب. وليس فقط دقة الصورة ، في حالة الضوء المنخفض ، ستصبح جودة الوجه والضوضاء للوجه سيئة.

لذا فإن الفكرة البديهية هي أننا نريد تحسين حل الأهداف. ولكن في الواقع ، اكتشف الجميع أن هذا كان متناقضًا. هذا هو ، إذا كنا نريد أن نرى على نطاق أوسع ، نحتاج إلى كاميرا ذات زاوية واسعة نسبيًا ، ولا يمكن رؤية هذه الكاميرا الواسعة ذات الزاوية الواسعة إلا قريبة جدًا. على سبيل المثال ، يمكننا أن نرى كائنات على بعد ثلاثة أو خمسة أمتار. من ناحية أخرى ، إذا أردنا أن نرى بعيدًا ، فيمكننا فقط استخدام كاميرا منظور ضيقة للغاية. وبهذه الطريقة ، يمكننا أن نرى المنظور بعيدًا ولكن لا يمكننا إلا أن يغطي عشرات الرؤية. كوان ويوان غير متاحين.

فكرة أخرى هي تحسين دقة الكاميرا. هذا أمر ممكن نظريًا. يمكن أن تحقق كاميرا دقة 4K مجموعة من 10 أمتار ويمكن أن تحقق 7K 20 مترًا. ولكن في الموقف الفعلي ، من الصعب للغاية القيام به ، لأن زيادة دقة الكاميرا ستزيد من كمية البيانات ، مما سيزيد من تكلفة المستشعر. بالإضافة إلى ذلك ، سيؤدي ذلك أيضًا إلى ضغط كبير على نقل الشبكة وتخزينها جوهر لذلك ، هذه الفكرة ليست ممكنة في الهندسة.

عندما نفكر في هذه المشكلة ، فإن عيون الناس مستوحاة من العيون. لعيون الناس ، هناك في الواقع شعور واضح ومعرفة. هذا الشعور يمكن أن نطلق عليه ببساطة الاستشعار ، أي الحصول على المعلومات ، ثم ما تعرفه هو مفهومة ، يسمى أيضًا فهم المعلومات. يمكن فهم إدراك الصورة لفترة وجيزة على أنه تكوين الوحدات النمطية لجمع الصور وفهم الصور. هاتان الوحدات النمطتان هي في الواقع عملية ديناميكية للتفاعل.

لذلك ، تشمل المنتجات التي صممناها أيضًا وحدتين: الوحدة الأولى هي عملية محاكاة جمع العين البشرية ، والوحدة الثانية هي عملية محاكاة فهم صورة العين البشرية. بالنسبة لنظامنا ، الأول هو جزء لجمع الصور. بعد ذلك ، يتم استخدام عملية فهم الصورة. على سبيل المثال ، نعتمد طريقة للكشف عن الكائنات بناءً أو جسم الإنسان أو جسم الإنسان أو عندما نفهم هذا المشهد ، سيتم تغذية الوحدة النمطية التي تعرف مرة أخرى للتحكم في جزء من مجموعة جمع الصور. عملية الحصول على فهم أفضل للكائنات في المشهد والحصول على صور عالية الجودة تم الحصول عليهم. بالنسبة للأشياء خارج 50 مترًا ، فهو في الأساس وضع غير واضح في الكاميرات التقليدية. في الكاميرا الخاصة بنا ، يمكننا أن نكون واضحين للغاية ، مثل نتيجة دقة 100 إلى 200 بكسل ، وهي ضخمة للنظام بأكمله. في النهاية ، يمكن أن تزيد منتجاتنا من الدقة الفعالة للكائنات المهتمة بما يعادل حوالي 100 مرة.

يسمى هذا المنتج FoveAcam ، مثل خريطة رأس المقالة.

ميزات هذا المنتج: أولاً ، يمكنك رؤية هدف طويل -يمكنك أيضًا تحقيق تأثير إغلاق التعريف العالي على المسافة الطويلة. على سبيل المثال ، على مسافة 50 مترًا ، يمكنك الحصول الوجه. 70 ، المشاة ، يمكن للسيارات أن تدعم جميعها. تحتوي هذه الكاميرا على وحدة كاملة ومعرفة ، ويمكن تنفيذها وتفاعلها في نظام مضمن ، ومحاكاة مبدأ العيون البشرية. يوضح الشكل التالي بعض النتائج عند قياسه. من بينها ، صفين من الصور على الجانب الأيمن ، والجانب الأيسر هو صورة الهدف في الكاميرات العادية ، والجانب الأيمن هو تأثير الكاميرا لدينا.

قمنا بقياس تأثير هذا المنتج مع محرك التعرف على وجهنا. في أكتوبر 2016 ، كنا المرة الأولى التي ننشر فيها المنتج الجديد لكاميرا العين البشرية في ذلك الوقت ، ودعينا حول العشرات من مراسلي وسائل الإعلام إلى شركتنا. وبدون الظروف التي لم يلاحظوا فيها وجههم أمسك به في قاعدة بيانات الخلفية لدينا ، ثم طلبوا من الجميع إطلاق النار على وجوههم بوجه كاري للمقارنة في الكاميرا. كان معدل التعرف على النتائج 100 . لقد فوجئ الجميع بأنهم لا يعرفون أنهم قد تم تصويرهم سراً. في ذلك الوقت ، اشتكت العديد من السيدات من أن تأثيرك لم يكن جيدًا بما يكفي بينما لم أكن قد اهتمت بتأثير الالتقاط.

  • الاقل هو الاكثر

إن مجال الذكاء الاصطناعي بأكمله كبير جدًا ، ورؤية الكمبيوتر بأكملها كبيرة جدًا أيضًا. على سبيل المثال ، هناك الآلاف من فئات التعرف على الصور التي يمكنها حتى تحديد عشرات الآلاف من الفئات. بالنسبة لبدء التشغيل ، أعتقد أن ما يجب أن أفعله يجب أن يركز. الهدف الرئيسي من تلاميذ Guling العميق في مجال الحقول البصرية هو الوجه والجسم البشري والسيارات.

السبب بسيط نسبيًا: الأول بسبب تقنية التعرف على الصور العامة ، والتي يصعب نضجها على المدى القصير. هذه الأشياء لبدء التشغيل ، من الضروري مناقشة هذه الأشياء. لأنه إذا لم تكن هناك طريقة لتوليد قيمة عمل ، فهي مضيعة للشركات الناشئة ؛ والثانية هي أنه من وجهة نظر القيمة ، نجد أنه في المجتمع الحقيقي ، فإن الأشياء الأكثر شيوعًا هي اثنين ، والآخر شخص ، والآخر هي سيارة ، والآخر سيارة. والسيارة هي في الواقع إنسانية خلف السيارة ، ويمكن تقسيم الناس إلى أهم هدفين لجسم الإنسان والوجه البشري. تعد جسم الإنسان والوجه والسيارات أكثر الأشياء شيوعًا والأكثر قيمة في المجتمع الحقيقي ؛ والثالث هو من منظور إعادة استخدام التكنولوجيا. جسم الإنسان والوجه والسيارات جامدة. إنها أيضًا أسهل تقنية.

اسمحوا لي أن أقدم بإيجاز استكشافنا والعمل في هذا الصدد.

في مجال المدن الذكية ، بينغ مدينة ، والسلامة الوطنية ، والسلامة العامة ، والنقل الذكي ، أنشأنا العديد من الكاميرات. تستخدم بيانات الكاميرا هذه حاليًا لتخزينها وعرضها. إذا كنت تريد فهم ما حدث ، أو تريد للعثور تلقائيًا على واحدة معينة للعثور تلقائيًا على سيارات واحدة مستهدفة أو أشخاص يعتمدون بشكل أساسي على العمليات اليدوية. لقد صنعنا نظام تحليل البيانات الضخمة التي يمكنها إكمال التقاط وتحديد واسترجاع السيارات تلقائيًا. لا يشمل تحديد السيارة ليس فقط تصنيف أنواع المركبات ، مثل تصنيف السيارات/السيارات/الشاحنات الكبيرة ، وتحديد رقم لوحة الترخيص ، وتحديد العلامة التجارية الرئيسية/العلامة التجارية الفرعية. على سبيل المثال ، العلامة التجارية الرئيسية هي Audi the Sub -Brand هي A6 ، والتي يمكن أن تشمل أيضًا السنة. بالإضافة إلى ذلك ، فإنه يشمل أيضًا تحديد لون الجسم ، و Sunshade ، وصندوق الأنسجة الورقية ، وقلادة صغيرة ، إلخ.

يحتوي نظامنا على عدة خصائص. الأول هو أن ذيل السيارة هو التعرف على الطريقين. هناك حاجة إلى نموذج واحد فقط بدون تبديل يدوي ؛ والثاني يجب الاعتراف به خلال النهار والليل ؛ والثالث هو زاوية تحديد الهوية دعم لحوالي 25 درجة إيجابية وسلبية ؛ رابع ، يمكن للعلامات التجارية للمركبات دعم أكثر من 4000 نوع. في بعض التطبيقات الحديثة ، وجدنا أنه في المساء ، حتى لو كانت السماء مظلمة للغاية وأن الأضواء رائعة للغاية ، يمكن أن يصل اكتشاف السيارة والتقاطها إلى ما يقرب من 100 من معدل الالتقاط.

بالإضافة إلى السيارة المذكورة أعلاه ، فإن الأشخاص هم أيضًا أشياء نشعر بالقلق الشديد. لقد قمنا بالكثير من العمل في جسم الإنسان ، بما في ذلك الكشف والتتبع ، بما في ذلك تحليل السمات ، وشملنا أيضًا بعض المهام ذات الصلة بـ REID البشرية ، أي الصورة البشرية تستخدم للبحث عن صور بشرية أخرى لنفس الشخص. أعلاه ، يتم تحقيق أفضل النتائج في العالم حاليًا. لن أخوض في التفاصيل هنا.

الحديث عن هذه ، هناك هدف آخر عليك ذكره ، وهو الوجه. في اعتراف التيتانيوم السابق ، استكشف الجميع الكثير من المحتوى في هذا الصدد. لقد كنت معترفًا بالوجه منذ عام 2002 ، وقد مر حوالي 15 عامًا. الوجوه هي أكثر ما نراه في حياتنا. تشمل تقنية الوجه الكشف عن الوجه ، والتتبع ، وتحديد المواقع ، والاعتراف. يقوم العديد من الأصدقاء في الصناعة أيضًا بهذه المقالة. بالنسبة لتلاميذ غولين العميقين ، لدينا توقع للاعتراف بالوجه. لا أعرف ما إذا كنت قد شاهدت فيلمًا يسمى "Speed and Passion 7". لقد ذكرت هنا نظامًا يسمى Skynet. يمكن لهذا النظام التسلل إلى أي كاميرا للعثور عليه من خلال طريقة التعرف للعثور على طريقة الناس. هذا يمثل في الواقع الخيال الأكثر مثالية للاعتراف بوجهنا لهذه التكنولوجيا ، وقد عملنا بجد لهذا الهدف. ما أريد التأكيد عليه هو أن التعرف على الوجه ليس مجرد مشكلة في الخوارزمية ، لذلك صنعنا كاميرات العين البشرية. نحن نصدق ذلك التعرف على الوجه يريد أن يكون كبيرًا وعمليًا حقًا ، إنه حل كامل يجمع بين البرامج والأجهزة جوهر إذا لم تقم بتغيير جزء جمع الصور الأمامي ، فما عليك سوى القيام بالخوارزمية ، حتى لو كان التعلم العميق ، على افتراض أنه لا يوجد سوى عشرة بكسلات تم التقاطها ، فإن هذه المعلومات لا تكفي للإشارة إلى الفرق بين الناس ، في خوارزمية البرامج ، خوارزمية البرامج بغض النظر عن كيفية قيامك بذلك ، من المستحيل النجاح.

  • من الإدراك إلى العمل

ADAS

15

جوهر

  • +
  • However, I think that the chip method must be in the ultimate stage of a large -scale application state. This result requires conditions, that is, it is necessary to wait for the algorithm to mature, and the application will only be accepted by the عام.

eat our own dog food

جوهر

SDK SDK inferenceARM

Q

ADAS

Q

3-5

Q

Q

في هذه المرحلة الزمنية ، فإن التحدي الأكبر في التعلم العميق هو كيف يمكننا أن ننضج حقًا في تقنيات التعلم العميق هذه. لأنه حتى لو لم تعد تكنولوجيا التعلم العميق اختراقًا ، إذا كان بإمكاننا استخدام بيانات ضخمة للتدريب ولدينا أجهزة أفضل لضمان التنبؤ الحقيقي في الشبكة الأعمق والأقوى ، فإن إمكاناتها غير محدودة بالفعل.

س: هل ستكون تكلفة المعدات المضمنة مرتفعة جدًا؟ ما الذي يجب علي فعله إذا تم تحديث النموذج؟

Deng Yafeng: هناك العديد من الخيارات للمعدات المضمنة حول التكاليف. بعض التكاليف مرتفعة حقًا ، ولكن يمكن قبول بعض التكاليف في هذه المرحلة. في هذه المرحلة ، تكون الأجهزة/المنتجات الذكية نفسها عالية. لدى المستخدمين أيضًا بعض التوقعات للتكلفة نفسها ، ويجب ألا يقارنوا مباشرة مع الكاميرات التقليدية. فيما يتعلق بتحديث النموذج ، يتم توصيل العديد من الأجهزة الحالية بالشبكة. من الجيد القيام بذلك في طريقة تحديث عبر الإنترنت. هذا ليس بالأمر الصعب.

(يبدأ هذا المقال حصريًا وسائل الإعلام التيتانيوم ، ووفقًا لدنغ يافنغ ، نائب رئيس تقنية التلاميذ العميقة في جولج ، ومشاركة وتنظيم التيتانيوم التيتانيوم)

.......................................................................................................................................................................

العدد الثامن والعشرين من Titanium Tanchi "AI لقد حان AI ، دع الماكينة تفهم هذا العالم" ، والمشاركة الرائعة لـ Six Titanium ضيوف قد انتهت ، وسيتم إصدار البضائع الجافة واحدة تلو الأخرى: TAG/1508094

Confession Titanium 2017 ، مشاركة رائعة تستمر!

نوصي بعملاء التيتانيوم ، رعاية ، تعاون: يرجى الاتصال بالشخص المسؤول عن اعتراف التيتانيوم ، صندوق البريد jiaoinge@tmtpost.com

محتوى أكثر إثارة ، اتبع WeChat WeChat (ID: Taimeiti) ، أو قم بتنزيل تطبيق Titanium Media

دائرة هزلية يمكن أن يكون أكثر تلوثا من تأليف صناعة الترفيه؟ مجموعة يو يون بنغ ما Dongguo كيرين دخلت ضد الأطفال الهزلي

أدخل المناطق اللوحي والتلفزيون، وسوف MEIZU Flyme التواصل مراجعة خريف 2016

بعد "الحدث رقائق البطاطس" عانى شكوى اخرى! 37 كوكب المشتري كما ظهر الاستبداد حصان الإمبراطور: أنت غير مؤهل لتعليق

وو يى الامتحان، شو وى تشو الحفل المرضى، وهذا هو الأكثر انفجار كرنفال الصيف!

تعرض بطل الجمباز الاولمبية لتدمير العائلية الصغيرة ثلاث صديقات! تخطيط مجموعة مجموعة أجبر العائدين الرجال في الطلاق

"أمي أنا لست ديسكو، وممارسة خصري،" لماذا هذا المعرض هو السماح تشانغ أحب كثيرا أن يكره؟

السكتة الدماغية، وزوجته وأولاده الذين تم بالشلل لسنوات عديدة ثروة العائلة! البالغ من العمر 64 عاما "عالم القاتل" صورة حديثة من التعرض حزينة

في العام الماضي 190209 اليوم "المفاوض" ماستر شياو وي تونغ الحب لقتل واحد من اللقطات صدر

وكان ستيفن قد فقدت، ليانغ تاي بد جبل يامي لام، تعرضت للاغتصاب رؤساء دائرة كان مجنونا؟

الذيل مربع | ترقية أكثر من ذلك بقليل، النوبي Z11 الثياب تجربة الخفيفة

رجل يبلغ من العمر 39 عاما مع الله الدراما الحميمة! البالغ من العمر 53 "أجمل داجي" تحدي اختراق: تلعب السرية مدمن مخدرات

الدخن، انضم نائب الرئيس تشانغ جينلينغ بايدو، تمرير القيمة السوقية الولايات المتحدة 5.0 مليار $ البحث الكلب سنوات | التيتانيوم مورنينغ نيوز