CVPR الرئيس 2022 للجمعية HKUST إذن تعليم التنين: الوضع الراهن والرؤية المستقبلية الحاسوب

المصدر: AI تقنية مراجعة

مقالة معلومات عن 5200 كلمة، 10+ دقيقة الموصى بها .

ألقى البروفيسور لونغ تشيوان خطابا بعنوان "يعيد والأمن 3D الذكاء الاصطناعي" ل.

مؤخرا، برعاية شبكة لى فنغ قمة الأمن الصين الذكاء الاصطناعي الثاني عقد في مدينة هانغتشو.

أصدر موقع القمة، جامعة هونغ كونغ للعلوم وأستاذ التكنولوجيا، CVPR 2022، رئيس ICCV الجمعية العامة 2011 Altizure مؤسس الحق للأستاذ طويل "رؤية ثلاثية الأبعاد لإعادة تعريف الأمن الصناعي المخابرات" خطاب بعنوان.

وقال البروفيسور الحق، جوهر الذكاء الاصطناعي هو البصرية، وتعريف البصري للأمن ذكي، ولكن الآن لا تزال تقتصر على ثنائي الأبعاد مستوى التعرف البصري، وإعادة بناء مستقبل الرؤية ثلاثية الأبعاد تصبح المهمة الأكثر أهمية، فإنه سيتم أيضا إعادة تعريف الأمن ذكاء.

وتحدث أيضا عن أستاذ في الوقت الراهن على تصنيف وتحديد دلالة إحصائية كبيرة على طبيعة الرؤية الحاسوبية.

"هدفنا النهائي هو فهم الصورة، وهذا هو الإدراك، ولكن فقط في المرحلة رؤية الكمبيوتر التصور الحالية، لم نكن نعرف كيفية تفسير، كانت الرؤية الحاسوبية لاستكشاف الخصائص البصرية من أبسط، وهذا الإلتواء البصرية مستديرة الشبكة العصبية CNN يعيد أساسا خصائص الرؤية الحاسوبية. ولكن البشر الذين يعيشون في بيئة ثلاثية الأبعاد من عيون الحيوانات، مما يجعل التعرف البصري الإنسان البيولوجي الاعتراف فحسب، بل يشمل أيضا التفاعل تصور ثلاثي الأبعاد مع البيئة. "

"لذلك علينا أن نتعامل مع الاعتراف ثلاثية الأبعاد وثنائية الأبعاد يمكن أن تفعل أشياء، فإن العدد الحالي من مشاهد معقدة، ليست كافية. ومع ذلك، فإن الهدف النهائي ليس هو إعادة الإعمار ثلاثي الأبعاد، وإعادة البناء ثلاثي الأبعاد هو جعل تحديد الهوية والاندماج. "

وفيما يلي عرضا المباشر لمضمون الحق للأستاذ طويل، لم نكن تغيير القصد من تحرير والتشطيب:

شكرا لدعوة، اليوم أشارك في حالة الطلب الرئيسي في هذه المرحلة من رؤية الكمبيوتر والتوجيه المستقبل، وكذلك رؤية ثلاثية الأبعاد للأمن في مجال الذكاء الاصطناعي.

ونحن نعلم أن الآن هو جوهر الأمن AI، وطبيعة الرؤية الحاسوبية، والرؤية الكمبيوتر وينقسم إلى قسمين، وهما تحديد وإعادة الإعمار.

"الاعتراف" هو الآن الاتجاه شعبية جدا، مقارنة مع فهم الجميع "إعادة الإعمار" لم يكن دقيقا جدا. نحن بحاجة لمعرفة ذلك، لا يقتصر على الاعتراف رؤية الكمبيوتر، وإعادة الإعمار 3D تلعب دورا أكثر أهمية.

هذا هو إعادة البناء ثلاثي الأبعاد والتكامل أمن الحالات الفعلية:

وبنيت هذه مشاهد من ثلاثي الأبعاد والفيديو في الوقت الحقيقي نحن المتوقع ثلاثية الأبعاد، يمكن للمستخدمين "الأمامي والخلفي، يسار، يمين" عملية السحب في الواجهة.

بعد ذلك، أريد أن أقوله هو مشاكل في الرؤية الكمبيوتر ولماذا رؤية ثلاثية الأبعاد سوف تعيد تعريف رؤية الكمبيوتر، والذكاء الاصطناعي والأمن إعادة تعريف.

أساسا الذكاء الاصطناعي الذي يتيح جهاز الكمبيوتر الخاص بك للاستماع، مشاهدة، قراءة، كل المعلومات داخل والمعلومات البصرية تمثل 80 من جميع الحواس، وبالتالي فإن البصرية هو في الأساس جوهر الذكاء الاصطناعي الحديث.

بالنسبة لنا، في الواقع، لا يوجد المخابرات العامة والاصطناعي، والذكاء الاصطناعي على أساس الحاجة إلى أبعاد تقنية محددة ومشاهد ثلاثية الأبعاد، منطقة منفصلة، وتطوير الذكاء الاصطناعي والثورية الهبوط التطبيق، يجب أن تعتمد على ويحد من تطوير رؤية الكمبيوتر ثوري والتطبيقات.

كما يرافق الأمن AI من خلال تطوير رؤية الكمبيوتر والارتفاع.

عام 2012 هو عام مهم جدا، وكان في لعبة ImageNet، والفريق لديه التعرف على الصور معدل دقة التفاف الشبكة العصبية CNN من 75 إلى 85، وهذا الأشياء "صغيرة جدا" التي أدت إلى هذا العمق مستديرة تحت الذكاء الاصطناعي للتعلم، حتى نتمكن من وضع هذه الجولة في عام 2012 دعا السنة الأولى من الذكاء الاصطناعي لمعرفة عمق ممثلة.

وقد نشرت هذه العودة الشيء حتى عام 1998، وهذا هو يان ليكون لالتفاف الشبكة العصبية LeNet، هذه الشبكة لا، الأولى صورة مدخلاته هي صغيرة نسبيا، الأبيض والأسود فقط على قناة واحدة 32 * 32، يمكن التعرف فقط بعض من الشخصيات والحروف ، لأنه لا يوجد GPU، حتى في ذلك الوقت الشبكة بالكامل، فقط 600،000 من المعلمات.

القيامة 2012 من الشبكة العصبية التفاف ظهرت AlexNet. AlexNet شبكة التلافيف العصبية ومقارنة في عام 1998 LeNet، هيكلها الداخلي هي في الأساس نفسه، ولكن ليس بنفس حجم الصورة المدخلة: 1998 نموذج، وحجم المدخلات من 32 * 32، وقناة واحدة فقط. تم توسيع نموذج مدخلات جديدة لحجم 224 * 224، وهناك ثلاث قنوات. والمفتاح هو داخل مع GPU، ثم تدريب الاستخدامات اثنين GPU، المعلمات تصل إلى ما يقرب من 60 مليون نسمة.

على مدى السنوات التفاف الشبكة العصبية خوارزميات الرؤية الحاسوبية وهيكل، والتغيرات الهيكلية الأساسية هي صغيرة.

لكن 1998-2012، خمسة عشر عاما هناك أمرين أهمية خاصة: أولا، وقد وضعت NVIDIA GPU ل، والثاني هو لي Feifei خلق ImageNet، وقالت انها وضعت الملايين من الصور المرسلة إلى الشبكة وتعبئة الجماهير للقيام احتفال. بل هو أيضا لأن القوة وبيانات العد، فإنه يخلق تحقيق AlexNet.

2015 آلة معدل الاعتراف رؤية ما وراء الإنسانية الأساسية. في الواقع، والتعرف على الإنسان ليست قوية جدا، وذاكرتنا هي من السهل جدا أن يخطئ. ووفقا للإحصاءات، فإن معدل الخطأ البشري في تصنيف ما يصل إلى 5. وكان الجهاز، ابتداء من عام 2015 ترى مجموعة متنوعة من نسبة الخطأ ImageNet على مجموعة البيانات المجال العام أقل بكثير من 5.

ولكن لماذا ImageNet قبل عامين لوقف لعبة، لأنه الآن في المنافسة تعتمد أساسا على القوة والاعتماد البيانات.

2015 مع نضج تكنولوجيا الذكاء الاصطناعي في الشبكة العصبية الإلتواء، كما وصلت AI ذروة معينة، رؤية الكمبيوتر أو كما تم إعادة تعريف سوق الأمني بشكل عام.

أيضا في هذه الفترة، منظر مفتوح، شانغ قيام بذلك العديد من الشركات الأمنية البصرية لدخول السوق.

من عام 2012 إلى عام 2019 سبع سنوات، وجميع البيانات التي تحولت ألف مرة أسرع من حساب سابقا ألف مرة، ألف مرة أكبر من الطراز السابق أيضا. يتطلب 2012 نموذج التدريب AlexNet استخدام اثنين من GPU، أمضى أسبوعين، واليوم تفعل الشيء نفسه يستغرق سوى واحد DGX-2، عشر دقائق لإكمال.

من وجهة نظر المعلمات نموذج كامل، فقد كان عام 2012 AlexNet مؤثرة جدا، معلمة كبيرة جدا 60 مليون، وهو رقم لا يمكننا أن نتصور في ذلك الوقت. اليوم هذه الشبكة ولكن أيضا تكبير ألف مرة، وصلت المليار من المبلغ من المعلمات. ولكن الخوارزميات، وأبنية، والآن القياسية في الأساس التفاف الشبكة العصبية، في الواقع، وليس الكثير من التقدم.

يمكننا أيضا التفكير في رؤية الكمبيوتر والتي في النهاية تكون قادرة على تحديد إلى أي مدى؟ في الواقع، انها ليست قوية جدا، انها مجرد اعتراف كبير على دلالة إحصائية منه.

لقد سمعنا جميعا التعلم غير خاضعة للرقابة، ولكن لا نتائج هذا السيناريو وتطبيق التعلم تحت إشراف يست أكثر من اللازم. متوفر في الوقت الحاضر القيام به هو أن يكون إشراف جيد، وهو CNN.

ويستند بلدي ملخص موجز لرؤية الكمبيوتر الحالية على التفاف الشبكة العصبية من العمارة CNN كلها بسيطة جدا، في الواقع، يمكن القيام به هو ليس كثيرا بحيث مقتطفات ملامح البعد عالية، وبالتزامن مع حلول بصرية أخرى المشكلة.

إذا كان لديك ما يكفي من البيانات وأن تحدد بوضوح ما تريد، ونتائج جيدة CNN، لكنه ليس لديه الذكاء؟ في الواقع، لا.

أنت تقول غبي، غبي كما كان من قبل ذلك. ويمكن تحديد القطط والكلاب، ولكن علينا أن نعرف تصنيف القطط والكلاب وتعريف منطقتنا من البشر، لا يمكننا الفصل بين القطط والكلاب، والكلاب تستطيع الحيوانات أيضا معقدة البلمرة والتصنيف، وطبيعة هذه الامور يقول ليس الهدف، ولكن ذاتي.

ونحن نفعل رؤية الكمبيوتر الأبحاث المثالي هو جعل آلات فهم الصور. كيفية السماح لأن يفهم ذلك؟ وهذا أمر صعب جدا، وحتى الآن لا أحد يعرف كيف يجب أن يفهم. الآن يمكن القيام به، ويمكن القيام الإدراك. والغرض من دراستنا هو الحصول على رؤية الكمبيوتر الميزات البصرية، من أجل تنفيذ سلسلة من العمل بمجرد الانتهاء من الميزات البصرية.

لماذا ميزات بصرية في غاية الأهمية؟ في التعرف على الكلام، ميزة خطاب تعريف واضح جدا - الصوتيات. ولكن إذا أردنا جلب صورة ونسأل ما هو عليه في معظم الميزات البصرية الهامة، كان الجواب غير واضحة. ونحن نعلم جميعا أن الصورة تحتوي بكسل، ولكن بكسل ليست ميزة حقا. بكسل هو مجرد دعم الرقمية، الصورة الرقمية التمثيل. والهدف النهائي من رؤية الكمبيوتر للعثور على العناصر البصرية الفعالة.

في ظل هذه الفرضية يكون الميزات البصرية، والرؤية الكمبيوتر واثنين فقط من الأغراض الحقيقية، هو واحد لتحديد إعادة الإعمار آخر ثلاثي الأبعاد.

كلمتهم في اللغة الإنجليزية من أجل "إعادة" كما البادئة، مشيرا إلى أن هذه هي مشكلة العكسية.

رؤية الكمبيوتر ليست واضحة المعالم (سوء يشكلها) المشكلة وليس الحل المثالي أو الأسلوب.

هذه الجولة من الشبكة العصبية التلافيف (CNN) الشيء الأكثر أهمية هو أن إعادة تحديد خصائص الرؤية الحاسوبية. وقبل ذلك، تم تصميم كافة الميزات بشكل مصطنع. CNN تعلمت شيئا اليوم، وعلم البعد مميزة الملايين كل منعطف، في حالة عدم وجود شبكة من هذا القبيل قبل الوضع من المستحيل بكل بساطة.

حتى CNN قدرة استخراج ميزة قوية للغاية، ولكن يجب ألا ننسى إنشاء رؤية الكمبيوتر على CNN على أساس أغراض تحديد الهوية واحدة، ومجهر البشري. عالمنا الحقيقي هو في ثلاثي الأبعاد، ثلاثي الأبعاد، وعلينا أن نتعامل معها. عقد صورة ثنائية الأبعاد تأليف ندرك أن هذا لا يكفي.

في الرؤية بالعينين، لتشمل العمق، التفاوت وإعادة بناء ثلاثة مفاهيم، والتي تعادل إلى حد كبير، وذلك باستخدام المفردات التي تعتمد على المجموعة التي تتواجد فيها.

تقليديا، وإعادة البناء ثلاثي الأبعاد هو قبل الاعتراف، بل هو معظم المشكلة الأساسية، والتي تستخدم أيضا التعرف البصري ثلاثي الأبعاد، ولكن الاعتراف به هو تحديد من نفس الكائن في زوايا مختلفة، بحيث يكون أكثر تقديرا تعريفا جيدا الاعتراف (الذي تمثله بشكل جيد)، المعروف أيضا باسم مطابقة.

مجهر تصنيف رؤية العالم البيولوجي بأكمله هو صارمة للغاية. ونحن نعلم جميعا أن عيني الحصان تبحث بها، جزءا من زاوية ثلاثية الأبعاد الممكنة للحصول على جزء من المعلومات، لكنه صغير جدا منظور ثلاثي الأبعاد، على عكس البشر. يبحثون عيون السمك لكلا الجانبين، والبصر الرئيسي هو هدف واحد، يمكن أن ينظر إليه منطقة المشاهدة مجهر هي جزء ضيق جدا.

البشر لديهم عينان، وعينان من خلال الحصول على المعلومات عمق ثلاثية الأبعاد. وبطبيعة الحال، من خلال حركة العينين، ويمكنك أيضا الحصول على معلومات متعمقة.

الحصول على المعلومات عمق التحدي الكبير، هو أساسا مشكلة التثليث. الخطوة الأولى تتطلب الصورتين أو كلتا العينين تنظر الأشياء المباراة، والتي تم تحديدها. هنا، "الاعتراف"، ومختلفة عن ما سبق، فإن القضية المذكورة أعلاه حيث التسمية تحديد الهوية، حيث "الهوية" هو تحديد بين الصورتين، لا قاعدة البيانات. انها ليست فقط لتعريف الكائن، ولكن أيضا لتحديد كل بكسل، وبالتالي فإن المتطلبات الحسابية مرتفعة جدا.

في العالم البيولوجي، والرؤية بالعينين مهمة جدا، والثدييات لها رؤية مجهر، ولكن أكبر وأكثر شراسة الحيوانات آكلة اللحوم تداخل مجهر، حصلت عمق المعلومات مجهر لأخذ زمام المبادرة لفريسة القبض عليه. رعي الحيوانات تأكل أو رؤية رؤية أحادي، رؤية واسع جدا، والاعتراف الوحيد دون عمق، والغرض من ذلك هو تشغيل سريع عندما يكون الهجوم!

قبل هذه الجولة من CNN، معظمها إعادة الإعمار ثلاثي الأبعاد من رؤية الكمبيوتر بحث في هذه المشكلة، هناك اصطناعية جيدة جدا الميزات البصرية المصممة من قبل CNN، وطبيعة هذه الأشياء لأول الإعمار والتصميم ثلاثي الأبعاد، مثل ميزات فرزت . وبعد ذلك، "الاعتراف"، مجرد وضعها في قاعدة البيانات صورة دون هيكل للذهاب البحث عنه. وهكذا، يتم تعريف الرؤية الحديثة ثلاثية الأبعاد عن طريق إعادة البناء ثلاثي الأبعاد. قبل ولادة CNN، التي كانت القوة الدافعة الرئيسية تأتي من تطوير البصرية للهندسة، لأن تعريفه واضح نسبيا.

دعونا نلقي نظرة على الوضع الحالي والتحديات تقنيات اليوم إعادة الإعمار ثلاثية الأبعاد.

رؤية ثلاثية الأبعاد على حد سواء خوارزمية النظرية، هي جزء من إحصاءات، والجزء الآخر هو حتمية وغير الإحصائية، وهي الرياضيات التطبيقية التقليدية.

إعادة الإعمار 3D من رؤية الكمبيوتر يحتوي على ثلاث قضايا رئيسية هي:

نظرا لموقعها. إذا أعطي صورة من رؤية الكمبيوتر أن نعرف أن هذه الصورة يتم اطلاق النار في موقف ما.
المتعدد. الحصول على كائن متعدد الأبعاد من المعلومات التفاوت، وتحديد ومطابقة كل بكسل وإعادة الإعمار ثلاثي الأبعاد.
الاعتراف دلالات. بعد الانتهاء من إعادة بناء الهندسة ثلاثية الأبعاد، إلى الاعتراف الدلالي المعلومات ثلاثية الأبعاد، والذي هو الهدف النهائي لإعادة الإعمار.

تحت هنا أود أن أشدد على أننا بحاجة إلى إعادة التقاط المشهد ثلاثي الأبعاد، لكن إعادة البناء ليس هو الهدف النهائي، وتريد أن تعرف المضافة، بحيث التطبيق النهائي ينبغي أن تعترف بالتأكيد التكامل ثلاثي الأبعاد وإعادة الإعمار.

إعادة البناء ثلاثي الأبعاد من أهم التحديات الآن يعتبر غير كاف، ولكن أيضا أكثر صعوبة في جمع. أنا، على سبيل المثال، لدينا الاعتراف الكاميرات الامنية مكان الحادث أسهل، ولكن إذا كان الوقت الحقيقي إعادة إعمار كاميرا حقيقية N، والتي تعتبر متطلبات الطاقة العالية جدا. تنطبق هذه القيود أيضا لجعل أحادي الحالي أكثر من ذلك، ولكن أعتقد أن المستقبل سيكون عيون في الاتجاه.

تحت تأثير عمق التعلم، وجعلت إعادة الإعمار 3D إنجاز كبير. CNN في غضون بضع سنوات بعد عام 2012، وأثر على إعادة بناء ثلاثي الأبعاد ليست كبيرة. ولكن من بداية عام 2017، CNN على إعادة الإعمار ثلاثي الأبعاد له تأثير مهم. وهناك مجموعة من البيانات ثلاثي الأبعاد اسمه كيتى في مجال إعادة الإعمار، من عام 2017، بدأنا مع الشبكة العصبية التفاف ثلاثي الأبعاد.

CNN السابقة على أنها علاقة ثنائية الأبعاد مع تحديد المزيد من خوارزميات عيون الحديثة تستند إلى الشبكة العصبية كاملة التفاف ثلاثي الأبعاد. المرحلة التفاف ثلاثي الأبعاد أداء الشبكة العصبية هي أيضا قوية جدا، إلى أي صورتين، ونسبة الخطأ في المئة فقط 2-3.

الآن سيناريوهات تغطية رؤية الكمبيوتر، يتم إعادة تعريف رؤية الكمبيوتر، ولكن هذه التطبيقات قابلة للاختناقات في تكنولوجيا الرؤية الكمبيوتر.

في حين أن رؤية الكمبيوتر دورا كبيرا في الترويج لقطاع الأمن، ولكن أساسا لا شيء أكثر من أن التعرف على الوجوه البشرية والمركبات والأشياء وغيرها من التطبيقات، رؤية الكمبيوتر، وإذا وضعت أبعد من ذلك، ومرة أخرى إعادة تعريف صناعة الأمن.

وأعتقد، وثلاثي الأبعاد الأمنية البصري يكون لها أثر عميق جدا.

إعادة الإعمار ثلاثي الأبعاد في مجال الأمن، أول إعادة البناء ثلاثي الأبعاد من مستوى الحضر على نطاق واسع.

كل المدن الكبيرة يكون في كثير من الأحيان من مليون من الكاميرا، وكاميرا مدمجة في مثل هذا المشهد ثلاثي الأبعاد الحقيقي قبل أن يتمكنوا من تحقيق تأثير السيطرة على مستوى المدينة، والذي هو أفضل من النموذج الأمن AI.

الآن الحكومات الإدارة الحضرية من خلال الخريطة الحقيقية، والتي تستخدم ليكون ثنائي الأبعاد، ولكن يجب أن يكون مستقبل حقيقي، ثلاثي الأبعاد.

نحن HKUST 3D الرؤية هو أن تفعل شركة مستوى المدينة Altizure البدء من منصات حقيقية إعادة الإعمار والمشاريع ثلاثية الأبعاد، وهناك نوعان إعادة الإعمار على نطاق واسع يشكل تحديا للغاية:

الأول هو لأنه وهناك كمية كبيرة جدا من البيانات نحن النمذجة الآن مئات من صورة مليون عالية الوضوح، يجب أن يكون هناك قوية الموزعة والمتوازية الخوارزميات، بضعة أسابيع وحتى النهاية.
والثاني هو تصور ، A عرض خريطة الحقيقي هو تحدي خاص لأن كمية البيانات خريطة الحقيقية هي كبيرة جدا، وحتى في أي ميناء من وجهة نظر حقيقي ثلاثي الأبعاد يمثل تحديا للغاية.

في الوقت الحاضر، إلا Altizure يمكن الرد على هذا التحدي.

ونحن نفعل حالة نموذجية هذا هو شنتشن بينغ تخطيط الجبلية من الزمكان منصة سحابة المعلومات، أجرينا في نموذج ثلاثي الأبعاد للمنطقة سكنية كبيرة بينغشان، المستخدم الخلفية يمكن أن "العلوي والسفلي التكبير" و "الأمامية والخلفية على حقيقية صورة ثلاثية الأبعاد ، اليسار واليمين "السحب الانتقال إلى ريال مساحة العرض.

الخلفية يمكن للمستخدم أيضا تحديد جزء من الماوس في منطقة الحقيقية صورة ثلاثية الأبعاد، ومن ثم التركيز على كل شاشة شاشة فيديو في المنطقة سوف تظهر في الوقت الحقيقي في أحد عشر الشاشة الكبيرة. في الوقت الحقيقي رصد الفيديو بينغشان المرحلة الأولى من المشروع الذي يظهر مع التقليدية شاشة فيديو خلفية تقديم على غرار العدد الإجمالي للأكثر تقليدية.

في المرحلة الثانية والثالثة، يمكننا أن نبدأ كل فيديو عرض على منصة 3D.

شنتشن لديها الآن الكثير من المساحة في توزيع الزمكان ثلاثي الأبعاد الحقيقية لهذه المنصة من المعلومات.

مع هذا البرنامج، الفيديو ليس فقط، في الواقع، هناك بعض البيانات الأخرى أيضا يمكن أن تضاف إلى التطبيق.

مجموع نظام مراقبة كاميرات المراقبة أن يدمج، والبوابات، والمحلات التجارية، والمناطق ذات المناظر الخلابة واي فاي وغيرها من المرافق العامة، في الوقت الحقيقي التصور من تدفق الناس، موقف بطارية السيارة. يتم الحقيقية سيطرة ثلاثية الأبعاد وبالقرب من مناطق الجذب السياحي في إجمالي الملاحة أسهل.

وفيما يلي الحالة الأولى نقوم به فى قوانغتشو، وحماية المباني التاريخية والتخطيط الحضري.

Altizure منصة بصرية حقيقية ثلاثية الأبعاد لديها الآن الحقيقي محتوى ثلاثي الأبعاد في 180 دولة و 300،000 المستخدمين المحترفين.

البحوث وتطبيق إعادة البناء ثلاثي الأبعاد لرؤيتنا الحاسوب الرؤية مختبر جامعة هونغ كونغ للعلوم والتكنولوجيا والشركات المبتدئة في الصدارة Altizure العالم. هدفنا ليس الى قائمة فرشاة وقائمة فرشاة، ولكن في بعض الرئيسية قائمة ثلاثية الأبعاد، منذ ابريل من العام الماضي كنا تعادل على المركز الاول!

وخلاصة القول، رؤية الكمبيوتر "الاعتراف" يحدد الأمن ذكي، ولكن الآن "الرؤية" و "الاعتراف" لا تزال تقتصر على ثنائي الأبعاد والتعمير ثلاثي الأبعاد من رؤية الكمبيوتر هو مستقبل أهم المهام، وإعادة الإعمار حتى ثلاثي الأبعاد إعادة أيضا تعريف الذكاء الاصطناعي والأمن ذكاء.

الآن الأبحاث الرؤية، ونفس الظاهرة واضحة جدا.

بدأنا القيام الذكاء الاصطناعي في الثمانينات، والوضع اليوم، قليلا مثل التاريخ يعيد نفسه، وطبيعة الرؤية الحاسوبية مع الماضي، لم يحدث أي فرق، ولكن أدوات الأجهزة التي نستخدمها ليست هي نفسها.

في حين أن رؤية الكمبيوتر في فترة ذهبية، ولكن تطوره لا يزال محدودا جدا، وأعتقد أن ما يسمى الرؤية الحاسوبية للأغراض العامة والذكاء الاصطناعي في المستقبل البعيد.

شكرا لك!

المحرر: هوانغ Jiyan تم التعليق بواسطة: لين يي لين - انتهى -

تسينغهوا الانتباه - بيانات أكاديمية تشينغداو للعلوم قناة الصغرى الرسمية منصة الجمهور " بيانات الإرسال THU "أيتها الأخوات ولا". إرسال البيانات THU "لرعاية المزيد من المحاضرات ونوعية المحتوى.

طريق الحرير

CVPR الرئيس 2022 للجمعية HKUST إذن تعليم التنين: الوضع الراهن والرؤية المستقبلية الحاسوب

حطم ميسي حظا باولينيو الحقل حتى إيكا جوردي برشلونة 6-1 انتر ميلان 1-1 انفجار - أرض المعركة

AlphaGo لا يعرفون أنهم تغلب كه جي! سوف AI ديك وجهة نظرها الخاصة في الرأي؟ لذا تا ما عرض؟

اللغة رائحة تشنغدو | 'أو وجه الله "وانغ جون المعكرونة محلية الصنع" مايو دان تعليق على "تشنغدو طعم المعكرونة في فمه (تحت)

في شعبية كبيرة! Hengda قبل الأخيرة 1 انعكس العلم، وكان مدرب المنافس قبلات مسروقة

اللغة رائحة تشنغدو | 'أو وجه الله "وانغ جون محلية الصنع المعكرونة" مايو دان تعليق على "تشنغدو طعم المعكرونة في فمه (على)

تسينغهوا AI هوا شان جبل مفتوح الآن، السيدة يو تانغ ون بين أن يكون الطابق اماجى الوضع التحريض

فريق الهبوط GIF- الدوري الممتاز Zaiyu إجهاض للعدالة! يتم تجاهل اثنين آخرين كرة اليد، المدرب البالغ من العمر 70 عاما ثم أخذ

1700 مذكرات الرياضيات النار! كود تدق الكامل ليعلمك لاستخدام مطاط + فيم (مع رمز)

1 سوبر GIF- يبدو هدف غريب! 4 أيام، حتى الأهداف H 2، البالغ من العمر 22 عاما حطم رقما قياسيا من حجم ثابت Jiangzai

"الماء الحي" في بلدة الخيزران قاد القرويين للحصول على الشروع دخل الأغنياء في رحلة جديدة

جدلا كبيرا فائقة وركلة جزاء! باولينيو ابتسامة القدر، كان كانافارو غاضب

يمكنك إرسال البيانات في 12 نصائح التعلم العلمي الرئيسية (مع وصلات)

أنت بالتأكيد تريد أن تتعلم مشروع بيثون المستوى الأعلى (مع رمز)

جندت 90 فتاة صينية وزارة التنمية الاقتصادية الايطالية راتب سنوي قدره 36000 يورو في الواقع لا أفهم الإيطالية

اسم الدوري الممتاز بعد أربع دقائق 2 إجهاض ضخمة من العدالة! لم 7 م لا ترى عن قرب، والأمن القومي الغضب المساعدات الخارجية

فرنسا الأصفر سترة مسيرة امتدت إلى إيطاليا وفرنسا شعب مسيرة الحدود ST عبر الحدود

لعب فقط 95 ثانية لتحل محلها! سوبر U23 مدرب الشاب قد تعرض للإذلال، وبكى تقريبا عندما مصير

هواوي تينسنت ديك الباريونات يلقي الدخن في الصينية، والموارد البشرية، والبيئة، ومزايا الموقع لجذبهم إلى الشطرنج الكبير المقبل

ظهر سوبر صراع كبير! 14 شخصا الحصول على التدريب العملي على معا مباشرة، المسرح هامسيك بارد

آلة التعلم تفسير نموذج: VS الصندوق الأسود أبيض مربع (مرفق رابط)

92 دقيقة لور بعد أن لعبت بها تشنغ البالغ من العمر 38 عاما! 29 سنة، وهو ثلاثة أهداف فقط، انتظرت الكرة خمس سنوات

عقدت الكبير تحليل البيانات وتقرير التصور بنجاح (PPT تنزيل)

الأحكام ذات الصلة