واقترحت مجموعة بيركلي وأكثر "الذكية" نظام الروبوت الملاحة

ويعتبر عموما الملاحة الروبوت المتحرك مشكلة هندسية، ينظر إلى هدف البيئة الروبوت العقبات الهندسة للتخطيط إلى المسار الحر للتصادم الموقع المحدد.

حاليا، من التنقل في الأماكن المغلقة إلى الطيار الآلي، الأسلوب الرئيسي للملاحة مستقل من الروبوتات هو بناء خريطة لتوجيه نفسها على الخريطة، واستخدام الخريطة لتخطيط وتنفيذ وتشغيل الروبوت تصل إلى الهدف، في حين أن هذا الموضع، ورسم الخرائط (SLAM حقق) وطريقة تخطيط المسار نتائج باهرة، وهو أساس معظم تكنولوجيا الملاحة مستقلة المتقدمة.

ومع ذلك، هذا الأسلوب لا يزال لديه قيود، على سبيل المثال، انخفاض في أداء المشهد غير محكم. لضمان سلوك الروبوت الملاحة في البيئة تتحسن، الحاجة إلى الاعتماد أجهزة استشعار أكثر وأكثر تكلفة، وفي بيئة مفتوحة، وسوف الروبوت المتحرك الملاحة المستقل أن يكون أكثر تحديا وصعوبة في بعض الأحيان إلى استخدام نقية تحليل هندسي لتصميم.

خريطة | الطرق الوعرة البيئة والبيئة الحضرية (المصدر: بيركلي)

على سبيل المثال، للتوصل إلى ضرورة المقصد على المشي من خلال العشب الخصبة، للبشرية للذهاب مباشرة مثل الماضي، عندما تدفع الناس سيارة صغيرة، هو الخيار الأكثر شعبية للذهاب على طريق مستو نسبيا. هذه على ما يبدو لا تحتاج إلى أن تكون قادرة على التفكير وجعل الأحكام الصادرة، والملاحة مستقلة من الروبوتات المتنقلة اليوم أمر صعب جدا، والقرار هو عرضة للفشل: كانوا يعتقدون أن العشب هو جدار الخرسانة طويل القامة مع نفس العقبات، ولا يفهمون اختيار سلس الفرق بين الرصيف والطريق وعرة.

لأنه يعتمد معظم الروبوت المتحرك على هندسية بحتة على التفكير من منظور الفهم الدلالي للرحيل، وذلك باستخدام تدريب على عبور الطريق أو البشرية لتوفير طرق رؤية الكمبيوتر تسميات لتحقيقه، ومع ذلك، فمن ارجوديك، والمطبات، الخ والصفات المتعلقة التنقل هي الخصائص الفيزيائية للبيئة الطبيعية، وإذا كانت قدرة الروبوت الملاحة مستقلة يمكن الاستدلال مباشرة من الصورة؟ ومثل الناس لتحديد معظم تخطيط المسار المناسب للوصول إلى الهدف؟

الباحثون AI من جامعة كاليفورنيا، بيركلي، وقد وضعت برنامجا، وهي مستقلة تماما نظم الملاحة الروبوت المحمول تحسين الذات، استنادا إلى نهاية التعلم، الروبوت المحمول من تجربتها الخاصة في العالم الحقيقي من سيد دراسة الخصائص الفيزيائية للبيئة، من دون أي محاكاة أو فريق الإشراف الاصطناعي هذا النظام التعلم روبوت يسمى BADGR: بيركلي الطيار الآلي الروبوتات الأرض.

الخريطة | Clearpath ابن آوى المحمول منصة الروبوت (المصدر: بيركلي)

أول نظرة على تكوين الأجهزة. واستخدم الباحثون الروبوت المحمول Clearpath ابن آوى أن تفعل منصة الاختبار، وحجم الروبوت هو 508 مم 430 مم 250 مم، وزن 17 كجم، مثالية للمسافرين في البيئات الحضرية وعلى الطرق الوعرة، وجناح استشعار الافتراضي يتألف من ست مجانا على درجة الحركة الإسلامية الأوزبكية (لقياس التسارع الخطي والسرعة الزاوية)، تقدير موقف للوحدة GPS العالمية التقريبية، وترميز لقياس السرعة على عجلة القيادة. وأضاف كبار الباحثين أيضا جهاز استشعار الروبوت الجديد: اثنان الحقل إلى الأمام نظر 170640 480 بكسل وكاميرا فيديو ورادار ليزر وبوصلة 2D.

تم تجهيز الروبوت الداخلي مع الكمبيوتر NVIDIA Jetson TX2، وهذا هو الخيار المثالي لدراسة تشغيل متعمقة للتطبيق. يتم حفظ البيانات إلى SSD الخارجية، وSSD أيضا كبيرة بما فيه الكفاية بسرعة كافية لاستشعار مخزن دفق البيانات 1.3GB في الدقيقة الواحدة. فريق عن طريق تثبيت 4G الهواتف الذكية مراقبة التجارب في الجزء العلوي من الروبوت، والفيديو وتشغيل عن بعد جهاز التحكم عن بعد عند الضرورة.

وينقسم التركيز القادم للعمل في أربع خطوات: 1، وجمع البيانات مستقلة؛ 2، من بيانات العنونة السيارات الرصد الذاتي؛ 3، تدريب الشبكة العصبية صورة نموذج التنبؤ على أساس؛ 4، واستخدام النماذج التنبؤية للتخطيط والتنفيذ وتسمح مهام الروبوت الملاحة لاستكمال الإجراءات اللازمة.

خريطة | BADGR في الوقت الحقيقي التخطيط المستقل والملاحة (المصدر: بيركلي)

صمم الباحثون طرق جمع البيانات، وقادرة على جمع عدد كبير من البيانات تدريبية متنوعة مع تدخل البشرية الحد الأدنى. حيث تبلغ تكلفة نظم جمع البيانات باستخدام روبوت في العالم الحقيقي عالية جدا، اختار الفريق من استخدام خوارزميات التعلم غير السياسة، من أجل أن تكون قادرة على استخدام أي استراتيجية السيطرة على البيانات جمع، وجميع البيانات للتدريب.

وبالإضافة إلى ذلك، والاعتبار الثاني عند تصميم استراتيجية جمع البيانات لضمان الاستكشاف الكامل للبيئة، مع ضمان روبوت لإجراء تسلسل العمل عند الاختبار فعلا تريد القيام بها. استراتيجية مكافحة موحدة عشوائية بسيطة ليست كافية، لأن يرجع ذلك إلى واجهة الروبوت الخطية والسرعة الزاوية، والروبوت سيكون الدافعة الرئيسية مباشرة، وهذا سوف يؤدي إلى عدم كفاية وقت الاختبار لاستكشاف وتسلسل العمل غير واقعية. ولذلك، فإن الفريق يستخدم استراتيجية مكافحة المشي العشوائي المرتبطة تجاراتها الوقت لجمع البيانات.

FIG | سياسة مراقبة عشوائية السرعة الزاوية والقيادة سرعة خطية من FIG سبيل المثال، فإن سياسة استخدام البيانات جمع (المصدر: بيركلي)

ثم، سوف BADGR معالجة البيانات الخام عينة، ويحسب التسمية لحدث معين الملاحة، في هذه التجربة، نظر الباحثون اثار ثلاثة أحداث مختلفة: الاصطدامات، والمطبات، والمكان.

والسبب هو أنه عندما الحادث تصادم في بيئة حضرية، يدار القياسات عندما تقترب عقبة، أو في بيئات الطرق الوعرة، وعندما يتم الكشف عن الحركة الإسلامية الأوزبكية تسارع الخطي والزاوي سرعة اتساع انخفاض مفاجئ، وسوف يحدث، وعندما الحركة الإسلامية الأوزبكية السرعة الزاوية السعة تقاس فوق عتبة معينة، يحدث حالة الاضطراب، يتم تحديد موقف السيارة من قبل مقدر الدولة ومقدر الحركة الإسلامية الأوزبكية وعجلات عداد المسافات معا لتشكيل تقدير موقع محلي.

BADGR يمر عبر البيانات لحساب علامة التبويب الأحداث في كل خطوة الوقت وإضافة مرة أخرى مجموعات البيانات في التسميات الأحداث، BADGR ثم يتم تدريب نماذج التنبؤ بما يؤدي إجراءات لأحداث ما الملاحة.

خريطة | التوضيح BADGR نموذج التنبؤ عمق الشبكة العصبية، التي هي جوهر استراتيجيتها الملاحة مستقلة (المصدر: بيركلي)

BADGR عمق الشبكة العصبية نموذج لصورة الكاميرا ومستقبل الخطط الحالية لتسلسل العمل كما المدخلات والمخرجات المتعلقة تنبؤات أحداث المستقبل (على سبيل المثال، إذا كان الروبوت سوف تصطدم أو القيادة على التضاريس وعرة).

وبالإضافة إلى ذلك، عند نشر BADGR، تعرف الباحثون على وظيفة المكافأة التي كانوا يرغبون في إكمال يتم ترميز الروبوت مهمة محددة. على سبيل المثال، والحوافز لتشجيع نحو وظيفة الهدف يمكن منع الاصطدام أو في القيادة على التضاريس وعرة في نفس الوقت. ثم، BADGR استخدام النماذج التنبؤية المدربين، وعرض الصورة الحالية وظيفة حافز خطط لاتخاذ سلسلة من الإجراءات لتحقيق أقصى قدر من المكافآت.

BADGR بالتناوب بين التخطيط والتنفيذ، حتى يتم الانتهاء من المهمة للوصول إلى الهدف.

كيفية التنقل في أعمال استراتيجية جديدة؟ سحب اختبار ما. الباحثون BADGR يدار باستخدام مسار بدون حوادث وتمت مقارنة استراتيجيات الملاحة SLAM + P، فقط باستخدام كاميرا BADGR التعرف على الصور، تعكس نتيجة المقارنة اثنين من المزايا.

اختبار، لتجنب حوادث الاصطدام والوصول إلى موقع تضاريس وعرة GPS المهمة المستهدفة في بيئة حضرية. وعلى الرغم الهندسة القائمة على السياسة في نهاية المطاف بنجاح مهمة، لكنها فشلت في الحد من حالة إلى المطبات تجنب. وصل بنجاح للهدف BADGR، والقيادة على الطرق المعبدة لتجنب طريق وعرة التضاريس النجاح. ومن الجدير بالذكر أن الباحثين لم يخبر الروبوت إلى السفر على متن الطائرة الطريق، BADGR تعلمت تلقائيا من صورة الكاميرا على متن، والقيادة أكثر سلاسة من تشغيل على العشب على طريق الخرسانة.

اختبار اثنين، لتحديد الموقع GPS المهمة في بيئة على الطرق الوعرة. استراتيجية SLAM + P وضع علامة خطأ على الحواجز التي لا يمكن اختراقها العشب، وبالتالي يدور في المكان في محاولة للعثور على المسار الذي يمكن تجاوزه، لكنها فشلت في الكشف عن الدوران ويمكن أن تمر من خلال أي مسار، وكان الروبوت الصعب قبل خط المرمى. في المقابل، طريقة BADGR للتعلم من التجربة، وبعض الحشائش الطويلة حقا يمكن أن تمر من خلال، وبالتالي فإن الروبوت يمكن أن تستمر بنجاح لتوجيه الهدف، ليس هناك أي خطأ الافتراض بأن العشب يشكل عائقا، لأن BADGR للتعلم من التجربة، أكثر العشب في الواقع أن اجتاز.

بالإضافة إلى معرفة الخصائص الفيزيائية للخارج البيئة، جانبا رئيسيا من BADGR هو قدرته على الاستمرار في تحسين نموذج لجمع بيانات الرصد الذاتي في الوقت الحقيقي وأكثر وأكثر. وللتدليل على هذه القدرة، أجرى الباحثون دراسة للرقابة، التي BADGR جمع البيانات والتدريب من منطقة واحدة ومن ثم الانتقال إلى المنطقة المستهدفة الجديدة، والفشل الأولي الملاحة في المنطقة، ولكن بعد ذلك جمعها وتدريب منطقة جديدة بعد البيانات الأخرى، وفي نهاية المطاف النجاح في إنجاز هذه المهمة.

خريطة | كما تم جمع المزيد من البيانات، BADGR الحصول على أكثر ذكاء (المصدر: بيركلي)

التجربة أثبتت أن ليس فقط يمكن أن تحسن BADGR بعد جمع مزيد من البيانات، وعندما BADGR مواجهة البيئة الجديدة، والخبرة جمعت سابقا يمكن أن يسرع في الواقع التعلم. مع BADGR البيانات جمع تلقائيا في المزيد والمزيد من البيئات، والناجح وقت التعلم المطلوبة لكل بيئة الملاحة الجديدة ستكون أقل وأقل.

يتم إعطاء الفكرة الرئيسية BADGR من خلال التعلم المستقل مباشرة من الخبرة في العالم الحقيقي، يمكن BADGR معرفة قدرات الملاحة، جنبا إلى جنب مع جمع بيانات إضافية والتحسين المستمر، وتمتد إلى البيئة الجديدة الأخرى. الباحثين يعتقدون BADGR نحو مؤتمتة بالكامل، اتخذت تحسين الذات من نظام الملاحة خطوة واعدة إلى الأمام، على الرغم من أنه لا تزال هناك العديد من المشاكل التي لم تحل بعد، مثل: الروبوت كيفية البيانات جمع بأمان في البيئة الجديدة؟ على الانترنت تكيف مع تدفق البيانات الجديد؟ الاستجابة إلى بيئة غير ثابت، مثل شخص المشي؟

وأخيرا، قال الباحثون التجربة قيمت فقط ساكنة البيئة BADGR والبيئة وليس عضوا في المشاة والسيارات مثل الوسائط القابلة للإزالة. بسبب وجود البيانات التي تم جمعها من استراتيجية البيئة الحقيقية والحيوية إرادة البيانات التحيز، وذلك باستخدام البيانات من بيئة غير ثابت من جمع والتدريب قد يجلب المزيد من التحديات، ويمكن لهذه التحديات تعلم في العالم الحقيقي والتعلم منصة لالروبوت العمل أمر ضروري، BADGR يتجه نحو هذه الخطوة الهدف بخطوة.

تواجه سوفت بانك أكبر عجز في الشركات التاريخ، والرؤية، صندوق الاستثمار 15-88 الإفلاس

كيف أن "العلماء" إلى "رجال الأعمال"؟ خمسة أسباب لتجنب فشل الشركات المبتدئة

ووهان غونغ لإنقاذ امرأة أم تعافى في العودة إلى ديارهم: عندما يقوم شخص ما رمى على احتضار الحياة العوامة

الملاحظة الفن تساي مينغ ليانغ شو بغضب القرصنة: لماذا الحاجة إلى مشاهدة فيلم في السينما؟

صراع على السلطة النبات: لكسر احتكار سلسلة التوريد المحاصيل، وأخذت حماية الناس على الطريق

جال للصحفيين هانغتشو ثلاثة أيام، في اليوم الأول من الدراسة الذاتية المدرسة الثانوية: الفئة غير تناول الطعام في نفس صرامة الجدول من الامتحان

تشجيانغ، وهوبى المساعدات الفريق الطبي تدريجيا بعد الظهر تجربة الحياة نعتز سنوات لا تنسى مكافحة السارس

CCTV شبكة أخبار فوكس ونتشو: كسر من خلال التحول من الطريق، وتجارة الأحذية

أصدقاء المدرسة الربيع! يرجى مراجعة هذا إلى دليل المدارس

العلمي التنسيق ومراقبة تطور الوباء: الأول يعود اليوم إلى المدرسة في جميع أنحاء المحافظة ستقع اعمال الوقاية بخير

مدينة هانغتشو الدماغ المتزايد على أسهل وحياة أفضل

خلال وباء، بتعليق العمليات التجارية أو إيقاف تشغيل، والمستهلك كيف نفعل؟