إطلاق أبل الثقيلة التكنولوجيا AI بلوق، أطلقت CVPR توليف ورق الصور الفوتوغرافية واقعية الطلقة الأولى

1 جي فاز تجميع جديد

أبل قد بدأت للتو ورقة بحثية تركز على بلوق تعلم الآلة، ونشارك على أحدث نتائج البحوث التفاح. بلوق، وتسمى "أبل مجلة تعلم الآلة" (أبل آلة التعلم جورنال)، نشرت المقالة الأولى هي حول كيف تصبح أكثر واقعية تركيب صورة، لتدريب الشبكة العصبية.

وتأتي هذه الخطوة مثيرة للاهتمام لأن أبل عادة لا نتحدث بصراحة عن مشاريعهم البحثية. ووفقا لتقارير تك كرانش، وقد طرحت شركة آبل عدد من المشروعات الهامة مفتوحة المصدر، مثل محرك متصفح بكت سفاري وراء، وكذلك أبل لغة البرمجة الجديدة سويفت، لدائرة الرقابة الداخلية، watchOS وtvOS. ومع ذلك، القيام عرضا خاصا من الورق بحوث الذكاء الاصطناعي على بلوق وأبل لا تزال جديدة جدا.

ومن المثير للاهتمام لأسباب عدة. أولا، وقد تم نشر هذه الورقة على أرخايف. نسخة اليوم من الشعر على بلوق نتحدث عن الشيء نفسه، ولكن استخدام لغة أبسط. وبالإضافة إلى ذلك، كما أضاف أبل بعض GIF المتحركة خريطة لتوضيح.

وفقا لهذه المادة، أبل يحتاج إلى تدريب الشبكة العصبية للكشف عن وجوه الإنسان وغيرها من الأشياء في الصورة. لكن أبل ليست وسيلة لتصنيع لعينات صورة لها الملايين من مجموعات البيانات الضخمة لتدريب الشبكة العصبية، ولكن لخلق صورة مركبة الناتجة عن أحرف الكمبيوتر، وتطبيق عامل تصفية يسمح لهذه الصور الاصطناعية أكثر واقعية. هذا هو أرخص من متوسط القطار نهج الشبكة العصبية، وأسرع.

ثانيا، في هذا بلوق، تشجع أبل القراء لإرسالها بالبريد الإلكتروني. تذييل وجود صلة كبيرة إلى صفحات التوظيف أبل. بشكل واضح، وتأمل أبل لاستخدام هذه المنصة للعثور على المهندس المختص.

ثالثا، وانتقد كثير من الناس أداء أبل في تعلم الآلة، وأعتقد أن جوجل وأمازون، فإن هذه الشركات أكثر قدرة. بالطبع، كانت أبل أي تحرك هي الحقيقة. كما يقوم جوجل واليكسا مساعد الأمازون من المنتجات الاستهلاكية مثل هذه أفضل بكثير من سيري أبل.

ولكن في تحليل معرض الأجهزة المحمولة الصورة، اي فون 7 زائد عمق الآثار الميدانية، فضلا عن زيادتها ARkit أبل الواقع، قامت شركة آبل على وظيفة جيدة. بوضوح، والذكاء الاصطناعي وتعلم الآلة، أبل يريد تغيير التصور العام لها.

دعونا ننظر أبل المجلات تعلم الآلة قالت المادة الأولى شيئا.

تحسين صورة مركبة واقعية

حاليا، فإن الشبكة العصبية هي الأكثر مثالا ناجحا للتشرف عليها تعلم طريقة التدريب. ومع ذلك، من أجل تحقيق درجة عالية من الدقة، فإنه يتطلب الكثير من مجموعة التدريب، وتنوع العينة، ولكن أيضا الملاحظات الصحيحة، وهو أمر مكلف جدا. بدلا من وصفها الأسلوب هو استخدام كميات كبيرة من البيانات المحاكي توليفها الصورة. انخفاض تكلفة هذه الطريقة، لأن البيانات لا تحتاج للتعليق، ولكن الصورة الناتجة قد لا يكون صحيحا، تؤدي إلى ضعف التعميم على الصورة الاختبار الفعلي. لحل هذه المشكلة، يقترح أبل طريقة لتحسين صورة مركبة، وصورة مركبة تبدو أكثر واقعية. وأظهرت النتائج أن استخدام هذه الصورة المركبة من خلال صقل نموذج التدريب يمكن أن تحسن بشكل كبير من دقة المهام على عدة آلات التعلم.

الشكل 1: المهمة هي أن تتعلم نموذجا، لم يتم وضع النموذج باستخدام بيانات حقيقية، وذلك باستخدام المحاكاة لتحسين صحة الصورة المركبة، مع الحفاظ على الشروح.

الهدف "لتحسين صحة" هو جعل صورة واقعية قدر الإمكان، من أجل تحسين دقة الاختبار. وهذا يعني أننا بحاجة للحفاظ على آلة تدريب نماذج التعلم المعلومات الشرح. على سبيل المثال، ينبغي الاحتفاظ الاتجاه نظرات العين في الشكل 1، والتي لا تنتج أي التحف (التحف)، وإلا قد يكون تعلم الآلة الإفراط في المناسب لهم. ونحن نعلم الشبكة العصبية العميقة، ويشار إلى "شبكة الجميلة" (شبكة تكرير)، وأصالة تجهيز شبكة من صورة مركبة لتحسين الصورة.

الشكل 2: شبكة غرامة R يقلل من مزيج من وحدات (تنظيم الذاتي) وفقدان جزئي ضد "تطبيع-النفس". ضد فقدان "الخداع" شبكة الممي، تصنف الصورة باسم "صحيح" و "المكرر". لأن الفرق بين الصورة المركبة تطبيع، والحد من دخول صورة المكرر. يتم تحديثها الممي شبكة غرامة وشبكة بالتناوب.

FIG 3: يوضح الخسارة أمام جزئية. شبكة الممي خريطة الانتاج احتمال ث ح. ضد فقدان الوظيفة هو فقدان عبر الكون والتصحيح الجزئي.

الشكل (4): يوضح صورة بصرية باستخدام التاريخ لتحسين الممي.

ويوضح أحد مصغرة دفعة الممي D التاريخ: الشكل 5. تحتوي كل على دفعات صغيرة التكرار الحالي من مولد صورة، وصورة زائفة من المخزن المؤقت السابق.

قام بالتدريب بها، وشبكة الانتاج تكرير: الشكل (6). بدأت لطمس صورة من دراسة محاكاة شبكة تفاصيل الصورة الحقيقية.

الرقم 7: أما بالنسبة للتدريب، والمصنفات مولد للقيمة الخسارة

الرقم 8: مساحة الميزة من فقدان العينة تطبيع.

FIG 9: مبعثر المسافة بين الصورة المركبة والصورة الحقيقية للمركز تلميذ

الشكل 10: استخدام أسلوب لدينا للحصول على صورة غرامة العين

يتم تنفيذ باستخدام صورة المكرر وصورة تركيب العين مقارنة تقدير أنظار المدربين: الرقم 11. الصور الاختبار الفعلي للتقييم.

الشكل 12: مقارنة بين الطرق المختلفة لتقدير نظرة مجموعات البيانات MPIIGaze. يتم وصف طريقتين الأولى في المرجعي و .

لمزيد من التفاصيل حول العمل الموضحة في هذه المقالة، يرجى الاطلاع على ورقة CVPR "التدريب على القتال من خلال التعلم من الصور التناظرية وغير خاضعة للرقابة" (التعلم من مقلد والصور غير خاضعة للرقابة من خلال التدريب الخصومة)، عنوان الورقة: HTTPS: // أرخايف كافيه / أى بي إس / +1612.07828

المزيد من التفاصيل عن الدراسة والمراجع، الرجاء مراجعة الأصلي: الشبكي: //machinelearning.apple.com/2017/07/07/GAN.html

استخدام الأشياء الموجودة لديك، والتركيز على الموارد الموجودة لديك | 8 قائمة تياو من الإجراءات

للمبتدئين: قائمة كأس العالم الوجه المفرج عنهم، سهم Microsoft مليون المشاهير الفائز مسابقة الاعتراف

إيران لتحل محل الدولار مع اليوان، بعد العثور على النفط العراقي المشترين الجدد، وهناك نوعان من الأشياء الجديدة فجأة تغير

فيتنام الاعتماد الاقتصادي المفرط على الدولار، بعد أن تحذو حذو كندا، وهو أول انخفاض أو الأغنياء، ويعتقد فجأة من RMB

البحر المتوسط التركي الأزرق للقيام حلما، ابتسم وسقطت في الحب مع هذا البلد رومانسية

ما Weiying، وقال تشو يونيو، مي تشياو تشو، ليو يانغ، تشين تاو، وتقاسم العميقة الأخرى، CCIR 2017 نظرة عامة

قاد الريف إلى خندق مواجهة جدا؟ العضو: الآن كل شخص لديه سيارة، ليست هناك حاجة!

بعد الاعلان الرسمي من قبل تسوية أموال النفط الفنزويلية، تتقدم الأمور، هناك نوعان من الدول الكبرى على أن تحذو حذوها

والد Keras "دراسة أربعة اتجاهات التكنولوجيا الكبرى، في العمق"، وآلة للباحث جوجل تفكيك دراسة مستقلة

عن طريق الخطأ، ويدفعون الضرائب ...... IQ

قلب مثقوب! الفاخرة مفتوحة السيارة مرة أخرى إلى الريف، لماذا الناس حول الموقف من كل هذا؟

للاشتباه في ورطة، الاحتجاز! و!