يلعبون ستانفورد أرنب 3D نماذج سيئة، واختلاف صورة حدودي اسمحوا الخاص بك الخيال

مذكرة لى فنغ الشبكة: هذه المادة هي عبارة عن تجميع للAI Yanxishe بلوق التكنولوجيا، والعنوان الأصلي للاختلاف البارامترات صورة، مؤلف شيفام بانسال.

الترجمة | مونيكا تشان وانغ تشن زي بن ازهر التدقيق | يوهانغ التشطيب | MY

الشبكة العصبية المدربة على الصور تصنيف من أهمية استثنائية وقدرة مذهلة على توليد صورة. مثل DeepDream، على غرار وميزات التكنولوجيا الهجرة التصور يستخدم هذه القدرة باعتبارها أداة قوية لاستكشاف الأعمال الداخلية للشبكة العصبية، وقوة الحركة الفنية صغيرة تقوم على فن العصبي.

كل عمل حول بنفس الطريقة هذه التقنيات. شهدت الشبكة العصبية الغنية الداخلية المستخدمة في رؤية الكمبيوتر الصور التي يمثلونها. يمكننا استخدام هذا التمثيل لوصف صورتنا وجود الخصائص المطلوبة (على سبيل المثال، نمط)، ثم صورة مدخلات وجود الأمثل هذه الصفات. هذا التحسين هو ممكن، لأن الشبكة ويمكن التمييز في مجال المدخلات هي: يمكننا تعديل طفيف على الصورة لتتناسب مع أفضل الخصائص المطلوبة، ومن ثم تطبيق هذا التعديل في أصل التدرج تكرارا.

بشكل عام، سوف ندخل في قيم المعلمات صورة RGB لكل بكسل، ولكن ليست هذه هي الطريقة الوحيدة. طالما المعلمات إلى صورة الخريطة هي للاختلاف، يمكننا الاستمرار في استخدام أصل التدرج لتحسين المعلمة الاختيارية من الطريق.

1: طالما أن الصورة حدودي هو اختلاف، فإننا يمكن أن يكون الظهير نشر.

اختلاف الصورة حدودي لا يمكن أن تساعد ولكن دعونا نتساءل: ماذا يمكننا نشر صورة جيل العملية مرة أخرى؟ وهناك الكثير من الأجوبة، وحتى بعض يمكن أن تنتج مجموعة متنوعة من الآثار للاهتمام، بما في ذلك الأعصاب 3D الفن والشفافية والمواءمة بين الاستيفاء الصورة. قبل استخدام محددة المعلمات صورة غير طبيعية من العمل وقد أظهرت النتائج مثيرة، ونحن نعتقد أن انخفاض العروض الملاحظة العامة أن هذه المنطقة، حيث هناك أكثر إمكانات لم يتم التنقيب عنها.

لماذا حدودي مهم؟

وعلى الرغم من دالة الهدف الفعلي لا يزال هو نفسه، ولكن تغيير معالم المشكلة الأمثل قد تتغير بشكل كبير على النتائج، يبدو مفاجئا. فيما يلي أربعة أسباب اختيار حدودي قد يكون لها تأثير كبير:

  • تحسين الأمثلية: المدخلات تحويل لجعله أسهل للمشكلة الأمثل، وهي تسمى "تجهيز ما قبل" التكنولوجيا هي تحسين المحتوى الرئيسي. شروط مسبقة عادة ما يقدم التدرج (عادة إيجابية محددة ضرب من قبل مصفوفة "قبل المعالج"). ومع ذلك، هذا التحسين هو ما يعادل مدخلات معلمات النسخ الاحتياطي. وجدنا أن تغييرات بسيطة معلمات بحيث خوارزميات الصورة الأمثل والفن العصبي أسهل.

  • حوض الجذب: عندما كنا تحسين المدخلات للشبكة العصبية، عادة ما تكون هناك العديد من الحلول المختلفة، كل المقابلة إلى الدنيا المحلية المختلفة. تدريب لتحسين معقدة المشهد الرسم البياني (المناظر الطبيعية) الشبكة العصبية مميزة العمق، لهدف معين والتي يمكن أن يكون لها العديد من نفس السلعة الحد الأدنى المحلي. (يرجى ملاحظة أن لإيجاد الحد الأدنى العالمي ليست دائما مرغوب فيه، لأنه قد يؤدي إلى الإفراط في تركيب نموذج.) ولذلك، فإن تحسين مدخلات الشبكة العصبية لديها أيضا العديد من الدنيا المحلية، وهو أمر لا يثير الدهشة. لدينا الأمثل يندرج ضمن أي الحد الأدنى المحلي بشكل خاص من احتمال حوض جاذبيتها (أي في المنطقة لتحسين المشهد الرسم البياني تحت تأثير من قيمة الحد الأدنى) السيطرة. ومن المعروف أن تغيير معالم المشكلة الأمثل سيغير حوض الجذب من حجم مختلف، مما يؤثر على النتائج المحتملة.

  • عقبة إضافية: بعض المعلمات من لا تغطي سوى مجموعة فرعية من المدخلات الممكنة، بدلا من كامل المساحة. في مثل هذه محسن البارامترات ستواصل العمل على إيجاد حلول لتقليل أو زيادة وظيفة موضوعية، لكنها لن تكون القيود معلمات. عن طريق اختيار الحق في مجموعة من القيود يمكن تطبيقها على القيود المختلفة، بدءا من القيود بسيطة (على سبيل المثال، يجب أن تكون حدود الصورة السوداء) لضيق غرامة الغنية.

  • الأمثل الضمني أشياء أخرى: معلمات من كائنات مختلفة في كائن يمكن استخدامها داخليا وكذلك مع انتاجها المستهدف أننا نريد أن الأمثل. على سبيل المثال، على الرغم من أن المدخلات الطبيعي للشبكة البصرية عبارة عن صورة RGB، لكننا يمكن أن تجعل الصورة إلى معلمة كائن 3D، وانتشار العكسي لتحسين صورة أثناء التقديم. منذ الكائن 3D والمزيد من درجات الحرية من الصورة، لذلك نحن عادة استخدام معلمات عشوائية لتوليد صورة المقدمة من وجهات نظر مختلفة.

  • في بقية هذا المقال، نعطي مثالا ملموسا، وهذه الأساليب هي مفيدة، يمكن أن تنتج تأثيرات بصرية مدهشة ومثيرة للاهتمام.

    الجزء الأول: ميزة التصور الاستيفاء محاذاة

    تصور ملامح الأكثر استخداما لتصور الخلايا العصبية الفردية، ولكن يمكن أيضا أن تستخدم في تركيبة لتصور الخلايا العصبية، لدراسة كيفية تفاعلها. لم يتم تحسين صورة كائن من أجل تفعيل الخلايا العصبية الفردية، ولكن لأنه الأمثل لتفعيل تعدد الخلايا العصبية.

    عندما نريد أن نفهم حقا التفاعل بين الخلايا العصبية، ونحن يمكن أن تذهب أبعد من ذلك، وخلق أكثر البصرية، والهدف نقلها تدريجيا من عصبون إلى تحسين وزن الخلايا العصبية الأخرى تفعيلها. هذا هو مماثل لإمكانية المكانية لتوليد نموذج مثل الاستيفاء GAN في بعض النواحي.

    ومع ذلك، لا يزال هناك تحديا صغير: ميزة التصور هو عشوائي. حتى لو كنت الأمثل لتحقيق نفس الهدف، في كل مرة بطريقة مختلفة لتقديم تصور للنتائج. عادة، هذه ليست مشكلة، ولكنها لا ينتقص من الاستيفاء البصرية. إذا كنا نعامل ودون تفكير، وبطريقة خاطئة مما أدى التصور: مواقع مختلفة، كما هو الحال في العين يبدو موقف بصريا كل صورة. هذا النقص في محاذاة قد تكون مختلفة قليلا لأن الهدف من الصعب أن نرى الفرق، لأن أكبر الفرق تنوء من قبل التخطيط.

    إذا كنا محرف إطار ينظر إليها على أنها الرسوم المتحركة، يمكننا أن نرى أن الحل الأمثل مستقلة:

    2

    كيف يمكننا تحقيق ذلك الاستيفاء المحاذاة، الذي لا ينتقل بين الإطار موقع البصرية؟ يمكنك محاولة العديد من الطرق الممكنة. على سبيل المثال، يمكنك معاقبة صراحة الفرق بين الإطارات المجاورة. استخدام النتائج النهائية لدينا وcolab لدينا الساتليه تبادل هذه التكنولوجيا مع المعلمات الدمج. واحد هو استخدام المعلمات المشتركة: ومعلمات كل إطار كمعلمات فريدة من نوعها ومجموعات من المعلمات مشتركة واحدة.

    3

    بواسطة مشتركة جزئيا بين الإطار معلمات، ونحن تصور ممكن الانحياز بشكل طبيعي. حدسي الشعور، المعلمات المشتركة إلى علامة البصري للنزوح يوفر مرجعية مشتركة، وعلى أساس فريدة الأوزان الاستيفاء حدودي التي منحها لهم إلى كل إطار نداء البصرية الخاصة بها. هذا لا يغير من معالم هذا الهدف، ولكن سيتم توسيع البصرية حوض محاذاة الجذب.

    وهذا مثال أولي لكيفية تمييز كيف حدودي تكون عادة أداة إضافية مفيدة لتصور الشبكات العصبية.

    الجزء الثاني: الهجرة في غير VVG الطراز المعماري

    كانت الهجرة من نمط الأعصاب دائما لغزا: على الرغم من أنها حققت نجاحا ملحوظا، ولكن تقريبا يعتمدون على VGG الطراز المعماري ترحيل فعلت كل شيء. هذا ليس لأنه لا يوجد نمط آخر واحد من الهندسة المعمارية على أساس نقل الفائدة، ولكن لأن بعد الآثار تحاول باستمرار لإيجاد سيئة. أمثلة من التجارب مع أبنية مختلفة يمكن الاطلاع على متوسط، رديت وتويتر.

    اليوم، وقد اقترحت عدة افتراضات لتفسير لماذا العمل في الهندسة المعمارية VGG سيكون أفضل بكثير من تأثير على نماذج أخرى. وأحد التفسيرات هو أن يرجع إلى بنية VGG لديها نطاق واسع نسبيا للحصول على معلومات عن نماذج أخرى المفقودة، حتى لو المعلومات المذكورة على تصنيف لا يساعد، ولكنه جعل النموذج أكثر قدرة على إكمال الترحيل من النمط. تفسير آخر هو أنه بالمقارنة مع نماذج أخرى نموذج VGG هو أكثر عدوانية، وهو ما أدى أيضا إلى فقدان للمعلومات المكانية. نعتقد قد يكون هناك عامل آخر: يصبح أكثر صعوبة عندما يكون معظم نموذج البصري الحديث الشطرنج مثل التحف في الانحدار، والتي قد تجعل صورة منمنمة خلال الأمثل.

    في الأعمال السابقة، وجدنا أن المعلمات ذات الصلة من الحل يمكن أن تحسن بشكل كبير على النتائج الأمثل، ولكن يمكن لهذا النهج أيضا تحسين الهجرة الاسلوب. هنا دعونا استخدام نموذج الهجرة أسلوب لم تسفر عن جذابة بصريا:

    4: تحريك شريط التمرير من الصورة النهائية هو الأمثل، وتأثير الاستغلال الأمثل للمساحة بكسل مقارنة مع المساحة غير ذي صلة. يتم إنشاء هذه الصورتين في نفس الهدف، فإنها تختلف تختلف معلمات فقط.

    دعونا نفكر في هذا التغيير أكثر شمولا. وتنطوي الهجرة على غرار ثلاث صور: محتوى الصورة والأسلوب والصورة وبعد صورتنا الأمثل. هذه الصور الثلاث التي وضعها في الشبكة العصبية التلافيف، الكائن الهجرة وغيرها من الفرق الاسلوب هو أن الطرق المختلفة لتفعيل عملية التفاف. لدينا التغيير الوحيد كيف هو الأمثل معلمات الصورة. وفيما يتعلق معلمة من مستوى بكسل (هذا الأسلوب هو عرضة للبكسل المجاورة)، ونحن نستخدم فورييه تحجيم التحويل معلمات.

    5: الصورة ذات الصلة في مجال الهجرة يجعل اختيار نمط للنموذج هي أكثر استقرارا. المحتوى والأهداف صممت للسماح للخلايا العصبية لجعل محتوى علامة صورة في نفس الموقف. أهداف النمط ملتزمة خلق صورة مشابهة لأسلوب وضع تنشيط الخلايا العصبية (دون النظر في العلاقة المنصب). هذا فورييه ثنائي الأبعاد تحويل مخالف.

    يمكن الاطلاع على لدينا طريقة التنفيذ الدقيق في الملحق. علما بأن هذه الطريقة تستخدم أيضا الهجرة الاستقرار، لا ينطبق هذا الاستقرار لجميع أنماط الهجرة.

    الجزء الثالث: توليد مجمع نموذج الشبكة

    حتى الآن، قمنا بالتحقيق في استخدام أساليب فورييه بكسل أو معلمات، وهذه المعايير درجة الوعي للصورة ونحن عادة أقرب. في هذا القسم بحثنا باستخدام معايير مختلفة لإمكانية عملية التحسين إضافة عائقا إضافيا ل. وبدلا من ذلك، ونحن سوف صورة نفس المعايير والثوابت الشبكة العصبية، ولا سيما المعقدة شبكة الجيل النمط.

    توليد نموذج الشبكة هو عبارة عن خريطة المركبة (س، ص) الموقف من ألوان الصورة في الشبكة العصبية.

    ومعقد تطبيق شبكة الجيل نمط لموقع الشبكة، ويمكن إجراء صورة من أي قرار. معلمات الشبكة CPPN - الوزن والانحراف تقرر أي نوع من الصور تم إنشاؤه. العمارة اختيار CPPN و، الصورة الناتجة هي لون بكسل المتاخمة لتقاسم بكسل محدودة إلى حد ما.

    يمكن المعلمات عشوائية تنتج صورة من الفائدة على الجمالية البصرية، لكننا يمكن أن تنتج صورا أكثر إثارة للاهتمام من خلال التعلم المعلمة على CPPN، وعادة ما يتم ذلك عن طريق التطور. هنا، نحن التحقيق في إمكانية العودة انتشار بعض دالة الهدف، على سبيل المثال، يتميز الهدف البصرية. فمن السهل جدا القيام به، لأن شبكة CPPN مع نفس الشبكة العصبية الالتواء هو اختلاف وظيفة موضوعية ويمكن أيضا أن يكون انتشار لتحديث المعلمات من خلال CPPN. وهذا هو، CPPNs هو المعلمة صورة ميكرون - أداة عالمية من أي مهمة بصرية صورة حدودي عصبية أو الفنية

    6: CPPNs ومعلمات صورة الصغيرة، ونحن يمكن أن تمر يتم تطبيق الصورة إلى الشبكة العصبية للفن أو التصور المهام انتشار العكسي، المعلمات التي تم الحصول عليها عن طريق CPPNs.

    استخدام CPPNs قادرة على إضافة الفن جودة الفني للاهتمام باعتباره العصبي البارامترات صورة شبكة، دعونا نفكر في قاتمة اللوحة الخفيفة. (لاحظ أن هنا استعارة photoplotter هي أكثر غموضا: على سبيل المثال، على ضوء توليفها هو عملية بالإضافة إلى ذلك، يمكن أن تكون إعادة توصيل كتبها CPPNs الأوزان السلبية بين طبقات هي مستوى أكثر النظرية التي يمكن أن ينظر إليه باعتباره مقيدة لك صورة. توليف عوامل التعقيد. عندما تستخدم لتحسين خصائص التصور معينة، فإنها تنتج صورة مختلفة.) ويوجه لإنتاج فن الوسائط البصرية للتحكم في صورة ملونة شعاع ضوء يمر من خلال منظور ومرآة. التطبيقات العملية لهذه التكنولوجيا هي عمل ستيفن ناب.

    7: CPPN للتفاضل كما تحتوي على صورة حدودي بين طبقات مختلفة عن التصور.

    تأثير CPPN الهندسة المعمارية الصورة المرئية التي تولدها كتلة المحدد وليس فقط على شكل شبكة (أي عدد من الطبقات وبمثابة فلتر)، ولكن أيضا مع وظيفة تفعيل المختارة ذات الصلة مع التطبيع. على سبيل المثال، شبكة عميقة الضحلة نسبيا للعنصر شبكة لإنتاج أكثر دهاء. ويتم تشجيع القراء على توليد صور مختلفة عن طريق تغيير بنية CPPN، إذا كنت ترغب في محاولة، ثم يمكنك يمكن القيام به بسهولة عن طريق تعديل التعليمات البرمجية في التذييل.

    نمط CPPN أنتجت هو نتاج لتطور الفن. من أجل الحفاظ على معنى رسمت الضوء، يجب أن عملية التحسين النظر في تعديل الاتجاه شعاع وشكل التكرار. على سبيل المثال، منذ تغيير متكررة بالمقارنة مع المعلمة بكسل النفوذ أكثر عالمية. عند تحسين بداية، إلا أن النمط الأساسي مرئيا من خلال الأوزان تعديل تكرارية، ونعتقد أنها سوف شعاع لتفاصيل أكثر اكتمالا تظهر في المكان المناسب.

    8: CPPNS خلال الانتاج التدريب. يمكنك على جهاز محمول عن طريق التحكم في كل فيديو أو تحلق بشكل بات.

    من خلال هذه الاستعارات، ونحن يمكن أن تخلق وسيلة لتحويل صورة من أي من أعلاه إلى صورة مختلفة لنوع جديد من الرسوم المتحركة. حدسي، لدينا لخلق صورة جديدة عن طريق إزالة شعاع من الضوء والظل على النحت. في الواقع، ويتحقق هذه النتيجة عن طريق الإدراج ضمن نوعين من وسائط مختلفة من التعبير الصحيح الثقيلة CPPN. ثم تولد صورة في الحالة التي يكون فيها نظرا تمثيل الاستيفاء CPPN للحصول على عدد وافر من الإطارات المتوسطة. كما كان من قبل، والمعلمات التغيير والعالمية، وخلق ارضاء بصريا الإطار الأوسط.

    9: الأوزان إدراج CPPN نقطتين المعروف المتوسط

    في هذا القسم، نقترح عظمى معيار التمثيل صورة حدودي. تحسين وظيفة موضوعية لصورة معينة، والشبكة العصبية (في هذه الحالة CPPN) يمكن أن تستخدم لإعداد المعاملات. بدلا من ذلك، فإننا سوف ميزة البصرية وCPPN حدودي دالة الهدف تتضافر لخلق صورة قرار النمط البصري الفريدة غير محدود من.

    الجزء الرابع: توليد نمط شفافة

    يتم تدريب الشبكة العصبية المستخدمة في هذه المقالة للحصول على صورة 2D RGB كمدخل. هل يمكنني استخدام شبكة مماثلة للعمل خارج تركيب هذا النموذج ذلك؟ قد أثبتت المعلمة التفاضلية باستخدام تعريف سلسلة من الصور بدلا من صورة واحدة، ومن ثم اتخاذ واحد أو عدة صور من سلسلة من التحسين في كل خطوة يمكن تنفيذها كعينة. هذا مهم جدا لأننا ذاهبون لاستكشاف العديد من الأشياء الأمثل عند دخول الشبكة من الصورة لديها أكثر من مستويات ودرجات الحرية.

    ......

    تريد مواصلة القراءة، يرجى الانتقال إلى مجتمعنا AI Yanxishe: الشبكي: //club.leiphone.com/page/TextTranslation/859

    المزيد من المحتوى المثير لجعل AI Yanxishe.

    مختلف المجالات بما في ذلك رؤية الكمبيوتر، ودلالات الكلام، سلسلة كتلة، الطيار الآلي، واستخراج البيانات، التحكم الذكي، لغات البرمجة وغيرها تحديثها يوميا.

    لى فنغ لى فنغ صافي صافي

    المعارك فريق جرد ملك المجد "قنبلة ذرية"

    "أربعة في واحد" تصميم جسم الطائرة: أصدرت جوجل PixelBook المحمول

    مطيع انفجار يوم السينما | "الكابتن المعجزة" الافراج مزامنة أمريكا الشمالية، "مجمع مع 4" سيتم الافراج عنهم في وقت واحد في ذلك؟

    صدر أودي الكهربائية SUV في 2018 أكثر من 500km التحمل

    أمام طاقة عالية! جونيا واتانابي س الشمالي وجه 2017 الخريف والشتاء سلسلة الكشف الكامل!

    الخالد شياو تشيانغ، أوندد - Yaojin

    اليوم الوطني للخروج دون انخفضت الكرة! طول عمر البطارية + تهمة سريع الهاتف الموصى بها

    وفوكودا سافانا الجديدة المدرجة للبيع 13،18-18،68 عشرة آلاف يوان

    مجهزة ستة أجهزة استشعار ذكية، هيسنس الحكمة المنزلية أصدرت سلسلة جديدة من الأقفال الذكية

    "غرفة الأسرار الهروب" سمعة قوية من مئات الملايين قوية، لديها مفاجأة جديدة كل فرشاة مرة أخرى!

    هوندا أوديسي الجديدة المدرجة للبيع 22،98-29،98 عشرة آلاف يوان

    وجدت السفر قطعة أثرية الأساسية والتعبئة الأمتعة نصائح مجلة شو غرفة Vol.312 - دليل السفر