أعلنت غوغل وOpenAI فك تشفير الصندوق الأسود سمات الشبكة العصبية: إذا كانت خريطة اللعبة

[استعراض] جوجل الجديدة جي وون وOpenAI مشترك صدر تفعيل أطلس (خريطة تفعيل)، وأخيرا صورة تصنيف الشبكة العصبية "الصندوق الأسود" الذي يمثله وسيلة بصرية! AI العالم هو مدهش حقا!

منظمة العفو الدولية في نظر العالم هو خريطة تفعيل (تفعيل الأطالس).

في الآونة الأخيرة، وجوجل شارك في تأسيسه مع OpenAI تفعيل الأطالس هذه التقنية الجديدة هي التفاعل البصري بين الخلايا العصبية. باستخدام خاصية معكوس (ميزة انعكاس) لتنشيط تصنيف الصور تصور الملايين شبكة الأرقام.

وبعبارة أخرى، افتتح أخيرا العصبي تصنيف الصور شبكة من الصندوق الأسود. هذه الإرادة مساعدة الباحثين على فهم أفضل لعملية داخل منظومة AI صنع القرار.

تفعيل Atalas: مخفي الشبكة العصبية طبقة يمكن أن تمثل ما

دعونا ننظر بعض العيوب من الأعمال السابقة:

(الخلايا العصبية واحدة) الخلايا العصبية الفردية تصور طبقة خفية لجعل المعنى، ولكن تجاهل التفاعل بين الخلايا العصبية - أنه يظهر فقط علينا تفعيل واحد الأبعاد المتعامدة من المسبار الفضائي عالية الأبعاد. (البشرى التفاعل) يكشف عن تأثير من زوج من التفاعل التفاعل، ولكنها تظهر فقط شريحة ثنائية الأبعاد مع مئات من أبعاد الفضاء، والعديد من تركيبات غير واقعية. (مساحة التنشيط) يمكن تفعيلها من خلال عديدات الطيات الجزئية الفضاء تفعيل عينات العديد من تركيبات من العروض الحيوية إلى الخلايا العصبية لدينا، لكنها تقتصر على سبيل المثال تعطى تلك الخلايا العصبية التي تظهر في الصورة. (تفعيل أطلس) عن طريق أخذ عينات مجموعة متنوعة من الممكن تفعيل، توفر التنشيط Atlase لنا نظرة عامة أكثر شمولا.

تفعيل Atalas بنيت على أساس الخصائص البصرية، وهذا هو دراسة " ما يمكن التعبير عن طبقة خفية الشبكة العصبية "التكنولوجيا.

قبل الخوض تفعيل Atalas، أول استعراض لفترة وجيزة كيفية استخدام ميزة لتصور ناقلات تفعيل يصبح ذا معنى، وهذا هو، كيف "نرى من خلال شبكة من العيون" الشيء. وهذه التكنولوجيا هي أساس تنشيط Atalas.

ملاحظة: تركز هذه المقالة على الشبكة العصبية هي InceptionV1، المعروف أيضا باسم GoogLeNet.

لأن InceptionV1 هو عبارة عن شبكة التلافيف، كل صورة من كل طبقة ليست مجرد تنشيط النواقل.

وهذا يعني أن تشغيل نفس الخلايا العصبية في طبقة الأولى من كل التصحيح. مئات وهكذا، عندما تنتقل الصورة بأكملها من خلال الشبكة، وسوف يتم تقييم كل عصبون من الأحيان، يتم تقييم كل من كتلة صورة متداخلة أولا.

والنتيجة هي ميزة البصرية للشبكة، ولكل واحد التصحيح. هذا يظهر لنا كيف أن نرى أجزاء مختلفة من الصورة المدخلة الشبكة.

(يسار) من ImageNet صورة المدخلات؛ (يمين) من InceptionV1 الشبكة التنشيط، طبقة mixed4d.

هذا هو الحال في صورة واحدة، ولكن إذا كان عدد من الصور والملايين، ثم رد فعل منظمة العفو الدولية، وكيف سيكون ذلك؟

نبدأ مع تفعيل المليون الصور التي تم جمعها البداية.

وسوف نختار عشوائيا مساحة لتفعيل كل صورة. لقد كان هذا من مليون ناقلات التنشيط. كل ناقلات هو عالية الأبعاد، وربما 512 الأبعاد! لمثل مجموعة معقدة من البيانات، إذا كنا نريد عرض كبير، ونحن بحاجة إلى أن المنظمة والبلمرة.

أبعاد تخفيض بعض التكنولوجيا المتقدمة التي يمكن جمعها من ناقلات تفعيل المتوقع أن يكون من المفيد تخطيط ثنائي الأبعاد، والحفاظ على بعض من هيكل المحلية من المساحة الأصلية. مرسومة على تخطيط الشبكة 2D خلق كل خلية في الشبكة، وتقع في المتوسط كل نشطة، واستخدام ميزات ضمن حدود الخلية لإنشاء رمز البصرية.

(يسار) لجمع مليون ناقلات تفعيلها من الأمثلة التدريبية المختلفة.

(في) وهي مرتبة في 2D، بحيث عناصر مماثلة يتم ترتيب أكثر معا بشكل وثيق.

(يمين). في المتوسط مضيفا الشبكة لكل خلية، ومعالمه البصرية.

طبقة mixed4c تطبيقها على InceptionV1، من اليسار إلى اليمين: 20x20،40x40،80x80،160x160.

أطلس اللوحة للوهلة الأولى قد يكون قليلا تطغى الناس، ويعكس هذا التنوع في مجموعة متنوعة من تطوير نموذج مجردة والمفاهيمية.

وإذا نظرنا إلى الجزء العلوي الأيسر من الأطلس، وسوف نرى شيئا يبدو وكأنه رأس الحيوان.

هناك بعض الاختلافات بين أنواع مختلفة من الحيوانات، ولكن يبدو أن بعض العناصر الأكثر شيوعا الثدييات - العيون، والفراء، والأنف - وليس مجموعة من أنواع مختلفة من الحيوانات.

ونحن نتحرك أسفل، ونحن نبدأ في رؤية الجزء الخلفي من أنواع مختلفة من الفراء والحيوانات التي تدب على أربع.

مقابل ذلك، نجد الساقين الحيوانات المختلفة، وقدم يستريح على أرضية مختلفة.

في ما يلي القدم، أن نبدأ في فقدان أي جزء من الحيوان يمكن تحديد وعزل الأرض ونرى الأرض. لقد رأينا نسبت إلى "الرمال" والأشياء الأخرى الموجودة في البيئة وكذلك على أرض الواقع، مثل "ممسحة" أو "النملة".

هذه الرملية خلفية الصخور ببطء إلى الشاطئ والماء. هنا يمكننا أن نرى الماء صعودا وهبوطا في البحيرات والمحيطات. ولئن كان صحيحا "الواجهة البحرية" هذه فئة معينة من الشبكات العصبية، لكننا نرى الكثير من صفات الحيوانات البحرية، والحيوانات نفسها دون أي إشارة بصرية ذات الصلة.

ولكن الخبر السار هو أن أنشطة الطبقات "شاطئ البحر" والأنشطة لتحديد تصنيف البحري "نجم البحر" أو "أسد البحر" هي نفسها. في هذه المرحلة، والبحيرات والمحيطات لا فرق حقيقي - "البحيرة" و "فرس النهر" الملكية و "نجم البحر" و "ستينغراي" معا مختلطة.

ركز التصور في وقت مبكر من الميزات على الخلايا العصبية واحدة. وجمع الآلاف من الخلايا العصبية والتفاعلات سبيل المثال تصور، ونقل التنشيط Atalas من الخلايا العصبية واحدة إلى الخلايا العصبية معا تمثل هذه المساحات.

الآن دعونا القفز إلى الجانب الآخر من الأطلس، حيث يمكننا أن نرى العديد من أجهزة الكشف عن النص مختلفة. عند تحديد الطبقة، مثل "القائمة"، "موقع ويب" أو "سترة كتاب" وما شابه ذلك، فإن الكشف عن أن تكون مفيدة جدا.

مرة أخرى جهة النظر هذه، يمكننا أن نرى الكثير من الناس مختلفة. هناك القليل في فئة خاصة ImageNet الأشخاص لتحديد، ولكن الكثير من الناس تظهر في الصورة.

رأينا مقالا ( "المطرقة"، "الناي") أن الناس يستخدمون، الناس ارتداء الملابس ( "التعادل"، "صندوق البريد")، وكذلك الناس للمشاركة في أنشطة ( "كرة السلة") الخصائص. في هذه التصور، واللون هو نفسه، نعتقد أن هذا يعكس توزيع البيانات المستخدمة للتدريب.

وأخيرا، والعودة إلى اليسار، يمكننا أن نرى الطعام دائري والفواكه بشكل رئيسي من قبل ألوان - شاهدنا نسبت إلى "الليمون"، "البرتقالي" و "التين".

عملية التنمية نموذجية على مستويات متعددة

العمل أعلاه، ركزنا على شبكة --mixed4c طبقة، والذي يقع في وسط الشبكة. شبكات الإلتواء وغالبا ما تكون عميقة، ويتألف من عدة طبقات، وبناء تدريجيا تجريد أكثر قوة. من أجل الحصول على نظرة شاملة، يجب أن ندرس كيف نموذج مجردة للتنمية على مستويات متعددة.

أولا، دعونا نقارن من ثلاث طبقات من مناطق مختلفة من الشبكة، من أجل فهم الخصائص المختلفة لكل طبقة --mixed3b، mixed4c وmixed5b. وسوف نركز على كل يساهم المنطقة لتصنيف "الملفوف".

عندما شبكة الهاتف النقال وراء طبقة من الخرسانة ويظهر لتصبح أكثر تعقيدا.

لأن كل طبقة من طبقات مبنية على أعلى من ذلك الطبقة النشطة من تفعيل السابق. بعد واحد من المجالات المقبولة غالبا ما تكون أكبر من سابقتها (وهو ما يعني مجموعة أكبر من الصور فرعية)، لذلك يبدو هذا المفهوم لتحتوي على كائنات أكثر بأكملها.

هناك ظاهرة جديرة بالملاحظة آخر: يتم تكريره ليس فقط هذا المفهوم، والمفاهيم الجديدة الناشئة من مزيج من المفهوم القديم لل.

وأخيرا، إذا كان لنا أن يتقلص قليلا، يمكننا أن نرى شكل الفضاء تفعيل أوسع هو كيفية تغيير من طبقة واحدة إلى أخرى. من خلال مراقبة منطقة مماثلة في عدة طبقات متعاقبة، يمكننا أن نرى أن مفهوم تم صقلها وتمييز - في mixed4a، ونحن نرى سائل عامة غامضة جدا، من خلال mixed4e يتم تكريره في أكثر تحديدا "شبه الجزيرة ".

خريطة التنشيط، الطبقة الحدودية ومن المرجح أن تؤدي إلى الشبكة العصبية "خطأ" السبب الرئيسي

تسليط الضوء على فئة محددة أطلس كاملة من تفعيل تساعد على فهم الطبقة كيفية "رؤية" الشبكة المرتبطة كاملة الحجم.

ولكن إذا كنا نريد حقا للمساعدة في عزل تفعيل فئة معينة، يمكننا إزالة كافة نشطة أخرى. وبالمثل أطلس عام، ونحن تشغيل للحد من البعد على أساس معينة تفعيل 5 ناقلات، يتم ترتيب لتفعيل التصور القائم على ميزة معروضة بشكل جماعي في FIG.

الطبقة تفعيل أطلس تتيح لنا أن نفهم أكثر وضوحا ما استخدامات شبكة كاشف لترتيب فئة معينة. في المثال من "أنبوب التنفس"، يمكننا أن نرى بوضوح البحر، تحت الماء ولون الأقنعة.

ومع ذلك، في بعض الحالات، ونحن نريد أن نرى وجود علاقة قوية (مثل الأسماك والغواصين). قد تفعيل هذه نفسها من الطبقة مهتما نحن في المساهمة الكبيرة لفئات مختلفة، ولكن وجودها قد يكون أيضا مساهمة أكبر للطبقة مهتما لدينا في.

لهذه، ونحن بحاجة إلى تحديد أساليب التصفية مختلفة.

لفهم فورا عن جميع الخلافات بين الطبقات قد يكون من الصعب بعض الشيء. وعلى سبيل المقارنة، يمكننا أن هذين الرأيين في عرض واحد. سنقوم رسم الفرق بين السمة "غص" و "الغوص" في الاتجاه الأفقي، وذلك باستخدام تي SNE المجاميع أنشطة مماثلة في الاتجاه الرأسي.

في هذه المقارنة، يمكننا أن نرى بعض الطيور والبيولوجية وترك أنبوب واضح، مما يشير إلى أن "غص"، في حين أن بعض من نفس أسماك القرش البيولوجية وجولة الحق، لامعة، والأشياء المعدنية، ويعني " سائق الغوص "ذات الصلة.

دعونا نركز تم الحصول عليها من البيانات وضع علامة "غص" ImageNet من الصورة وإضافة محتوى مماثل لهذا الرمز لمعرفة كيف يؤثر ذلك على درجة تصنيف.

هنا وضع الفشل ويبدو أن هذا النموذج يستخدم للكشف ل "البخار" لتحديد فئة من خزان الهواء لمساعدة "تصنيف الغواصين.

ونحن نسميها "متعددة الأغراض" وظيفة - كشف يمكن الرد على التشابه البصري من مفاهيم مختلفة للغاية. دعونا ننظر الفرق بين "الحيتان الرمادية" و "الفك المفترس" لرؤية مثال آخر لهذه المشكلة.

في هذا المثال، نرى مسرحية أخرى دورين يبدو كشف عن: أسماك القرش وخياطة حمراء على لعبة البيسبول كشف أسنان بيضاء والفم وردي.

ويبدو أن هذا التنشيط كشف أيضا في طبقة مختلطة 5B أطلس مرشح لفيلم "الفك المفترس"، نقطة وطنه هي جميع أنواع الكرات، والأكثر أهمية هو "البيسبول".

دعونا إضافة الصور إلى لعبة البيسبول ImageNet في "الحيتان الرمادية" في الصورة، لنرى كيف أنها تؤثر على التصنيف.

لذلك، وهذا هو السبب في الشبكات العصبية وغالبا ما تكون خاطئة دائما شيء.

زيادة قناة الصغرى دائرة زيارة الأصدقاء وظيفة؟ فريق الصغرى الرسالة: لا داعي للذعر، كاذبة!

أفرجت أغنى أحدث تصنيفات هونج كونج السري أغنى رجل لي كا شينج 19 عاما من الاحتلال؟

اختبار لكزس ES200 (تحت): إذا كان أي شخص يقول أنه ليس ما يكفي من القوة، وتذهب مع هذه الكراهية تا

الموسم اليابان ألعاب القوى المحلية دون نجاح يذكر، سباق الصيني تجنبها تماما اليابان، مشروع إلا في حالة تهديد

قانون الكم مور يخرج! حجم الكم يتضاعف كل عام، الكم الهيمنة 10 سنوات

بولندا 3-0 كولومبيا، وهما الأسطوري بالسعادة، ليفانتي مكتئب الجماهير تذرف دموع الجمال

مسار تجربة شفروليه سيارة عالية الأداء: فتيلة الذاتي نماذج التوربينات مع V8 والألعاب التيار الوردي دائرة مدى صعوبة

بلغت مبيعات حديقة القطرية العام الماضي إلى 308800000000 يوان CFO: نحن ندرس انكه

لماذا الناس إكسياوجان الزواج في فصل الشتاء أكثر؟ لذلك هذا هو ......

اختبار لكزس ES200 طبعة فاخرة (على): ما زلت تلعب بها، وأنت حر

جنونا كأس العالم ليلة! 3 الوحشي حرب 14 كرات، انكلترا واحد لعبة سجل ستة أهداف في بنما

بأنها "وهمية العاصمة الحذاء" من الإنتاج السنوي بوتيان أكثر من 60 مليار تمثل اثنين في المئة من صافي المبيعات