الجاف | مقتطفات ثلاثة طريقة استرجاع الصور ميزة من دليل إلى دراسة معمقة

مقدمة

البحث عن الصور هو موضوع مشترك في رؤية الكمبيوتر، معالجة الصور الرقمية، وما إلى ذلك، في سياق علمي المتعلقة التعلم، واسترجاع الصور يعتبر تجريبي تعلمت الأولى من عملية التسجيل هو تحديد صور مماثلة (أ) واستخدام الثعبان تحديد الصور باستخدام الثعبان (ب) مقالين، كل من الرسم البياني سجل مطابق، phash / متوسط التجزئة / dhash ثلاث طرق تقوم على تجزئة.

تم الاسترجاع إطار الصورة يمكن تقسيمها إلى ما يقرب من خطوتين، واستخراج سمة معينة، بحساب التشابه. حيث العديد من الطرق على النحو المذكور أعلاه، يتميز في ذلك خطوة استخراج المقابلة، ويتم احتساب التشابه، وكثيرا ما يستخدم المسافة الإقليدية / المبالغة بعد / ثلاثية مثل. ومن الواضح أن الأساليب المذكورة أعلاه كلها أساليب اصطناعية مصممة لاستخراج الميزات، فمن الطبيعي أن نفكر في استخدام اليوم الجو حار جدا التعلم العميق لتحل محل الطرق اليدوية التصميم، لذلك تركز هذه المقالة على عمق التعلم تقوم على استرجاع الصورة .

توضح هذه المقالة قليل التالية:

  • عمق التعلم من رموز تجزئة ثنائي للصورة سريعة استرجاع - CVPR ورشة عمل 2015

  • تجزئة تشرف DEEP FOR IMAGE FAST استرجاع - CVPR 2016

  • ميزة التعلم القائم على تجزئة أشرف ديب مع تسميات البشرى - IJCAI 2016

ذكر التعلم باستخدام ميزة صورة استخراج العمق، تعتبر الصناعة عموما في الصورة نموذج السابقة، طبقة التفاف الجبهة هي المسؤولة عن استخراج الخصائص ذات الصلة، والطبقة النهائية مرتبطة كليا أو جلوبال تجميع المسؤولة عن تصنيف، بل هو عادة ممارسة لمباشرة اتخاذ القليلة الأولى طبقة الناتج الالتواء، ومن ثم حساب التشابه.

ومع ذلك، وهذا ينطوي على المشكلة، وأول المشاكل دقة البيانات، خرج لأن الوصول المباشر إلى ميزة يتحرك في الغالب، والقيم ميزة البعد عالية والذي يسبب هذه الصور سوف تنفق الكثير من مساحة التخزين، منذ ارتفاع خط العرض الثاني، حساب التشابه مع المسافة الإقليدية بهذه الطريقة، قد تؤدي عنة من الأبعاد، والاستفادة من المسافة الإقليدية يمثل فشل تشابه هذه الطريقة.

حل واحد هو استخدام دالة منشئ ثلاثية يمكن أن تتعلم كيفية حساب التشابه في الشبكة العصبية. على الرغم من أن هذه الطريقة ليست مجموعة ثلاثية الموصوفة هنا، ولكن بالنسبة للقارئ أن تترافق طريقة المقارنة الأفقية، وصف خاطفة ادناه على أساس الممارسة ثلاثية.

النهج الثلاثي هو في غاية البساطة، بناء مصطنع مجموعة ثلاثية تضم مجموعة ثلاثية (صورة A، B صورة مماثلة لA، A و C يست صورا مماثلة)، والشبكة العصبية المطلوب الذي المدخلات صورتين، إذا كان وبالمثل، على أعلى درجة هو الإخراج، إذا كان الناتج أدنى جزء مماثل.

التكوين فقدان الثلاثي هو مبين في الصيغة أعلاه، حيث و (الحادي عشر) هو صورة كسور في إخراج الشبكة العصبية، و (اكس) في جزء مماثل من إخراج الشبكة العصبية، و (XK) ليست صور مماثلة النتيجة الانتاج في هذا التعبير، ونحن نتطلع إلى مماثلة بين عشرات من الصورة، في أقرب وقت ممكن، وليس بعيدا من عشرات صورة مماثلة. هناك مشكلة دون النظر ، على ما يبدو،

في

عندما L = 0،

وهذا لا تلبي يحدونا الأمل في أن صور مماثلة وتختلف الصورة يسجل هناك بعض فترات هذا الهدف في الفضاء، ومن المقرر ، فمن هذه الفترة.

من الواضح، يتم تعيين صغيرة جدا، والشبكة العصبية ليست من السهل التمييز بين الصور المشابهة، مجموعة عالية جدا، أي ما يعادل أكثر تطلبا الشبكة العصبية، وتقارب الشبكات العصبية أن يكون أكثر اضطرابا.

عندما ثلاثية البحث عن الصور لعينة التالية لكل فئة ليست هي القضية، مثل كشف الوجه. لكن الأبحاث تشير الى أن هذا المبنى تؤثر جمع ثلاثية من آثار التدريب، وكيف يكون ذلك تعريفات اصطناعية مماثلة وليس ما شابه ذلك، وهناك أيضا الأعمال ذات الصلة وضعت على بناء ثلاثية، ولكن أساسا هو طريقة أخرى، التي يستند إليها هذا المقال الحديث عن ثلاث طرق التجزئة.

عمق التعلم من رموز تجزئة ثنائي للصورة سريعة استرجاع - CVPR ورشة عمل 2015

والسبب في اختيار هذه المادة التي سيتم مناقشتها، لأن أسلوب المذكورة في هذه المادة من العمل الفكري وفوق وتحت المادة أن أذكر التفكير المفرط أكثر طبيعية، لتسهيل فهم.

المذكورة أعلاه، وأبسط طريقة هي استخدام طبقة الانتاج سمة الشبكة العصبية لحساب المسافة المكانية لتحديد درجة التشابه، ولكن هذا سوف يؤدي إلى بيانات الاستهلاك والفاصلة العائمة تخزين عنة الأبعاد. لهاتين المسألتين، وهذه الطريقة المادة المقترحة هو أكثر مباشرة.

كيفية القيام بيانات الفاصلة العائمة؟ وسوف تكون مشتتة في نوع البيانات الثنائية، وهي سلسلة من 0 و 1 التجزئة، لذلك سوى عدد قليل سوف تكون قادرة على تخزين بايت من البيانات.

الأبعاد عالية كيف نفعل؟ وضغطها إلى أدنى مستوى له في الأبعاد الصور.

لهذا السبب أقول إن فكرة هذا المقال هو اضحة إلى حد ما وسهلة الفهم، ومناسبة جدا للمادة الأولى على المرحلة الانتقالية.

هنا للحديث عن ممارسات محددة لهذه المادة:

توزيع لأننا نريد أن نكون خصائص الانتاج منفصلة إلى 0 و 1، ومن المؤمل هو متناظرة حول قيمة، ثم ما دام يمكن أن تكون قيمة عتبة الثنائية، لذلك خطوة بخطوة لاستخلاص هذه القيمة، والتفكير بشكل طبيعي باستخدام تان أو وظيفة السيني، منذ خرج من الصفر حوالي 0.5 أو متناظرة. السيني بدلا من الورق المستخدم في الطبقة الثانية هي وظيفة من ReLU متبادلة الشبكة قبل تدريب، ويتم ضغط الإخراج إلى البعد بين 12-48، ثم صقل.

في عملية صقل، وهناك عدد قليل: يشير لدينا طريقة تقليم العام للجبهة اليمنى للالتفاف على تجميد الثقيلة، والأوزان المصنف ثم تدرب في وقت لاحق. ولكن هنا، بسبب الانخفاض في أبعاد الطبقة المتوسطة الثانية يتم ظيفة تفعيل السيني قد يسبب يختفي التدرج، وقدرة الشبكات العصبية في الواقع لديها درجة معينة من التوهين. كذلك الحال بالنسبة لصقل الوقت، ولكن المعلمات من طبقة السيني باستخدام التوزيع العشوائي، يتم الاحتفاظ المعلمات المتبقية، بما في ذلك معظم المعلمات من المصنف، ثم أثناء التدريب، السيني باستخدام الاستخدامات 1E-3، وطبقة المتبقية معدل التعلم 1e- معدل 4 التعلم من التعلم. لcifar10 التحدث واستخدام تعزيز البيانات، يمكن أن تصل إلى حوالي 89 دقة، استرجاع الصور خريطة يمكن أن تصل إلى 85، يمكننا أن نقول أداء مؤثرة جدا.

أوراق تحتوي على وصلة:

تنفيذ المرجعي:

https://github.com/flyingpot/pytorch_deephash

تجزئة تشرف DEEP FOR IMAGE FAST استرجاع - CVPR 2016

عند الإشارة إلى ميزات نأمل الناتج منفصلة أعلى من قيمة معينة على التماثل، لذلك هناك مواد تستخدم بوصفها وظيفة تفعيل السيني من خصائص الانتاج من طبقات، ولكن اشارة مباشرة الى وظيفة السيني يمكن أن تؤدي إلى مشاكل، وأنه لا توجد وسيلة للتخفيف من هذه المشكلة؟ نعم، هذا هو الأسلوب من استخدام الناتج الإيجابي مقيدة ضمن نطاق معين.

هذه الورقة CVPR 2016 الممارسة هي الحالة، وليس طبقة وسيطة باستخدام شبكة سرية مثل المادة المذكورة أعلاه إلى تجزئة، ولكن استخدام الشبكة العصبية تعلم التجزئة مباشرة الترميز وسوف تكون مقيدة طريقة تنظيم الترميز.

على وجه التحديد، مقيدة بحيث إخراج الشبكة العصبية من قبل بالطريقة العادية داخل {1،1} (0 discretizing استخدامه لاحقا حيث بلغت قيمة العتبة) الإخراج، ومن ثم السماح للقاء شبكة المتطلبات التالية عندما متجه المسافات التشابه يجب أن تكون قريبة، بعيدا، والعكس بالعكس، لتقديم مظهر معين التالية من العملية التي دالة الهدف

دالة الهدف:

حيث B1، B2 هو متجه الناتج من الشبكة العصبية، ص هو العلم مماثل لجهاز توقيت و0، 1 لا يشار إلى ما شابه ذلك، وهو ما يتجاوز معلمتين، للسيطرة على الوقت الأمثل B1 الفاصل وم B2، و هو مصطلح الإيجابي للوزن المناسب، غير مرئية عند الصور المدخلات، ص = 0، للحد L، مرغوب فيه لتقليل المسافة بين اثنين من ناقلات وشروط التنظيم. عندما الصور ليست مماثلة، ص = 1، مثل أن يطلب الحد الأدنى المسافة L من متجهين موزعة في محيط م، وللحد من التنظيم.

تقنين المدى ناقلات ميزة النهائي بحيث توزيع الناتج {-1، 1}.

وهذا الرقم أقل يظهر تأثير م ألفا وتوزيع الانتاج.

لالخريطة النهائية فقط 0،54-0،61 CIFAR-10، والطريقة الأولى هي أقل من المذكورة أعلاه، ولكن جوهر هذا الأسلوب ليكون أكثر مرونة.

أوراق تحتوي على وصلة:

https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Liu_Deep_Supervised_Hashing_CVPR_2016_paper.pdf

تنفيذ المرجعي:

https://github.com/yg33717/DSH_tensorflow

ميزة التعلم القائم على تجزئة أشرف ديب مع تسميات البشرى - IJCAI 2016

كما هو مبين، ذكر الطريقة الثانية أعلاه، والمادة متشابهة إلى حد كبير. لم يتم استخدام طبقة المتوسطة والملامح تصنيف الشبكة، ولكن تأخذ مباشرة من الشبكة العصبية التعلم وظيفة تجزئة، وتتميز طريقة القيود تسلسل تسوية لإخراج طائفة معينة.

ويفسر العملية التالية من شكل معين من دالة الهدف من:

حيث b هو متجه الانتاج، SIJ تسمية، على غرار 1، وإلا 0، ij = ثنائية * BJT، وW، والخامس هو الطبقة الأخيرة على التوالي من الاوزان والتحيز، و (خ. ) وهذا هو معكوس أولا الناتج من الطابق الثاني.

تحديث خطوات الخوارزمية هي على النحو التالي:

طريقة للحصول على قيمة 0،71-0،80 الخريطة على مجموعات البيانات CIFAR-10.

أوراق تحتوي على وصلة:

https://cs.nju.edu.cn/lwj/paper/IJCAI16_DPSH.pdf

تنفيذ المرجعي:

https://github.com/jiangqy/DPSH-pytorch

ملخص

حصة هذه المادة قبل استخدام الطرق اليدوية لقواعد التصميم لميزة استخراج الصور يستخدم لقياس التشابه، ثم قدم دراسة متعمقة عملية البحث عن الصور، ويعطي ثلاث مواد يصف الإطار العام والتفكير بمعالجة مهام البحث عن الصور.

(^ 0 ^) تقاسم ترحيب، أراك غدا!

صاحب انفجار التمثيل، لعبت الشرير متجذرة جدا ليتم استدعاؤها مثالا سيئا في نهاية المطاف!

السنة الجديدة الصينية المماطلة ستة أيام للفوز 3300000000، ترى "رحلة إلى الغرب" أو "اليوغا الكونغ فو"؟

إرسال يي شي فاحت ألف مانور البريطاني أرسلت هواتشن يو لامبورغيني؟ جماهير طاغية هم مثل Starchaser

عندما "السيارة مع الأرباح" في جاكي شونغ وي عبت منوها حقا أن جاكي لا؟

الرصاصة الفضية يمكن أن يلقي؟ ! لهذا الزوج من NIKE الجوية ماكس قد يكون 97 بيع الذهب يعكس!

أعلن أول هاتف غير قابلة للاختراق حقيقي MEIZU العالم: سماعة رأس جاك، ميناء الشحن، وفتحة بطاقة كل ألغيت

كبير النسخة التقدم خطوة X7 في السوق الرسمي: بيع 10،69-15،99 وان

"رحلة 2" المؤثرات الخاصة يمكن أن تلعب فقط 75 دقيقة، وكوريا الجنوبية هي شركة المؤثرات الخاصة أفلاما إنقاذ حياة الطب تفعل؟

تصرف ستيفن تشو في دور مساند: انتزاع الاضواء نيك تشيونغ، أندي لاو بالتعاون مع الاكثر شهرة!

Guochao العلامة التجارية فخور! FMACM إلى طوكيو "رش البرية"!

فيفو أيضا الانخراط في السعر؟ شياو 710 الدفترية الجسم الحي Z3 أعلن رسميا

VW T-روك R تعرض السيارة الفعلية: و300PS أقصى قدرة حصانية كسر