دراسة متعمقة في الاستعراضات مجموعة التطبيقات الولايات المتحدة

مذكرة لى فنغ الشبكة: هذه المقالة نشرت أصلا في العام رقم القناة الصغرى المجموعة الأمريكية يستعرض الفريق الفني، شبكة لى فنغ طبع المعتمدين لديها. الكتاب هي: الهليون، وبعثة الولايات المتحدة بعثة الولايات المتحدة تعليقات النبيذ المركز التقني السياحة المجموعة الأعمال ذكي المنصات و، بياو، الولايات المتحدة استعراض مجموعة من منصة بعثة الولايات المتحدة والمدير الفني مجموعة من رجال الاعمال النبيذ السياحة NLP، شياو مينغ، المجموعة الأمريكية منصة تعليقات السياحة النبيذ ومجموعة من رجال الاعمال رئيس تكنولوجيا الصورة. شبكة لى فنغ

| مقدمة

في السنوات الأخيرة، وعمق التعلم قدم نتائج باهرة جدا في الصوت والصورة، معالجة اللغات الطبيعية وغيرها من المجالات، وأصبحت واحدة من أكثر البقع التكنولوجيا مقنعة الساخنة. استعراض مجموعة الولايات المتحدة خلال العامين الماضيين في عمق التعلم كما نفذت بعض الاستكشاف، والتي في معالجة اللغة الطبيعية، وسوف نكون التكنولوجيا عميقة التعلم لتحليل النص، ومطابقة الدلالي، بحث نماذج محرك الترتيب؛ في مجال الرؤية الحاسوبية، ونحن سوف تطبيقه على التعرف على الحروف، والكشف عن وجوه، تصنيف الصور، جودة الصورة الفرز. هنا لدينا لمطابقة الدلالي والفرز والتعرف على الحروف جودة الصورة هذه السيناريوهات الثلاثة، على سبيل المثال، بالتفاصيل الولايات المتحدة استعراض مجموعة الخبرة والمنهجية في التكنولوجيا عمق وتطبيق التعلم.

| وبناء على مطابقة الدلالي دراسة متعمقة

تكنولوجيا مطابقة الدلالات، مع استرجاع المعلومات، ومحركات البحث مكانة هامة في نتيجة تذكر، فرز دقيق وجوانب أخرى تلعب دورا هاما.

من الناحية الفنية مطابقة الدلالي بالمعنى التقليدي، ودفع المزيد من الاهتمام بالقدر الذي يتفق مع المستوى الدلالي النص، فإننا ندعو دلالات طبقة مطابقة اللغة؛ وفي المجموعة الأمريكية O2O مراجعة هذه السيناريوهات التطبيقات النموذجية، بالإضافة إلى عرض نتائجنا والتعبير المستخدم على علاقة قوية بخلاف طبقة اللغة دلالات، وكذلك نية المستخدم، حالة المستخدم من ارتباط قوي.

هذا المستخدم هو نية للمستخدم أن تفعل؟ على سبيل المثال، للمستخدمين البحث عن بايدو "في التخليص الجمركي"، نواياه قد يتساءل الحدود الجغرافية العلاقات الخارجية في وممثلي الجمارك، يتم استرداد "العادات" و "العلاقات الخارجية" في كلمتين، والبحث عن "الجمارك في بعثة الولايات المتحدة الجمارك "، والمستخدم يبحث عن" التخليص الجمركي "هذا هو للأسف،" يتم التعامل مع التخليص الجمركي "ككلمة.

وإلى جانب حالة المستخدم، واحدة في بكين ومستخدم آخر في ووهان، بحثا عن أي مصطلح على بايدو أو تاوباو، فإن النتائج قد لا تحصل تغييرا كبيرا، لكنه في مثل هذه علاقة قوية مع المشهد موقع بعثة الولايات المتحدة وسوف تكون مختلفة تماما. على سبيل المثال، وأنا بحثت عن "برج الرافعة الصفراء" في ووهان، يمكن للمستخدم أن يبحث عن تذاكر جاذبية، بينما في بكين ل "برج الرافعة الصفراء"، من المرجح أن يكون للمستخدم العثور على فندق.

كيفية الجمع بين المعلومات طبقة اللغة والقصد، الدولة مطابقة الدلالات المستخدم للقيام بذلك؟

فكرتنا هي أن أعرض إطار جزء O2O السيناريو الأعمال ذات الصلة حيث نص قصير الخارجي، ودراسة متعمقة في تصميم للقيام مطابقة الدلالي، من خلال بيانات دليل النقر / وحيد لتحسين اتجاه نموذج مطابقة الدلالي، تدرب في المباراة النهائية انقر نموذج ارتباط تطبيقها على الأعمال ذات الصلة البحث. هذا الرقم هو الضغط على إطار التشابه ClickNet لبعثة الولايات المتحدة تعليقات تصميم المشهد، هو نموذج أكثر وخفيفة الوزن، مع الأخذ في الاعتبار كلا من الأثر والأداء، ويمكن أيضا أن تمتد إلى تطبيقات الانترنت.

طبقة العرض

على التوالي، استعلام والأسماء التجارية الدلالي والميزات التشغيلية، حيث ميزة الدلالي هي جوهر، للحصول على النص القصير من DNN / CNN / RNN / LSTM / GRU شامل ناقلات نهج التمثيل، بالإضافة إلى تقديم ميزات ذات الصلة الخدمات، مثل مستخدم أو الأعمال التجارية المعلومات ذات الصلة، مثل مستخدمي الإنترنت من تقييم الأعمال التجارية، وتجمع في نهاية المطاف إلى تحميل.

طبقة التعلم

بعد التغييرات مرتبطة ارتباطا كاملا وغير الخطية من خلال طبقات متعددة، التنبؤ بنتيجة المباراة لضبط الشبكة وفقا لدرجاتهم وانقر فوق تسمية لدراسة العلاقة بين سؤال وأسماء مطابقة الأعمال.

في إطار خوارزمية لتدريب الدلالي نتائج النموذج جيدة، ولكن أيضا يجب القيام به وفقا لمكان الحادث نموذج ضبط: أولا، نحن نفعل الكثير من التحسين من المثول التدريب، على سبيل المثال، والنظر في عدم توازن العينة، جانبا هاما من العينة، والموقف، التحيز وغيرها من القضايا. ثانيا، عندما المعلمة ضبط نموذج، والنظر في خوارزميات التحسين المختلفة، ومستوى حجم الشبكة، وضبط معايير بشأن قضايا أخرى. بعد التدريب النموذج الأمثل، لدينا نموذج مطابقة الدلالي هو الآن على شبكة الإنترنت في بعثة الولايات المتحدة منصة مراجعة البحث، والإعلانات، الفنادق والسياحة، أذكر وأنظمة الفرز، وزيادة فعالية معدل شراء الزيارة مؤشر / الإيرادات / نسبة النقر إلى الظهور.

ملخص

تطبيقات التعلم عمق تتطابق غويا، الحاجة إلى تصميم لسيناريوهات الأعمال إطار خوارزمية مناسبة، بالإضافة إلى عمق تعلم الخوارزميات مع الحد من خصائص العمل الهندسي، ولكن صعوبة الزيادات نموذج ضبط، يمكن أن يكون من تصميم الإطار، معالجة الإحضار الأعمال التجارية، ونموذج معلمات التوليف في ثلاثة مجالات مجتمعة، وتحقيق نموذج للفعالية وأداء Jianyou.

| عمق جودة الصورة فرز التعلم القائم

وكبرى شركات الإنترنت المحلية والأجنبية (مثل تينسنت، علي والصرخة) الإعلانات التجارية على الانترنت المعنية لإظهار أي نوع من الصور يمكن أن تجتذب المزيد من النقرات. في استعراض مجموعة الولايات المتحدة، الرسم الأول من قبل التاجر أو الأعمال التجارية المشغل يدويا تحديد كيفية اختيار أول خريطة لجذب المستخدمين بشكل أفضل؟ الخوارزمية جودة الصورة الترتيب تلقائيا بتحديد الهدف هو أن تفعل أفضل أول خريطة للمستخدمين إغراء للنقر.

جودة الصورة طريقة الفرز التقليدية أساسا لتقييم الجودة من الناحية الجمالية، فإن الإحصاءات اللون، والتوزيع الرئيسية، وتكوينها، وما إلى ذلك لتحليل جمال الصورة. ومع ذلك، في سيناريوهات الأعمال الفعلية، وجودة الصورة المستخدم من حيثيات حكم ذاتي جدا وصعبة لتشكيل معايير التقييم موحدة. على سبيل المثال:

بعض المستخدمين أكثر حساسية لتعريف أو قرار.

بعض المستخدمين أكثر حساسية للون أو تكوين.

بعض المستخدمين يفضلون التأثير البصري المحتوى بدلا من خريطة البيئة لطيف.

وذلك ما الصفات التي نستخدمها أسلوب التعلم العميق، لحفر الصورة سيؤثر التقديرية للمستخدم، والتكامل مدى فعالية هذه الصفات تقييم الصورة.

كنا استخراج الصور AlexNet رفيع المستوى وصف الدلالي، وتعلم الجمال، بروز جذب سمة من سمات رفيعة المستوى، وفئة وغيرها، ويتميز اضاف المستوى المنخفض (مثل اللون والحدة والتباين والزاوية) مصممة بشكل مصطنع. بعد الحصول على هذه الميزات، وتدريب الشبكة العصبية التهديف صورة سطحية ككل. يتم الجمع بين وسمة من سمات الإطار (FIG 2) مع التقليدية ميزة التعلم عمق ميزة، سواء أدرجت الحفاظ على مستوى عال وصف الدلالي العام على مستوى منخفض، بما في ذلك ميزات عالمية لها ميزات المحلية.

لكل خصائص الصورة البعد التعلم، فإنه يتطلب الكثير من البيانات لتسمية الدعم، ولكن علامة مصطنعة تماما من خلال حساب كبير، لذلك يمكننا أن نتعلم من الاستعراضات مجموعة امريكية المصدر وPOI العلامات. التعلم عن جاذبية العقار، اخترنا الصور الولايات المتحدة بعثة صفقة الألبوم نسبة النقر إلى الظهور (في الغالب من قبل مصور كاميرا SLR) كمثال إيجابي، واختيار انخفاض UGC الألبوم اضغط على الصورة (ومعظمهم من الهواتف المنخفضة نهاية اطلاق النار) كمثال سلبي. تعلم فئة الممتلكات، ونحن سوف تكون المجموعة الأمريكية من الفئة الثانية والفئة باعتبارها علامة صورة مشتركة. نموذج طلب كتلة، ونختار أول خريطة الجودة الأكثر مناسبة لPOI لعرض الإعلانات، وخدمة غرض جذب ينقر المستخدم، وتحسين معايير العمل التجاري. 3 يبين الشكل خريطة الأولى على أساس رتبة نوعية النتائج المفضلة.

| واستنادا إلى OCR عمق التعلم

من أجل تعزيز تجربة المستخدم، قد توغلت الطلب O2O لتقنية التعرف الضوئي على الحروف في دفعة واحدة، والتسليم والمستخدم تقييم والقطاعات الأخرى. يلعب OCR دورا رئيسيا في كل من استعراض الأعمال مجموعة الولايات المتحدة. من جهة هو إدخال مساعد، مثل وصلات الدفع بواسطة الهاتف النقال عن طريق التعرف على الكاميرا من رقم بطاقة البنك من أجل تحقيق التعادل بطاقة التلقائي، وإذا الأطباق BD المعلومات دخول القائمة المساعدة. من ناحية أخرى فإنه من فحص الاختيار، مثل المعلومات الموجودة في الروابط أعمال لأعمال التأهيل فحص تحميلها بطاقات الهوية، والرخص التجارية وتصاريح الأغذية وغيرها من الوثائق والصور المستخرجة التحقق لضمان شرعية للعمل، مثل تصفية الجهاز على شركات واحدة و يحتوي حظر صور كلمة ولدت من قبل المستخدمين تقييم الروابط. مقارنة المشهد OCR التقليدية (المطبوعة، المستند الممسوح ضوئيا)، OCR المشهد مجموعة الولايات المتحدة أساسا للهواتف المحمولة لالتقاط صور لاستخراج المعلومات النصية وتحديد الهوية، مع الأخذ بعين الاعتبار تنوع المستخدمين حاليا، وبالتالي فإن التحدي الرئيسي الذي يواجه ما يلي:

التصوير معقدة: الضوضاء، وطمس، التغييرات الخفيفة، وسلالة.

نص معقد: الخط والحجم واللون، وارتداء، والسكتة الدماغية العرض ليست ثابتة والتوجيه التعسفي.

خلفية معقدة: تخطيط في عداد المفقودين، والتدخل الخلفية.

لمواجهة هذه التحديات، والحل OCR التقليدي هناك العيوب التالية:

من خلال تحليل تخطيط (binarized متصلة تحليل المركبات) لإنشاء سطر من النص، والتخطيط يتطلب بنية قوية والجبهة انتظام انفصال خلفية قوية (مثل لوحات صورة وثيقة)، لا يمكن أن تتم معالجتها قبل النص الخلفية المعقدة بشكل تعسفي ( على سبيل المثال نص السيناريو، والقوائم، والإعلانات النصية وغيرها).

نموذج التعرف على الحروف تدرب على يد مصممة بشكل مصطنع ميزة الاتجاه حافة (مثل HOG)، حيث واحد يتغير الخط من هذا القبيل، انخفض بسرعة الضباب التعميم أو تدخل الخلفية.

الاعتماد المفرط على نتائج تجزئة حرف، والتشوهات حرف في حالة عرقلة، والضوضاء، وتجزئة الخطأ نشر على وجه الخصوص.

أقل من الحلول التقليدية OCR، ونحن نحاول التعرف الضوئي على الحروف على أساس عمق التعلم.

1. أسرع المواقع على أساس النص-R-CNN وFCN

أولا وقبل كل شيء، اعتمادا على ما إذا لدينا تنقسم المعلومات المسبقة إلى أقسام تسيطر سيناريوهات (مثل بطاقات الهوية، وتراخيص العمل، والبطاقات المصرفية) وسيناريوهات غير الخاضعة للرقابة (مثل القوائم، وأول خريطة الباب).

لسيناريو تسيطر عليها، ونحن سوف تحويل النص وضعه للكشف عن المشاكل على أهداف رئيسية معينة. الاستخدام الرئيسي أسرع الكشف عن R-CNN، كما هو مبين في الشكل. من أجل ضمان دقة تحديد المواقع من المربع المقابل في نفس الوقت تعزيز سرعة الحوسبة، كنا صقل أساليب إطار والتدريب الأصلي:

مع الأخذ في الاعتبار التغيرات في الطبقات الرئيسية المستهدفة محدودة، نقطع نموذج هندسة الشبكات ZF، سيتم تخفيض بنسبة 5-3 طبقات طبقة الإلتواء.

عملية تدريب لتحسين عتبة نسبة التداخل عينات إيجابية، والتكيف مع الجانب نسبة طبقة مرساة RPN فقا لاحتياجات العمل.

لمشهد غير المنضبط، منذ باتجاه عرض السكتة الدماغية شخصية وبشكل تعسفي يتغير، وحجم كاشف الجسيمات هدف وضعه في الإطار المقابل ليس بما فيه الكفاية، قسمنا شبكة دلالية التي يشيع استخدامها في التفاف كامل (على FCN) إلى النص على مستوى بكسل / وضع العلامات الخلفية، على النحو التالي كما هو مبين في الشكل. من أجل ضمان دقة وتحديد المواقع الدلالي واضحا في وقت واحد، ونحن ليس فقط في الطبقة الأخيرة من إزالة التفاف والتكامل نتائج إزالة التفاف طبقة طبقة العميقة والضحلة

2. التعرف على الحروف على أساس تسلسل إطار التعلم

من أجل السيطرة على نحو فعال تجزئة شخصية والخطأ الاعتراف تأثير نشر بعد المعالجة، يمكن التعرف على الحروف في نهاية التدريب، استخدمنا تسلسل الإطار التعلم كما هو مبين أدناه. ينقسم الإطار العام إلى ثلاث طبقات: طبقة الإلتواء، طبقة العودية وطبقة الترجمة. الذي طبقة التفاف الميزات المذكورة، طبقة متكررة ديه فقط لمعرفة العلاقة بين تسلسل الأحرف السمات المميزة، ولكن لديه أيضا لمعرفة العلاقة بين الشخصيات، وطبقة الترجمة لتحقيق فك الوقت النتائج تصنيف السلسلة.

بسبب ارتفاع متطلبات إطار التعلم تسلسل عدد وتوزيع عينات التدريب، واستخدمنا وسيلة حقيقية لعينات عينة + التوليف. عينات حقيقية للمصادر استعراض أعمال بعثة الولايات المتحدة (مثل القوائم وبطاقات الهوية ورخص العمل) عينات تصنيعه أساسا يعتبر الخط، والتشوه، طمس، والضوضاء، والخلفية وعوامل أخرى. واستنادا إلى البيانات التعلم تسلسل الإطار والتدريب، كانت هناك زيادة كبيرة في الأداء على مجموعة متنوعة من الاعتراف سيناريوهات شخصية، كما هو مبين في الشكل.

| ملخص

في هذه الورقة، إلى التعلم العميق في معالجة اللغة الطبيعية، وأدخلت تطبيقات معالجة الصور في كل من المناطق كمثال على ذلك، ولكن عمق التعلم يمكن أن تقوم به في الولايات المتحدة مجموعة تعليق قيمتها أكثر محدودية بكثير بها. في المستقبل، وسوف نستمر في حفر في مشاهد مختلفة، مثل التفاعل الذكي، وتحديد مواعيد التسليم، عملية ذكية، وما إلى ذلك، تساهم مجموعة الولايات المتحدة على ذكية استعراض الطرق المنتج.

طريق الحرير

دراسة متعمقة في الاستعراضات مجموعة التطبيقات الولايات المتحدة

الشريحة يدويا لوحة الشاشة يجعل حصة 95.06 في المئة، لينوفو Z5 برو مراجعات | التيتانيوم حالا

كسر إيطاليا سجل أعلى شباك التذاكر، والأوساخ فيلم من ارتفاع جديد!

كيفية جعل دائرة أصدقائك تصبح طويل القامة؟ كل من الفن كما الضروري -Fui Voun الروبوت التطبيق

8 التايلاندية فيلم رعب، ويشعر رعب سحر التايلاندية

تحت تيار الذهب الكريبتون، صبرنا لذلك في أي درجة؟

قل حقا، وهذا ينبغي أن يكون في مزيج من ديزني أسوأ التنين هو ......

السعر 400 يوان! نسخة المكسرات Pro2 هواتف خاص ليوان فقط 1498: 6G + كبير رقاقة ذاكرة شياو 636

من الطلاء القديم، فلاش عالية تعمل بالطاقة يصل إلى Z

حفظ ماك بوك برو الجديد يتميز تعرضا للإهمال، كنت بحاجة إلى هذا القليل 8 نصائح | بعمل مفيد

تاوباو تسويق الروتين وأكثر، واليوم كنت الابهام حتى الآن؟

وذكر اليابانية الشهيرة متفوقة، استغرق حفرة ضخمة في [موكومنتري الدماغ ......

يمكنك حماية تصنيفات المتجر تذكير؟ | هناك دودج 309

كيف AI شركة تصميم الخدمات القائمة على المعمارية المصغرة شو AI ادارة العلاقات بجد لإنشاء الفئة المفتوحة

حرب 18 محاكمات gymnasiade كرة السلة ودى

لم يتم دفع القمار من خارج منطقة الجزاء: وزارة نيوزيلندا الشؤون الداخلية

PG 1/60 غرامة اللوحة الشؤم

Fui Voun: كيفية جعل دائرة أصدقائك تصبح طويل القامة؟ كل من الفن كما #Android التطبيقات ضروري

وأثار تدوين نقاش حاد: الفتيات، والحلوى وزير الخارجية

"ماريو كارت 8 طبعة فاخرة" المبسطة والصينية التقليدية الآن على الهواء مباشرة

تغيير TR-5 Hrairoo وRuiou

تشاينا موبايل، جديدة شبكة آلة A6: الخلفية كاميرا مزدوجة، مع شاشة 5.45 بوصة

سوف دائرة الرقابة الداخلية 12 التركيز على الأداء / اي فون أبل قطع ل35300000000 $ القيمة السوقية تبخرت / الدخن أو نشر MIX 2S | إلهام صباح القراءة

الأحكام ذات الصلة