"هل تلعب كرة السلة مثل تساى شو كون": قناة الصغرى يترجم هذا الخطأ وكيف يتم ذلك؟

وطبع هذا المقال بإذن من  | السيليكون ستار الناس

الهوية  | guixingren123

مؤلف  | طيف

إلى بريد إلكتروني علة الصغيرة، والمراوح تساى شو كون لا يمكن التوفيق بينها تقريبا مع تينسنت.

في نهاية الأسبوع الماضي، مجموعة من لقطات بريد إلكتروني على نطاق صغير "الله الترجمة" في المدونات الصغيرة المعرفة تقريبا، والجرجير وغيرها من الشبكات الاجتماعية لتحميل نمر رفرفة مفتوحة. شخص يدخل الجملة مثل "كنت تلعب كرة السلة مثل caixukun"، الخ، مع المدمج في ميزة الترجمة القنوات الصغيرة، الحصول على معنى الترجمة خاطئة تماما:

تعاني يتم جلب الآخرين تحرش معا إلكتروني الصغير الممثل الترجمة، فضلا عن وو يى، شيه Guangkun وهلم جرا.

تساى شو كون هو المرور الأولى النجوم صناعة الترفيه في الصين، مشجعيه بالتأكيد لا يمكن العبث.

الرسالة الصغيرة هي الآن جزء من الفريق هو أسفل ميزة الترجمة. النجم سيليكون الذين وجدوا الجملة مماثلة "أنت حتى"، فضلا عن "caixukun"، وبعبارة أخرى من البيان، الآن لا يمكن أن تترجم إلى اللغة الصينية.

وفي الوقت نفسه، فإن الرواية الرسمية @ تينسنت فريق الدقيقة الرسالة كما أعلن في ويبو، الترجمة على وجه السرعة إصلاح. في وقت الصحافة، وبيان ما زالت ذات الصلة، ولا يمكن أن تترجم بشكل صحيح إلكتروني الجزئي.

علما بأن قناة الصغرى الرسمية توفر شرحا موجزا:

تظهر محرك الترجمة تحولت عن طريق الخطأ في ترجمة بعض الكلمات الإنجليزية لم تكن التدريب غير الرسمي، مما أدى إلى جزء من ترجمة بيان تنشأ مشاكل.

بعد "caixukun"، وهناك شاهد البحث عن الكلمات سوف تؤدي إلى خلل. على سبيل المثال، ترجمة قناة الصغرى يبدو الأداء الضعيف نسبيا في الكلية اختصار الإنجليزية. أدخل "مدرستك WHU" لا يمكن أن تتحول جامعة ووهان، أعطت "مدرستك تمتص" النتائج.

لم يمض وقت طويل بعد، الجملة المدرسة أيضا لا تتحول.

السيليكون ستار نعتقد تلك الرسالة الصغيرة ينبغي أن تواصل اعلامنا بمزيد من التفصيل: لماذا تظهر هذه الأخطاء التي تسببها العوامل.

من ناحية، والتكنولوجيا قناة الصغرى وراء الترجمة معقدة في الواقع. شرح أنه يساعد المستخدم على فهم كيف يعمل، وفهم نتائج الترجمة وراء، فإنه قد يكون له أسباب فنية معقدة للغاية.

من ناحية أخرى، يمكنك إيقاف تشغيل "وحتى تتمكن" الجملة، هناك سوف يحال إلى المدرسة، وأغلقت المدرسة لفترة قصيرة، سيكون هناك المزيد من الكلمات سوف يؤدي تم العثور على الأخطاء. العثور على الخروج مرة أخرى؟ هذا الضرر أمر طبيعي لاستخدام تجربة المستخدم ميزة الترجمة، على المدى الطويل ليس حلا شاملا.

لسوء الحظ، وقال الجانب القناة الصغيرة إلى المدونات الصغيرة فوق الموضوع، لا أكثر تعليق (ربما لأنه لا يريد أن يؤذون المشجعين تساى شو كون منه). وفي الوقت نفسه، فإن المسألة لا يمكن العثور على تكنولوجيا موثوقة لشبكة الإنترنت في الصين الجواب، حتى في معرفة حول السلام، المواضيع التالية هي أيضا للمستخدمين علة حصة لقطات اكتشف، وأوضح لماذا لا أحد.

في هذه الحالة، والسماح للشعب السيليكون ستار لمحاولة؟

أجرينا مقابلات مع عدد من الخبراء في تعلم الآلة، وفي الصفحات التالية في 1) شرح الرسالة الجزئي للترجمة في النهاية ما التكنولوجيا؛ 2) محاولة الإجابة، "كنت تلعب كرة السلة مثل caixukun" هذه الجملة، لماذا هي القناة الصغيرة في الترجمة تحويل خاطئ.

السيليكون ستار بعد كثير من الناس يفهمون، مقتنعة بأن خطابات الصغرى نظام الترجمة المستخدمة هي مجال تعلم الآلة المزيد من النار "العصب الترجمة الآلية" (العصبية الترجمة الآلية، ويشار إلى NMT) والتكنولوجيا، من البحث من قبل فريق AI قناة الصغرى.

من وجهة شخصا عاديا وجهة نظر، NMT في ترجمة كلمة واحدة، هل هذه الأشياء:

الخطوة 1: في حد معين تقليد طريقة تفكير العقل البشري، NMT وفقا لكلمة في الجملة (يمكن أن تكون الجملة طويلة) بين السياق، نموذج الشبكة العصبية لهذه الكلمة، تشكيل التمثيل الدلالي.

على سبيل المثال، كلمة الإنجليزية هي كلب، يمكن أن يفهم على أنه انطباع شكل NMT كلب في في الداخل "العقل المدبر".

خطوة 2: وفقا للسياق في الجملة أو حتى فقرات، معاد للنموذج إلى لغة أخرى.

على سبيل المثال، كلب ترجمتها إلى اللغة الفرنسية هو "لو شين"، ولكن إذا كان السياق هو "أعطى الكلب ولادة الجراء"، ثم ستترجم الكلب إلى سلبية "لا chienne".

(NMT لا تشكل حقا في الانطباع الدماغ البصرية الكلب، في الواقع، والعملية برمتها لا علاقة له مع الصورة تماما أي شيء، وهذا ما يسمى "الانطباع" يتمثل من خلال سلسلة من ناقلات (ناقلات). أمثلة على الكلب من مايكروسوفت مترجم )

والميزة الرئيسية لNMT هي الجملة الطويلة (أو حتى فقرة) لديها قدرات الترجمة لائقة، وقراءة ما يقرب من مطلع البشرية السياق درجة متماسكة. بعد ظهور، وتدريجيا تم اعتماد NMT من قبل مايكروسوفت وجوجل وبايدو، تينسنت وغيرها من المنتجات عمل الشركات الكبيرة.

"التكنولوجيا الترجمة الآلية تم تحديثها باستمرار التكرار، السابق يرتكز على القانون، تقوم أساسا على الإحصاءات على مدى العقد الماضي، والآن نبدأ في استخدام الشبكات العصبية. العصبية الترجمة الآلية الترجمة الآلية حاليا على المقارنة الفنية من النار. معظم أكبر لغتنا ، وأحد كبار الباحثين في الولايات المتحدة، وقال أحد كبار شركات التكنولوجيا في فرع البحوث وانغ شيا السيليكون * نجمة الناس وقد استندت هذه الترجمة على التكنولوجيا ".

كل مرحلة "في تطوير تكنولوجيا الترجمة الآلية، فإن الباحثين تواجه بعض المشاكل .NMT هناك بعض المشاكل، على سبيل المثال، للتفسير عملية بأكمله منخفض جدا. " قال.

السيليكون ستار الذين يترجمون ما يعني: في مستوى الحالة تحديدا، فإن نظام NMT لماذا يترجم إلى ABCDE ABCDE كلمة، الباحث من الصعب حاليا لشرح عملية الترجمة.

عندما تحولت NMT الوقت الخطأ، قد يكون ما يحدث؟

في الواقع، والحق خطأ، خطأ فادحا ليست خطيرة، هم الناس لاتخاذ قرار. ليس هناك خطأ ام على صواب في نظر الجهاز، يعتبر الجهاز الجواب اختيار أعلى احتمال أو معظم الجواب المحتمل لذلك، لأن كل شيء يسير وفقا لخوارزمية نموذج.

قبول ذلك، هل يمكن أن نفهم لماذا هذه الجملة خاطئة بدورها.

ثم نصل إلى نقطة

  • السبب المحتمل 1: مجموعة التدريب الضوضاء

مقابلات مع العديد من الخبراء في آلة التعلم لقبول الناس للسيليكون ستار، فإن الغالبية من الناس أعطى هذا السبب صوت.

صورة قليلا قياسا على ذلك، الضوضاء (الضجيج) هو لبيانات نظم الترجمة القطار وضع يبدو "غير صحيح"، فإن البيانات "القذرة".

نظام NMT التدريب جيدة، يتطلب الكثير من جسم مواز بيانات عالية الجودة - "عالية الجودة" للدلالة على دقة الترجمة، "المجاميع الموازي" يشير إلى الكلمة الإنجليزية من الصينيين، و "أنا أحبك = أنا أحبك"، وهلم جرا.

إلى أين يذهبون للعثور على هذه البيانات؟ قاموس اللغة الإنكليزية هو المصدر. وبالإضافة إلى ذلك، فإن النهج الأكثر شعبية هو الاستيلاء على الإنترنت، من الكثير من البيانات في الشبكة بأكملها، والاستيلاء على ذات جودة عالية الحاجة بالتوازي المجاميع.

"أنت تلعب كرة السلة مثل caixukun" تترجم إلى "الخاص كرة السلة اللعب الجميل" تأتي الضوضاء من؟ وجدت السيليكون ستار هناك احتمالان:

  • على سبيل المثال، كان الإنترنت في جميع أنحاء الكثير، "caixukun = جيدة" الإحضار. هذه المجاميع هي الزحف في قناة الصغرى بالتوازي الإحضار كما ترجم واعتمادها. ولكن في الواقع، أنه ينتمي إلى "الضوضاء" لأن الترجمة لا يمكن أن تنشأ في سياق أهمية، أي وسيلة مضمونة لتكون دقيقة. AI شأنه أن يعزز قناة الصغرى الضوضاء حقول مماثلة في المستقبل.

  • وأشار أسس شركة للتعلم آلة هان تشن * من: في مجال التدريب، وفريق حرف الصغير من المترجمين الذين قد تستخدم لتوليد الهجمات المواجهة (هجوم الخصومة توليدي)، وقدمت مماثلة يدويا إضافة الضوضاء، ومبادرة لترجمة مماثلة في عملية التدريب تعمل تصحيح الخطأ، وبالتالي تتعارض مع الترجمة - وهذا هو الوضع الذي يمكن أن يحدث، ونحن لا التكهن بشأن الدوافع.

أمثلة على التعرف على الصور رؤية الكمبيوتر مع الضوضاء: البشر لا يمكن التعرف على الصور، هو تحديد عمق الشبكة العصبية للكائنات مختلفة. أمثلة لا علاقة لها بالموضوع المذكور هنا، كمرجع فقط

في إطار فرضية الضوضاء وغيرها من الحالات الشاذة موجودة، والنظام لا يزال قادرا على التدريب العادي، والعمل، وإعطاء نتائج الترجمة عالية الجودة - وتسمى هذه قدرات "متانة" (الشدة) في علوم الكمبيوتر.

وأشار وانغ شيا إلى أن متانة هي NMT وتحتاج إلى تحسين والاهتمام تقنيات الترجمة الآلية المستقبل.

  • السبب المحتمل 2: تعيين خارج كلمة

سيناريو محتمل هو أن بيانات التدريب الترجمة الدقيقة الرسالة مجموعة المستخدمة، هم لم يظهر "caixukun" كلمة.

عندما واجه NMT خارج مدة محددة، ويمكن الاطلاع في غضون المدة المحددة لتفكيك. وعشوائية في عملية تفكيك، بحيث قد انقسم الى caix أوكون، كلمة خارج لا يزال الحصول على تعيين.

تعيين ترجمة خارج الكلمة غير العادية. إذا كنت لم أر، وانها لن بدوره، تظهر بين الانحراف له ما يبرره.

  • السبب المحتمل: 3 لا يتطابق الحقل

"، وهناك حالة أخرى قد تنشأ هو الحقل لا تطابق (المجالات لا تتطابق)" وقال وانغ شيا، مشيرا إلى أنه ليس بالضرورة الظروف المحددة للقضية.

في هذه الحالة بالذات، بدا أن الجملة في كرة السلة (كرة السلة)، في حين إلكتروني الصغيرة ترجمة مجموعة التدريب البيانات قد لا تكون كرة السلة، أو القليل جدا مع ذات الصلة لكرة السلة. حقل لا تطابق، بالإضافة إلى وجود الجملة خارج مدة محددة، والعمل المشترك يجعل الترجمة صعبة لتصحيح.

هذا العمل التفسير. وتقول دعونا الاتصالات التجارية هي السبب في معظم المستخدمين قناة الصغرى الترجمة، ثم القناة الصغيرة في تدريب NMT قد استخدم الحقل مجموعة بيانات التجارة؛ لكرة السلة المشهد الرئيسي هو ليس الدقيقة الرسالة للمستخدمين الترجمة، وربما بعد ذلك لن يكون هناك أي بيانات استخدام كرة السلة في التدريب .

إذا كانت الكلمة لأنها لا تتطابق ومجموعة خارج الميدان، وبخطأ ما، لا يمكن إلقاء اللوم عليه. لم يتعلم الأشياء، كيف يمكن أن أفعل؟

الموقع الرسمي للقناة الصغيرة AI

  • السبب المحتمل 4: كلمة غريبة لا يمكن إدخال شعور شائع +

لهذا السبب أيضا الأعمال التي NMT تسببت.

NMT عن الجمل الطويلة، الفقرات، أو حتى تأثير المادة الترجمة بأكمله هو جيد جدا. بفضل آليته، في ترجمة لكلمة يمكن أن يصلح سياق السياق.

ولكن في جملة قصيرة، فإنه ليس بالضرورة الروح - خصوصا عندما يكون هذا الحكم هو بطلاقة تماما متى.

ربما لأن "كنت تلعب كرة السلة مثل caixukun" في هذه الجملة، caixukun هي كلمة غريبة جدا. فإنه لا يظهر في أي قاموس اللغة الإنجليزية التي ينظر المرء سياق الجملة له علاقة مع أي شيء.

قبل التدريب الدقيقة الرسالة الترجمة، ومن المرجح أن تحدث NBA السنة الصينية الجديدة السنة القمرية الجديدة السفير تساى شو Kuncheng

عندما بشر الترجمة، يمكن الرجوع إلى الحس السليم، والمعرفة القائمة، يمكن أن تتحول إلى العثور على معلومات. NMT لا تستطيع أن تفعل ذلك، عندما كان يعمل، فإنه ليس من الضروري أن يكون مرجعا قاعدة المعرفة.

وعلاوة على ذلك، فإنه ليس من الرسائل الصغيرة لا - يذهب الآن إلى مسابقة مترجم جوجل في نفس الجملة، والنتيجة ليست مرضية تماما.

"هذا (وليس مقدمة من الحس السليم) المشكلة ليست فقط في المهام الترجمة، بما في ذلك القراءة والفهم، ومسابقات وغيرها من المهام. كيف التحسينات في هذه المرحلة، هو الاتجاه مثيرة جدا للاهتمام، ونحن أيضا لا يزال استكشاف،" وانغ شيا أعربت .

يجب أن يحدث الحالة المذكورة أعلاه، وسوف يؤدي حتما إلى خطأ في الترجمة، لأن NMT هو واحد مثل هذا العمل. حتى إذا لم يحدث الرسالة في الدقيقة، كما يمكن أن تحدث في مترجم جوجل، أو على أي غيرها من المنتجات الترجمة القائم على NMT. وجهة النظر هذه، والمنتج قناة الصغرى نفسها من دون أي خطأ.

لكن فريق الدقيقة الرسالة ليس بريئا تماما. لأنه بالإضافة إلى التقنية، وعلة يبدو قد يكون هناك مشكلة في عملية المراقبة.

في استفتاء بناء على أمر من 900 مليون التطبيق على مستوى المستخدم، يجب أن يكون وضع أي وظيفة بعناية الحجة، قبل ان يكون خط الاختبارات الصارمة لضمان مضمونة وقت ممكن. ومع ذلك، فقد كشفت الرسالة المهندس الصغير السابق، على الأقل في القناة الصغيرة الترجمة خط الزمن ليس هو الحال.

في ذلك الوقت، والمهندسين أعرف الإجابة تقريبا هو:

تينسنت ليقول / الرسالة الصغيرة ليست المرة الأولى للخروج من هذه المشكلة.

في العام الماضي، تينسنت AI في وقت واحد تفسير المسؤول لمنتدى بواو لآسيا، seq2seq تستند مباشرة إلى نظام الترجمة الآلية مع وقت لاحق، لأول مرة "على طول الطريق" تترجم إلى "طريق سريع وحزام" و "حزام والطريق"، وبعد ذلك تماما التهوية الإضراب.

"كمية كبيرة من البيانات، تجرأ على الخام العيش".

هذا هو تقييم هان تشين من الدقيقة الرسالة ترجمة الشوائب.

وقال مقابلة مع الناس السيليكون ستار مقابلتهم، الذي طلب عدم الكشف عن اسمه المشجعين تساى شو كون، لا نريد أن نرى الأفراد من خلال الوسائل التقنية، للعنف ضد تتغاضى عن شبكة الفنانين.

"الفنانين أبرياء، مثل تأثير سلبي على الترجمة نفسها سيعطي الفنانين. مجموعة مستخدمي السخرية، واحتمال الأذى النفسي للفنان الثانوي"، وقالت، "أجاب هذا المسؤول القناة الصغيرة بسرعة أكبر، فمن الثناء. وآمل أن قناة صغيرة غير ضارة، ولكن نأمل أيضا أن كل التطبيق على المستوى الوطني وسائل الإعلام الاجتماعية لديها خط أسفل الأخلاقي الأساسي ".

* وانغ شيا، وتشن هان هو اسم مستعار.

ما هي الترجمة الآلية العصبية؟ https://translator.microsoft.com/zh/help/articles/neural/

A الهانبوك غريب المشي الرتبة حو لاتخاذ ستة عشر أصدقاء التوالي: يوم واحد انه سيتولى منصب عوزي

لى يينغ يينغ يينغ مساعد قوية! وصل ليو سياوتونغ في تيانجين لاستكمال نقل، أو مساعدتها الإنجازات MVP

"نشيد الفرح"، "خمسة الولايات المتحدة" تشي اللياقة البدنية والترفيه الممثلة التي أكثر صحية؟

طبعة روايات هاري بوتر الأولى لبيع 500،000 ماريو زفاف مفتوحة التعيين | الرجل المستقيم يوميا

2018 NEST شيامن مسابقة حرب، وتظهر منظمي هذه الموجة من العمليات فائقة الذكاء العاطفي!

190118 واحد رسالة مفتوحة لى يى فنغ ذروة النشاط اليوم مضاءة إضاءة خلفية ميتو من آفاق جديدة

LOL: مدرب RNG القلب أصدر اعتذارا ليست ما يجعل أي من المباني ولكن أيضا لله يغلي الدم؟

سامي تشنغ جين مرة أخرى بعد انقطاع دام 16 سنوات من التعاون، المستخدمين ذكريات يصرخ

إعداد! يوان يوي نقل قلب شريك تشانغ تشانغ نينغ، وجيانغسو ولياونينغ ووانغ ييمي ليحل محل لها

بارتداء هاتين القبعتين ، يمكن إنقاذ سرطان شعرك مرة أخرى! أساسي

بائسة من الجمعية العامة بدأت، IG حدث بطولة يتلقى البشرة خالية، كنت براميل بلغت حتى الآن؟

لماذا لا يمكن أن تحمل أرنب قرد حديقة الحيوان النمور والاسود لا يعتمد عليه؟ أكل حماقة