يوم واحد أكثر من 2000 مرة، وكيف بدأ علي ماكروزس الصوت والفيديو الحملة؟

علي شقيقة استعراض: علي، أصبح عقد المؤتمرات الصوتية والفيديو الاتصالات بين المناطق والاجتماعات وتوظيف طريقة المفضل. ويذكر أن شبكة المكاتب بابا مع عقد المؤتمرات الصوتية والفيديو وقد غطت 33 دولة ومنطقة، بما في ذلك الصوت والفيديو كونفرنس تزيد أعمارهن في المتوسط أكثر من 2000 ألعاب يعقد كل يوم في الأشهر الثلاثة الماضية. في الاستخدام في كثير من الأحيان، والتغطية حتى سيناريوهات الصوت والفيديو واسعة، وكيفية تلبية الاحتياجات المختلفة للمستخدمين في جميع أنحاء العالم لضمان التواصل السلس؟ هنا، ونحن نعمل معا لاستكشاف والبحث.

مشترك من قبل: علي بابا منصة معلومات من كبار الخبراء الفنيين الذين يسبب الانقسام

تطوير صناعة الصوت والفيديو

الصوت وصناعة الفيديو يتطور بسرعة، من خلال عصر الأبيض والأسود من 1970s، العصر الرقمي في 1980s، والرقمية ذات وضوح قياسي عصر 1990s 2006 - HD عصر 2015 وعام 2016 وتدريجيا بدأ اتجاهات الصناعة المتقاربة الموجهة الاتصالات وعالية الجودة (4K، عالية الوضوح، وارتفاع معدل الإطار، HDR)، متعدد المشهد (عند الطلب، ويعيش، في الوقت الحقيقي والاتصالات)، أصبحت سحابة من (الأجهزة والبرمجيات والتكنولوجيا، ومنصة سحابية) وصناعة اتجاه التنمية للصناعة الصوت والفيديو الحالية.

اتجاهات المستقبل في صناعة الصوت والفيديو، في رأيي هو سحابة + العميل + الخدمة.

  • يقول: منصة سحابة، من أجزاء من الكمية المخصصة لادارة العلاقات والخاص من سحابة العامة، وجميع الخدمات القائمة على السحابة.
  • ينتهي: متوافق مع مختلف المحطات، PSTN وVOIP، المعدات قاعة المؤتمرات، والهواتف النقالة، وأجهزة الكمبيوتر، والإنترنت، والمحطات الروبوت.
  • الخدمات: بما في ذلك SMS، صوت، IM والصوت والفيديو، ومركز الاتصال وخدمة العملاء وخدمات AI سحابة إضافية وغيرها من الخدمات.

حاليا، الصوت والفيديو قد استخدمت على نطاق واسع، بما في ذلك B2B (الأعمال التجارية لرجال الأعمال بين، بين الداخلي)، C2C (بين المستخدم والمستخدم) وB2C (بين الشركات والمستخدمين).

صور من "2018 الاتصالات ايرلي سحابة الخدمات تقرير الصناعة"

ووفقا لVNI سيسكو الشهير (مؤشر شبكة الظاهري) يتوقع أنه بحلول عام 2021 فإن الأرض لديها 4.6 مليار مستخدمي الإنترنت، 27100000000 معدات الشبكات، و 82 من حركة المرور على الإنترنت هو الفيديو. وكل ثانية يكون هناك يتم إنشاء مليون دقيقة من محتوى الفيديو، والتي سيتم زيادة عالية الوضوح 4K محتوى بنسبة 30، أي ما يعادل شهر لتوليد 7.1 مليار فيلم DVD، وزيادة كبيرة في الطلب على الحي 15 مرة.

من اتجاه تنمية الفيديو نفسه يشغل كل وسيلة لمشاهدة عالية الوضوح، CIP، 4CIP، 720P، 1080P، UHD4K و8K، إلى جانب ارتفاع معدل الإطار FPS 120-160FPS، HDR (عالية المدى الديناميكي)، التدرج اللوني واسعة (على نطاق واسع مجموعة ألوان) وتهدف جميع التطورات في إعطاء تجربة غامرة غامرة. وبطبيعة الحال، VR، AR، 360 أشرطة الفيديو، وسيتم إنشاء هذا دفق البيانات عن وسائل أكثر الفيديو والاستهلاك.

نحن بحاجة للسماح للبيئة الشبكة وتعمل باستمرار على تحسين خدمة الصوت والفيديو

إذا كان النطاق الترددي للشبكة غير محدودة ودون عائق، وأن العالم سوف يكون نعم جميلة جدا. لكن الشبكة ليست Yimapingchuan. الاختناقات المرورية نوفمبر عطلة في بعض الأحيان مثل، أحيانا مثل الممرات البلاد الموحلة، ولكن أيضا قد تكون حفرة مغطاة.

ووفقا للفضة الذروة في جميع أنحاء الولايات المتحدة والتقرير الخاص بالصحة في الشبكة الأوروبية وجدت، وشبكة الكمون نقل، غضب وفقدان الحزمة هو ظاهرة شائعة. شروط الشبكة مثل الطقس بعيد المنال في بعض الأحيان. في حين أن متوسط معدل فقدان حزمة من هذه الشبكة هو فقط 0.34، ولكن في حالات فردية قد يصل إلى 2.2، وفقدان حزمة موحدة أبدا، هو انفجار متقطع، فإن متوسط تأخير شبكة قد تتجاوز 300 مرة. هذه شروط الشبكة المتطرفة، هي التحدي الكبير لتجربة النقل والمستخدم لالسمعية والبصرية.

العرض والطلب وشبكة الصوت والفيديو حركة المرور، شبكة نقل للواقع القاسي غير مؤكد وغير كامل، مما اضطر أسفل نستمر في تحسين الخدمات ورصد الصوت والفيديو.

محتوى الصوت والفيديو من الإنتاج إلى رابط خبرة عملية الاستهلاك مختلفة، وهذا العنوان هو لفترة طويلة، حيث التكنولوجيا المستخدمة أكبر، والتي سوف أساسا الفيديو الترميز، هندسة الشبكات للقرار.

ترميز الفيديو

فيديو الترميز معيار الاختيار

اعتمد ترميز الفيديو القياسية والتكنولوجيا فيديو الأساسية، وظهور على مدى قرون عديدة معايير مختلفة، ولكن في نهاية المطاف من قبل السوق أساسا لأنظمة التاليين: نظام موحد للH264، وVVC H265 ويجري تطويرها، والآخر مجموعات هي مصدر الملوك الخالية VP8 مفتوحة، VP9 وAOM (التحالف من أجل توسيع ميدع) من AV1.

علي بابا كما تشارك عضوا في AOM بنشاط في تطوير VVC، للا يمكن أن أمسك الحلق التنمية الفيديو الأساسي الترميز.

الترميز لتلبية الاحتياجات المختلفة من السيناريوهات المختلفة

سيناريوهات الفيديو المختلفة (مثل: بناء على الطلب، ويعيش والاتصالات في الوقت الحقيقي)، ويحدد الاحتياجات المختلفة لكل مشفرة تحت السيناريو.

لكفاءة الترميز على الطلب هو الأهم، وكيفية فعال حفظ عرض النطاق الترددي. الهواء يحتوي على متطلبات تأخير، ولكن في مرحلة ثانية، فإن الطلب على السرعة والاستقرار ترميز أعلى من الطلب. الاتصالات في الوقت الحقيقي على "نقطة" من متطلبات الحد الأقصى تأخير، في حين أن متطلبات الاستقرار والتسامح خطئها هي أيضا عالية، والذي يحتاج إلى أن يتحقق عن طريق تحقيق التوازن بين الكفاءة الترميز.

كيف الاقتران معدل الترميز، والقرار

وترميز الفيديو، ومعدل ثابت قبل المعلمات ضغط ببساطة ثابتة وقرار ثابت لMPEG-DASH وHLS ABR (معدل بت تكيفي)، وأيضا مع الترميز معدل وقرار مطابقة الثابتة. هذا لا يمكن أن تلبي الاحتياجات المختلفة من مختلف معدل بت الفيديو. قد يبدو للرسوم المتحركة 1M 720P كانت جيدة جميلة، ولكن الفيلم 720P العمل تبدو جدا 1M لصق.

ولكن لABR، ومعدل، والقرار الترميز هو عملية التوازن الديناميكي. في حالة انخفاض معدل بت مع منخفضة الدقة كتلة للحد من تأثير (آثار حجب)، لتعزيز قرار عند زيادة معدل بت إلى درجة معينة، وتحيط بها قرارات مختلفة RD منحنى بدن محدب (محدب هول). تقاطع منحنى هو عقلاني الترميز معدل وقرار مطابقة.

كيفية تحديد مقاييس جودة الفيديو

ولكن كيف لتحديد نقطة تقاطع منحنى في ذلك؟ وهذا يتطلب قدرا من جودة الفيديو.

المؤشرات الفيديو المعتادة، بما في ذلك مؤشرات ذاتية وموضوعية مثل MOS تشير PSNR، حركة استقلال جنوب السودان وVMAF. بابا مؤشرات جودة الفيديو، وليس فقط بالتزامن مع مؤشرات موضوعية مشتركة، مع الأخذ في الاعتبار أيضا جودة تشغيل كيتون وشروط الشبكة.

كيف التكيف الترميز

التكيف الترميز (ترميز التكيف المحتوى) هو الاتجاه الرئيسي في ترميز الفيديو. الترميز المعلمات من زوج واحد مقاس واحد يصلح للجميع، ومعدل البت وقرار تخصيص ترميز التكيف المعلمة وفقا لمدى تعقيد محتوى الفيديو. كود التكيف يمكن أن يكون لمشاهد الفيديو واحدة، والحزب الجمهوري، أو حتى مختلف الإطار المعلمة ضغط تعديلها بشكل ديناميكي، بحيث الأمثل لتحقيق أقصى قدر من نوعية الفيديو، وحفظ عرض النطاق الترددي. هذه أمثلة متكيفة هو الأكثر المقاييس الهامة جودة الفيديو. وبمجرد الانتهاء من تحديد المؤشرات المتاحة، يمكن أن يكون حولها في مستويات مختلفة من التحسين.

لرمز على التكيف، ويمكن تعلم الآلة أن تكون ذات فائدة كبيرة. هذا التعلم آلة لخصائص الفيديو المختلفة، والعثور على المعلمات الترميز الأمثل المقابلة.

لا تمثل الدماغ البشري لنسبة من جسم الإنسان، ولكن يستهلك الجسم حوالي ثلث الطاقة والخصائص الجينية للدماغ الإنسان يحدد فقط الصورة من الاهتمام في مجالات هامة، تجاهل المنطقة غير مهم. مع العائد على الاستثمار من هذا القبيل (إقليم الفائدة) يتم ترميز، معدل الترميز يمكن تخفيض مع الحفاظ على الجودة الشخصية للالفيديو. على سبيل المثال، وجوه والكلمات هي أمثلة على ROI تحت معنى التجريبية.

الصوت وشبكة الفيديو خادم العمارة

هندسة الشبكات في الوقت الحقيقي لخدمة الصوت والفيديو، بالإضافة إلى MESH، وكذلك MCU (وحدة تحكم متعدد نقطة) وSFU (وحدة Selectiveforward) نوعين.

مركزية MCU وسائل الاعلام خدمات المعالجة، ميزة يمكن إشارات وتحكم وسائل الإعلام التحويل، مثل الترميز وسائل الإعلام، تجاوز، خلط الشاشات، والانقسام، مما يدل على التحويل، والطريق الأمثل من الحزم وسائل الاعلام وما شابه . MCU يمكن أن تقلل من متطلبات وحدة المعالجة المركزية وعرض النطاق الترددي الشبكة من جانب العميل، ولكن MCU العيب الواضح أيضا أن النفقات العامة الخادم وحدة المعالجة المركزية وتأخير يجلب.

نسبيا MCU، والهندسة المعمارية الحالية SFU أكثر شعبية، وميزته الرئيسية هي بسيطة، الكمون المنخفض، والإنتاجية العالية، والعيب هو متطلبات عرض النطاق الترددي من جانب العميل مرتفعة نسبيا، على طول الطريق عميل لتحميل أو تنزيل تيارات متعددة تيار المضاعفة في وقت واحد. العميل SFU يمكن أن ترسل تيار واحد، متعدد تيار (أذع) وSVC. وفقا لتطبيق سيناريوهات مختلفة، عملاء إرسال سياسة الحركة هي أيضا مختلفة.

في مؤتمرات الصوت والفيديو علي بابا، استخدام الوضع المختلط SFU + MCU، لضمان أقصى قدر من التوافق. هذه الاستراتيجية سلسلة SFU وMCU لضمان أقصى قدر من المرونة لجميع أنواع العملاء. وبالإضافة إلى ذلك يمكن أن يتم في وسائل الاعلام الخادم في مناطق مختلفة من سلسلة، وعضوية العميل في مكان قريب، أقرب حزمة التصحيح، والحد من تأثير الأولى والكيلومتر الأخير على بعد ستة كيلومترات جودة الصوت والفيديو.

شبكة تقييم عرض النطاق الترددي

تقييم عرض النطاق الترددي الشبكة هو تقنية أساسية في الدعوة في الوقت الحقيقي. وقد تم تحسين بابا لقاعة المؤتمرات المشهد كثيرا في هذا الصدد. ويمكنك نشر بسرعة على جانب الملقم من خلال تقييم الخوارزمية، دون انتظار برنامج العميل التحديث.

في ضعف صافي لا مفر منه تخصيص عرض النطاق الترددي، معقول، والأولوية لضمان انتقال الصوت، في حين أن ضعف شبكة المعلومات في الوقت المناسب للمستخدم، يمكن للمستخدم الحصول على فهم نفسه، وتعزيز تجربة المستخدم.

حاشية

ويرد الصوت وجودة الخدمة خدمة الفيديو، وليس نقطة واحدة من تجربة المستخدم النهائي ليست نسبة بسيطة مكافحة فقدان الحزمة، مؤشر معدل كيتون، ولكن نهاية لتجربة النهاية. لذلك نحن لا نحتاج فقط مقدما لخلق بيئة مواتية الصوت والفيديو، ولكن نحن بحاجة إلى مراقبة جودة الارتباط الكلي. بالإضافة إلى الكشف في الوقت المناسب من المشاكل، والاستجابة السريعة، ولكن أيضا يمكن أن تساعدنا على الاستمرار في اكتشاف وخلق سيناريوهات الأعمال الجديدة أكثر. بواسطة بيانات الأعمال وإعادة استخدامها وفقا لبيانات لتوجيه الأعمال، وذلك لجعل تجربة خدمة الصوت والفيديو ولتحقيق نهاية المطاف.

7 انتصارات و 3 تعادلات وسبع هزائم! بشرت Hengda في معظم خائفا من خصومهم، ومدرب أو ثقة الآخرين

400000 خلال مدة لا قلق مجموعة من السيارات الكهربائية، جعلت مثالية حكمة واحد هل شراءه؟

سونغ جيانغ مبارك! إضافة 4 غرين عالية القيمة اللون، أفكار جديدة أكثر الترفيه ~

"لا بلد ليلة: القمر الجديد الزهور يتزوج" كشفت لأول مرة المهارات مظاهرة آلة حقيقية تناسب الفتاة باردة

بتلر: عمرك تخسر! تتصلب: لا أعرف! بول: هذه المرة ليس لي!

و! الاستثنائي و! الاستثنائي علي الاخوة إلكتروني أصدقاء ~

يوم 30 براءة اختراع، اكتشف الابتكار التكنولوجي سرعة هينا

الجميع حزمة المتفجرة! كسر دفاع ليفربول الهدايا المتعاقبة، جوهر ليس عصبيا قليلا

فإن سوبر 16 فتح اللعب: المشجعين قوانغتشو في جميع أنحاء البلاد يمكن مشاهدة ديربي، لا يعيش الحرب CCTV بكين لو

وقال مورينيو مانشستر يونايتد الى المركز الرابع عدم الحديث عن ما سباق المنافسة على اللقب في الدوري الممتاز؟ وراء هدفين لإثبات نفسه ليكون مركز وبخ

البرق الفضي خارقة للخارج! مكلارين لإطلاق 2020 نماذج Speedtail

"قناص: شبح المحارب 3" مرة أخرى ارتدت كل شيء الأمثل