أكبر مصدر غوغل مفتوحة المشروح مجموعات البيانات والفيديو وأدوات ضبط نموذجية يدويا TensorFlow

1 الأنفس جي تجميع جديد

المصدر: بحوث جوجل، جيثب

الترجمة: وانغ نان، ليو شياو تشين

AI إعادة بدء وتحديث فينتيان!

جي الأنفس وأتمنى لدينا المشتركين الجدد الديك أسفل!

نيو جي وون لإطلاق جولة جديدة من التجنيد : COO، مدير تحرير، محرر، مترجم المتقدمة، والكاتب، مدير العمليات، مدير حسابات، مدير استشارات، مساعد إداري وغيرها من تسعة مناصب مفتوحة بالكامل.

تسليم السيرة الذاتية: ي obs@aiera.com.cn

HR مايكرو الرسالة: 13552313024

جي وون كما COO الجديد ومدير تحرير أعلى راتب سنوي قدره أكثر من مليون حافز، لتوفير أكبر قدر من إكمال نظام التدريب هو العمود الفقري للموظفين، أعلى من متوسط مستوى الصناعة الأجور والمكافآت.

انضم تشي يوان الاصطناعي القادة الجدد والمخابرات والصناعة العمل معا لتغيير العالم.

[استعراض فاز جي الجديدة فتح جوجل يوتيوب فيديو مجموعة البيانات --Youtube المربع المحيط (يوتيوب BoundingBoxes)، تحتوي على ما مجموعه 500000023 فئات المشروح يدويا، دافئ صالح مربع من حدود الكائن والدقة إحاطة أفضل من 95. وتقول جوجل هذا هو إلى حد بعيد أكبر مربع إحاطة مجموعة المشروح يدويا بيانات الفيديو، وبيانات يمكن أن يأمل في تعزيز جديد الكشف عن وجوه الفيديو التقدم والتتبع. [جي وون الجمهور الرقم الجديد في مربع الحوار، أدخل "170207" تحميل الورق]

جوجل اليوم أيضا مفتوحة المصدر أدوات نموذج TensorFlow ضبط الأداء tfprof، واستخدام tfprof يمكن عرض عدد من المعلمات نموذج وموتر شكل (شكل الموتر)، وفهم عملية إدارة الوقت، وحجم الذاكرة والجهاز الموقع. الآن، tfprof دعم بالفعل بيثون API والأدوات والبرامج النصية من سطر الأوامر التفاعلية باستخدام خطوة واحدة (طلقة واحدة سيناريو).

حقل البحوث في تعلم الآلة في اليوم الأكثر تحديا هو السماح أجهزة الكمبيوتر على فهم المحتوى من المشهد. على سبيل المثال، إقامة حائط صد الكرة بعد فترة وجيزة الوجود اختفى عن الأنظار، ثم عادت الى الظهور، ويبدو البشر أن نعرف أن الكرة هي على الارجح مجرد الكرة، ولكن لخوارزمية لم يكن الأمر كذلك. لفهم هذا يتطلب ليس فقط فهم عالمي للكائن من كل إطار إدراجها في الفيديو، والحاجة إلى معرفة موقعها في إطار وتغيير في الموقف من هذه الكائنات مع مرور الوقت. عام 2016، أصدرت جوجل يوتيوب-8M، مجموعة بيانات يتكون من فيديو يوتيوب تكوين الترميز التلقائي. على الرغم من أن هذه المجموعة البيانات للمساعدة في مواصلة تطوير هذا المجال، ولكن ليس بما فيه الكفاية.

اليوم، وذلك لدراسة الفيديو في تعزيز التفاهم وأصدرنا مجموعة بيانات يوتيوب BoundingBoxes (https://research.google.com/youtube-bb/). يرمز هذا في مكثفة 210،000 يوتيوب فيديو كليب، ويضم ما مجموعه 5،000،000 المربع المحيط (مربعات إحاطة) فئة من الأشياء تتألف من مجموعات البيانات 13 فيديو. يشير إلى المربع المحيط على إطارات متتالية في الوقت الأجسام كتلة تتبع، حتى الآن، وهذا هو أكبر الاصطناعي المسمى مجموعة بيانات الفيديو يحتوي على المربع المحيط. حجم مجموعة البيانات، وتكون كافية لتدريب النماذج الكبيرة، ويتضمن لقطة فيديو في بيئة طبيعية. الأهم من ذلك، دليل الشرح الشرح يحتوي على كائنات التي تظهر في العالم الحقيقي، وأنها قد تكون انسداد جزئي، الضبابية تظهر ويكون الإضاءة الطبيعية.

FIG: مجموعات البيانات الشخصي. شريط: صورة موجودة (أحمر) والفيديو (الزرقاء) بالنسبة لعدد من مجموعة البيانات الكشف عنها. مجموعة يوتيوب BoundingBoxes البيانات (YT-BB) في القاع. الجدول: ثلاثة أعمدة الاعتماد على التوالي: الشروح تصنيف، مربع، مربع إحاطة من شريط فيديو واحد وثاب. لمزيد من المعلومات حول قواعد البيانات، راجع وثائق ما قبل الطباعة.

ومن السمات الرئيسية لمجموعة البيانات هي توفير كامل المربع المحيط فيديو كليب المسمى. هذه العلامات يمكن استخدامها لتدريب المربع المحيط باستخدام المعلومات في الوقت مع مرور الوقت تحديد وتحديد أماكن وتتبع نموذج كائن. في شريط الفيديو، قد يكون كائن الموسومة سدت تماما، وظهور مشاكل في الإطارات في وقت لاحق. قد تكون هذه علامات لم يعد احد من وجوه التعرف على كل إطار، ولكن إذا تم وضع بدقة الكائن والتتبع، ويمكن فهم الهوية في سياق فيديو

ثلاثة مقاطع فيديو، عينة واحدة لكل مستوى الثاني. وأخيرا، كل عينة يظهر طمس بسبب التظليل أو (اطار بحيث القطارات)، مع صعوبة تحديد الكائن من مدى الحدود البصرية. ومع ذلك، فإن الوقت ترتبط مع الإطار الذي الكائن الكشف عن هويته بسهولة أكبر، والذي يجعلها قادرة على تصنيف كائن الكمبيوتر من خلال الاستدلال (يستنتج). علما بأن فقط الجزء المرئي من العينة تم تضمينها في المربع المحيط: صورة الدب القطبي، يشير السهم البرتقال رئيس المخفية. اثنين من الكلاب اللعب في الشكل، السهام البرتقالي يشيرون إلى الذيل خفية، وأشار السهم الأزرق القدم غير مرئية. عينة من الطائرات في الجزء السفلي من العرض الكائنات في وجهة نظر مختلفة، في حالة التظليل وعرض التعليقات.

نأمل أن هذه البيانات سوف تساعد البحوث المحددة في رؤية الكمبيوتر وآلة التعلم لتوجيه طريقة جديدة لمشاكل بصرية للتحليل وفهم العالم الحقيقي. لمزيد من المعلومات حول مجموعة من البيانات يمكن أن يفهم في الصحف لورقة ذات الصلة.

يوتيوب المربع المحيط: كبير كشف عالية الدقة للموضوع البشري لشرح مجموعة بيانات الفيديو

ملخص

قدمنا URL فيديو جديد مجموعات البيانات الكبيرة --YouTube المربع المحيط (YT-BB)، التي تحتوي على عينات كثيفة من التعليقات مع المربع المحيط الكائن. مجموعة البيانات يتكون من حوالي 380،000 حوالي 19 ثانية من شظايا الفيديو، ويختار تلقائيا الخلفية الطبيعية المعلقة، دون تحرير أو post-processing من الأشياء، وتسجيل نوعية وجودة التسجيل مشابهة لكاميرا الهاتف المحمول العادية. هذه الكائنات تمثل مجموعة فرعية من مجموعة من التسميات MS COCO. جميع مقاطع الفيديو عن طريق الشرح اليدوي، وعلامة تصنيف مع دقة عالية المربع المحيط 1 إطار في الثانية الواحدة. الاستخدام المتواصل لعدد كبير من أعلى على نحو متزايد الشرح دقة الإنسان، ويضمن أن مربع إحاطة من كل فئة (على اتصال وثيق مع كل حدود الكائن) أكبر دقة التسمية من 95. وأخيرا، قمنا بتقييم التدريب والشهيرة هندسة الشبكات عميقة، وذكرت في كل تصنيف الإطار وتوطين بيانات خط الأساس في النص، لتوفير نقطة مقارنة للعمل مستقبلا. أثبتنا أيضا كيفية الاستفادة من الوقت لتحسين استمرارية الفيديو هذا الخط من التفكير. ويمكن الاطلاع على مجموعات البيانات في هذا URL https://research.google.com/youtubebb/ . نحن نريد أن نقدم هذا أمر الإحضار كبيرة للباحثين والمطورين، يمكن أن تحفز الجديد الكشف عن وجوه الفيديو التقدم والتتبع.

[جي وون الجمهور الرقم الجديد في مربع الحوار، أدخل "170207" تحميل الورق]

جوجل المصدر المفتوح أداة نموذج TensorFlow ضبط tfprof

جوجل اليوم أيضا فتح tfprof، tfprof هو اختصار لأداة نموذج ضبط (أداة التنميط لنماذج TensorFlow) باستخدام tfprof يمكن عرض عدد من المعلمات نموذج وموتر شكل (شكل الموتر)، وفهم عملية إدارة الوقت، وحجم الذاكرة و موقع الجهاز. الآن، tfprof دعم بالفعل بيثون API والأدوات والبرامج النصية من سطر الأوامر التفاعلية باستخدام خطوة واحدة (طلقة واحدة سيناريو).

ووفقا للمؤلفين قدم شين بان في جيثب، وتشمل السمات الرئيسية tfprof

  • المعلمات نموذج القياس، عمليات الفاصلة العائمة، شكل الموتر

  • قياس وقت التنفيذ العملية وحجم الذاكرة وطلب تخطيط الجهاز (وضع الجهاز)

  • تحقق موتر نقطة تفتيش (تفتيش التنسورات) شكل والقيم

  • اسم عرض مجموعة من هيكل أو المتصفحات القائم على نموذج

  • عملية انتقائية للتصفية حزمة، وإنشاء حساب (حساب) والفرز

ويصف وثيقة جيثب أيضا استخدام بسيط بيثون API، على سبيل المثال،

للتحقق من شكل وحجم كل المتغيرات عندما قابلة للتدريب،

للتحقق من عدد عمليات الفاصلة العائمة عندما،

tfprof TensorFlow هو جزء من جوهر. استخدام tensorflow استيراد كما فريق العمل على الخط.

ترجمة المصدر:

https://research.googleblog.com/2017/02/advancing-research-on-video.html

https://github.com/tensorflow/tensorflow/tree/master/tensorflow/contrib/tfprof

[البحث] جديد AI يونيكورن جي فاز معا 10 رأس المال الكبير

خطة بدء الأعمال مسابقة 2017

AI مسابقة ريادة الأعمال من جي وون جديد مع 10 التيار AI VC: الأزرق تشي المشاريع، سيكويا كابيتال الصين، صندوق الذكاء الاصطناعي قاو لينغ تشي، عاصمة بحيرة الأزرق، والأزرق الفيل رأس المال ورأس المال IDG عاصمة عالية يونغ، سيتيك الأوراق المالية الاستثمار في مجال البناء، مينغ المحتملين العاصمة sonhwa بعيد للانضمام إلى صندوق بادر برعاية يوان التشيلي الجديد، واللجنة الإدارية حديقة تشونغ قوان تسون بكين للعلوم، ويدعم لجنة إدارة تشونغ قوان تسون هايديان حديقة العلوم، هو تجميع رواد التكنولوجيا AI وقادة الاستثمار الحدث. تشى يوان لتوفير قوية موارد رأس المال الاستثماري جديدة إلى فرصة لرسو السفن القادمة AI يونيكورن الكامل من الطموح، وأعلى TS مشروع في انتظاركم ليأتي وجمع.

انقر أدناه لقراءة المقال الأصلي، وملء استمارة الطلب على الانترنت طلب التسجيل. تشارك الساعات صحيفة في اختيار المعلومات المطلوبة.

إذا كان أكثر من الوصف المعلومات (مثل BP، الخ)، ويمكن إرسالها إلى xzy100@aiera.com.cn، يرجى الإشارة إلى اسم الشركة من رأس الرسالة. إذا كان لديك أي أسئلة المشورة، لا تتردد في الاتصال المرسل إلى علبة البريد.

40 عاما من الاصلاح والانفتاح | تنظيم مركزيا أجهزة الأمن العام في جميع أنحاء البلاد لمشاهدة احتفال بالذكرى 40 للإصلاح والانفتاح الكبير

بعد تجربة السيارة كان يقود شعاع عالية، لا تتسرع في الرد، لا تفعل ذلك على حد سواء!

الشعبية الصينية المال، والشركات الصينية أو إلى أكبر المزارعين الخارجية الروسي حصاد فول الصويا شحنها الى الصين

كيف رجال الأعمال القدرة على فتح هيكل لهذه المشكلة؟

توني لونغ وتشانغ تشن قد أحب البر في نهاية يتل باريس، وأمريكا الجنوبية الكتب المد

الفرامل التأمين على الحياة ليست فعالة، تشغيل عالية السرعة على كيفية التعامل معها؟

"تذكير" نهاية الأداء اللصوص التسرع! بعد قراءة هذا المقال السماح لهم شيء!

محلل مايكروسوفت مفتوحة المصدر النموذج البيولوجي (BMA): أدوات البحوث البيولوجية القائمة على السحابة

التمييز من أجل احترام أفضل، لا تحاول أن تخدم الجميع

سيارة خاصة لم تعد "صحيفة قوية"؟ ولكن الأميال لا يباع، كان كارثة!

في تلك الشعر الشعبي مذهلة، ما أغنية تحب؟

"الثقيلة" AAAI خبز 2017 أفضل ورقة الدجاج على رياح جديدة تهب الصينية (القائمة 11 جائزة)