KDnuggets الأكثر شعبية هذا الشهر: 5 لا ينبغي تفويتها مشروع التعلم الآلي

1 جي فاز تجميع جديد

Hyperopt-sklearn

نجم: 219

عنوان جيثب: الشبكي: //github.com/hyperopt/hyperopt-sklearn

Hyperopt-sklearn وHyperopt نماذج لخوارزميات تعلم الآلة مقرها scikit تعلم المشروع. وصفت وثائق المشروع أدناه:

العثور ينطبق بك المصنف البيانات الصحيحة يمكن أن يكون صعبا. بعد اختيار المصنف، من أجل الحصول على أفضل النتائج وصقل هو أيضا مملة جدا ولجميع المعلمات تستغرق وقتا طويلا. وبعد كنت قد فعلت كل هذا العمل الشاق، إلا أن تجد من بداية اختيار تصنيف خاطئ. يوفر Hyperopt-sklearn حل لهذه المشاكل.

Hyperopt-sklearn باستخدام مجموعة متنوعة من خوارزمية البحث يمكن البحث عن (مدعومة) المصنف، أو فقط في إعطاء المصنفات الفضاء المعلمة البحث، ودعم مجموعة متنوعة من خطوة ما قبل العلاج، مثل PCA، TfidfVectorizer، Normalzier وOneHotEncoder.

فكيف يفعل ذلك التأثير؟

الجدول التالي هو F1 جزء scikit-تعلم استخدام المعلمات الافتراضية لتشغيل المصنف تم الحصول عليها، والمعلمات الأمثل في المعلومات hyperopt-sklearn على 20 مجموعات البيانات. النتائج hyperopt-sklearn من عملية واحدة من 25 التقييم.

Hyperopt-sklearn يتطلب القليل جدا من رمز إضافية، وهناك بعض مفيد كود بداية سريعة.

Dlib

نجم: 1281

عنوان جيثب: الشبكي: //github.com/davisking/dlib

Dlib هي مجموعة عالمية لC ++ باستخدام التعلم الآلي وتحليل البيانات التطبيقات. هو مكتوب في C ++، ولكن أيضا API بيثون.

يعرض الموقع الرسمي على النحو التالي:

Dlib هو حديث C ++ أدوات، تحتوي على خوارزميات وأدوات التعلم الآلي للاستخدام C ++ لخلق البرمجيات المعقدة في حل المشاكل العملية. لها تطبيق واسع في الصناعة والأوساط الأكاديمية في مختلف المجالات، بما في ذلك الروبوت، الأجهزة المدمجة والهواتف المحمولة وبيئات الحوسبة عالية الأداء وعلى نطاق واسع.

وثائق تصل إلى مستوى، وكان API بشكل جيد أيضا وأوضح، ومشروع مع مقدمة موجزة. بلوق المجتمع هو أيضا نشطة جدا، وإدخال بعض المشاريع المثيرة للاهتمام. Dlib ليس المشروع الجديد، الذي كان منذ عام 2002 في مجال التنمية.

NN ++

نجم: 184

عنوان جيثب: الشبكي: //github.com/stagadish/NNplusplus

NN ++ هي خفيفة الوزن تنفيذ C ++، من السهل جدا استخدام الشبكات العصبية، دون الحاجة إلى تثبيت مباشرة إلى تضمين #.

وصف الريبو مشروع أدناه:

NN ++ هو باختصار، تطبيقات، C ++ مكتفية ذاتيا من الشبكات العصبية سهلة الاستخدام. وتضم الشبكة العصبية لفئة مصفوفة والجبر الخطي إلى حد كبير. تم بناء المشروع بشكل رئيسي لغرض التعلم، ولكن في MNIST نتائج الاختبارات الأولية تظهر مجموعات بيانات الأداء الجيد.

ثائقها متناثر، ولكنها تحتاج إلى تفسير إضافي يرافق الطبقة مصفوفة. مقتطفات الشفرة في مستودع جيثب تشرح كيفية إعداد والاستعلام الشبكات العصبية. الشفرة هنا هو الحد الأدنى، لذلك أريد أن أفهم الشبكة العصبية بسيطة أو من لغات أخرى للقفز مباشرة تنفيذ الشبكة باستخدام C ++، وهذا المشروع هو تستحق الزيارة.

LightGBM

نجم: 2362

عنوان جيثب: الشبكي: //github.com/Microsoft/LightGBM

وبسرعة، وزعت، وارتفاع الأداء والتدرج رفع (GBDT، GBRT، GBM أو MART) إطار بناء على خوارزمية شجرة القرارات، وعادة ما تستخدم لفرز المهام تعلم آلة تصنيف وغيرها. وهو مشروع تحت مايكروسوفت DMTK (آلة توزيع التعلم أدوات).

LightGBM مكتوب في C ++ وبايثون، يوفر دليل البداية السريعة، ودليل الدراسة الموازية وكذلك لمحة عامة عن وظائف.

كيف يتم ذلك؟

باستخدام مجموعة بيانات مشتركة تظهر التجارب، LightGBM الدقة والكفاءة هي أفضل من غيرها في تعزيز الإطار السابق واستهلاك الذاكرة هو أقل بكثير من الإطار الآخرين. وبالإضافة إلى ذلك، تبين التجارب أن LightGBM من خلال استخدام آلات متعددة في وضع معين وتدريبهم على تحقيق تسارع الخطي.

LightGBM لديها العديد من المهام، فمن يستحق المحاولة.

Sklearn-الباندا

نجم: 763

عنوان جيثب: الشبكي: //github.com/paulgb/sklearn-pandas

وصف المشروع أقدم آلة مشتركة أدوات التعلم، أو لتحقيق خوارزمية معينة. هذا المشروع يختلف بعض الشيء، فإنه يلعب دورا داعما في مهام التعلم الآلي.

Sklearn-الباندا هو وحدة قيد التطوير، وكتب مقدمة لها مستودع جيثب أنه "بين Scikit وتعلم آلة الطرق والأساليب من إطار الباندا البيانات تعلم يسد الفجوة."

على وجه التحديد، فإنه ينص على النقطتين التاليتين:

  • DataFrame الأعمدة التي تم تعيينها إلى طريقة التحول، سوف معاد هذه التحولات لاحقا إلى هذه الميزة.

  • Scikit تعلم الإصدار القديم من الصليب التحقق من صحة pineline هل التوافق (التوافق الرقائق)، يتطلب الباندا DataFrame كإدخال. هذا يحتاج فقط scikit تعلم < 0.16.0. تم عرض هذه إهمال وقد == 2.0 في skearn-الباندا يتم حذف.

هنا هي القيمة الحقيقية للعمود (أعمدة) خرائط لتحويل (التحولات). ما يلي هو رمز جزء جيثب مستودع:

علما بأن الأعمدة الثلاثة الأولى هي LabelBinarizer الإخراج (المقابلة _cat _، _ dog_ و_fish_)، العمود الرابع هو القيمة المعيارية لعدد من الأطفال. عادة، يتم فرز الأعمدة وفقا لتسلسل معين عند بناء DataFrameMapper.

العنوان الأصلي: HTTP: //www.kdnuggets.com/2017/01/five-machine-learning-projects-cant-overlook-january.html

توظيف جديد تشى يوان

وظائف مدير تحرير المحرر

الوظيفة الراتب: 500000 (الراتب + مكافأة) -100000000 (الراتب + مكافأة + خيار)

المكان: بكين - هايديان

القسم: قسم التحرير

تقديم التقارير إلى: CEO

عدد المرؤوس: 20

العمر: 25 سنة إلى 40 سنة

اللغات: الانكليزية ثمانية أو خلفية أعمال أكثر في الخارج

موقف الخلفية: هناك فريق فني في مجال الخبرة في إدارة تكنولوجيا المعلومات في وسائل الإعلام والتيار الصحيح الخطاب التعليم: درجة الماجستير فما فوق

الوصف الوظيفي:

  • AI الحب وسائل الإعلام الأعمال.

  • مع أكثر من 3 سنوات من الخبرة في مجال تحرير وسائل الإعلام، ولها تأثير والاتصالات معين في الصناعة؛

  • + مترجم لديه الخبرة الأصلية إدارة الفريق، التواصل الجيد والتعاون بين الإدارات.

  • في العمق فهم حقل TMT، لديها نظرة فريدة في اتجاهات الصناعة؛

  • ممتازة القراءة والكتابة ومهارات الاتصال اللغة الإنجليزية،

  • مرونة قوية وقوة يحركها الذاتي التي يمكن أن تحفز الفريق في بيئة تنافسية للغاية.

  • تنظيم المشاريع وروح الفريق والمثابرة على استعداد لتحمل المشاق.

  • ويفضل العلوم والهندسة الخلفية، وهناك شركات معروفة أو معروفة تجربة هيئة الاعلام هو المفضل.

  • مسؤولية

    نيو جي الأنفس وحدها المسؤولة عن محتويات منصة التخطيط والإنتاج والعمليات، وجودة المحتوى، مستخدمين قراءة التجربة والنفوذ هي المسؤولة. مسؤولة خصيصا لكامل المواقع منصة محتوى والتخطيط، وإعداد وإدارة فريق التحرير، والتركيز على تنفيذ الموضوعات المخطط لها، وإنشاء وصيانة واضعي المساهمة في الموارد؛ رصد التغيرات في عدد من المؤشرات البيانات العامة، وهذا التحسن إلى تحسين نوعية على المحتوى.

    جي وون الناس new مرحبا بكم مع المثل العليا للحضور للمقابلة، والمزيد من التوظيف زيارة عدد جديد جي وون الجمهور

    وداعا، وشراء! وداعا، مشتق! الدولة طلقة الرسمي!

    لا بد لي من السفر، وليس بسبب المال

    ما: كل الإخفاقات هو أفضل التغذية، وكيف أنه من الصعب أن تلعب | جامعة بحيرة

    داخليا وخارجيا، ولكن ذلك، هارفارد H4 التحدث مع قوة!

    الوطنية 3K موجات الخارج! وهذه وجهات السفر في جنوب شرق آسيا لكمة كنت قد تم لعدد قليل؟

    "نيو جي فاز مقابلة مع" لي Feifei: من جامعة ستانفورد إلى سحابة جوجل، والسماح AI تكون روح الحوسبة

    قانسو Shiwei الاختيار النهائي، ملك الطهي لك أن تقرر!

    ما الدرس الأول: شعور الاتجاه من خلال رؤية، وليس الخلط من جانب البعثة التي قيم التضامن

    لا تحية سرا العودة إلى ديارهم ورؤية والدي ماذا فعل ...... نتيجة لذلك، ابتسم وابتسم وبدأ في البكاء

    مقابلة Tabuchi البناء | الشعلة PyTorch نسخة مطورة من المصدر المفتوح، بيثون أولا، تسريع GPU قوي

    كانت محشورة الإطارات، ولكن لم تسرب، ويمكن للسيارة مواصلة فتحه؟

    لماذا تفقد رهبة من عدم اليقين بشأن المستقبل، عصا لنفس النمط من التفكير؟