البضائع الجافة استراتيجية البحث عن وظيفة لمهندس تحليل البيانات الضخمة

مع صعود الإنترنت ، أصبح الذكاء الاصطناعي والبيانات الضخمة من المجالات الشائعة.بدأ المزيد والمزيد من الشركات في تقديم المشورة بشأن قرارات العمل من خلال استخراج البيانات وتحليلها.في السوق المحلية ، هناك عدد كبير من المواهب في الذكاء الاصطناعي والبيانات الضخمة. الفارق. ومع ذلك ، يحتاج محللو البيانات إلى مهارات تقنية أسهل لدخول الصناعة ، كما أن التحويل / الدراسة الذاتية فعال للغاية من حيث التكلفة ، مما يجعلهم مهنة شائعة في مجال البيانات الضخمة.

في الآونة الأخيرة ، في غرفة البث المهني الخامسة في معهد ليفنغ لأبحاث الذكاء الاصطناعي ، شارك مهندس الخوارزميات في Shanshu Technology Zhao Kezhen بحثًا عن وظيفة بعنوان "مسار اتخاذ القرار من مصنع كبير إلى شركة ناشئة" وقدم عرضًا تقديميًا للتوظيف. إعادة تشغيل عنوان URL لفيديو الفصل المفتوح:

Zhao Kezhen: مهندس خوارزمية في Shanshu Technology ، تخرج من كلية الهندسة المدنية والهندسة المعمارية بجامعة Tianjin ، وتخرج من كلية الهندسة بجامعة ستانفورد ، وأصبح مهندس خوارزمية من تخصصات الهندسة التقليدية والمجالات المتقاطعة. كان يعمل كمحلل بيانات في إحدى الشركات المصنعة المحلية الكبرى. تشارك Shanshu Technology في العمل المتعلق بالبيانات الضخمة.

مشاركة الموضوع: مشاركة الباحثين عن عمل لمهندسي تحليل البيانات الضخمة - طريق اتخاذ القرار من المصنع الكبير إلى بدء التشغيل

شارك المخطط التفصيلي:

1. تجربة شخصية ولماذا تختار Shanshu Technology.

2. المحتوى المهني لمهندس تحليل البيانات الضخمة.

3. أمثلة تطبيقية لتحليل البيانات الضخمة في السيناريوهات الصناعية.

4. اقتراحات الدراسة الذاتية لتحليل البيانات الضخمة / التنقيب.

5. محتوى التوظيف الخاص بشركة Shanshu Technology والقنوات الداخلية.

ينظم معهد Leifeng.com AI Research Institute مشاركة المحتوى على النحو التالي:

مرحبًا بالجميع ، ومرحبًا بكم في غرفة البث الاحترافية في معهد أبحاث الذكاء الاصطناعي. أنا ضيف مشاركة Zhao Kezhen. هذا المحتوى التشاركي مخصص أكثر للباحثين عن عمل الجدد في مكان العمل أو المهتمين بالانتقال إلى المناصب ذات الصلة بتحليل البيانات الضخمة في مختلف المجالات. تتضمن هذه المشاركة:

أولاً ، تقديم التجربة الشخصية لفترة وجيزة وسبب اختيار شركة Shanshu Technology ؛

ثانيًا ، قدِّم بإيجاز ما يفعله محللو البيانات الضخمة ، وما هي تصنيفاتهم في الصناعة ، وما هي المهارات المطلوبة في عملهم ، وما إلى ذلك ؛

ثالثًا ، استنادًا إلى تجربتي في Dachang و Shanshu Technology ، وبناءً على سيناريوهات صناعية محددة ، دع الجميع يفهم محتوى عمل محللي البيانات الضخمة ؛

رابعًا ، اجمع بين دراستي الخاصة والبحث عن وظيفة وخبرة العمل لتزويدك ببعض اقتراحات التعلم والموارد التي يحتاجها محللو البيانات الضخمة (بما في ذلك موارد الدورة عالية الجودة التي درستها في جامعة ستانفورد) ؛

خامسًا ، سوف أعرض بالتفصيل حالة الأعمال والشركة الخاصة بشركة Shanshu Technology ، وسأشرح احتياجات التوظيف لمهندسي الخوارزميات ، وأوفر قناة لنشر السير الذاتية.

التجربة الشخصية ولماذا تختار Shanshu Technology

أولاً ، قم بعمل مقدمة ذاتية بسيطة. لقد تخرجت بدرجة البكالوريوس من كلية الهندسة بجامعة تيانجين ، ودرست بشكل أساسي الهندسة الهيدروليكية لهندسة البناء ، والتي تشبه الهندسة المدنية. خلال المدرسة ، تعلمت الكثير من المعرفة المتعلقة بالميكانيكا والرياضيات ، وحصلت على درجة مزدوجة في التمويل من جامعة نانكاي ، ودرس بشكل أساسي النظريات الأساسية المتعلقة بالرياضيات والاقتصاد والتمويل. تخرجت من معهد ستانفورد للتكنولوجيا وتخصصت في ميكانيكا الموائع البيئية وهذا التخصص يتطلب معرفة الجبر الخطي ومهارات البرمجة. بالإضافة إلى ذلك ، نظرًا لأن طلاب الدراسات العليا يتبنون نظامًا مجانيًا لاختيار الدورات ، والذي لا يختلف كثيرًا عن الدورات الجامعية ، يمكن للطلاب اختيار دورات أخرى في الكلية. لذلك ، بعد الانتهاء من اعتمادات هذا التخصص ، أخذت أيضًا بعض الدورات الشائعة ، مثل دورة التعلم الآلي لـ Wu Enda CS229 ، عمق Li Feifei التعلم والتعرف على الصور CS231n.

لاحقًا ، أثناء الدراسة ، خطرت لي فكرة التوظيف عبر الصناعات. في ذلك الوقت ، نظرًا لأن معظم طلاب الدكتوراه في الصناعة يقومون بتصميم الذكاء الاصطناعي ، وأن العلاقة بين الدورات على مستوى الدراسات العليا والتنقيب في البيانات أكثر طبيعية ، بدأت في البحث عن دورات تدريبية متعلقة بالبيانات. خلال العطلة الصيفية لمعهد الأبحاث الأول ، عملت كمهندس تحليل بيانات في قسم تحليل البيانات الضخمة الذي تم إنشاؤه حديثًا في مقر شركة تصنيع محلية كبرى ، وحصلت على عرض الإرجاع بعد أكثر من شهرين. في الفصل الأول من الفصل الدراسي الثاني ، اتصلت بشركة Shanshu Technology ، وهي شركة ناشئة أسسها خريجو جامعة ستانفورد ، وحصلت على عرض للعودة إلى الصين للانضمام. أعمل حاليًا في Shanshu Technology كمهندس خوارزمية ، وأركز على التعلم الآلي.

بناءً على تجربتي الشخصية ، تجيب مشاركتي اليوم بشكل أساسي على ثلاثة أسئلة: لماذا اخترت الدخول في مجال البيانات الضخمة متعدد التخصصات؟ لماذا تختار العودة إلى البلاد للعمل؟ ما هو الفرق بين المصنع الكبير وبدء التشغيل؟ لماذا اخترت الشركة الناشئة؟ هذه المشكلات الثلاث هي أيضًا مشكلات أكثر أو أقل سيواجهها معظم الباحثين عن عمل.

الأول هو اختيار الاتجاه الوظيفي. بالمقارنة مع اتجاه تخصصي ، يتمتع مجال البيانات الضخمة بالعديد من المزايا الواضحة: فجوة المواهب كبيرة جدًا ، ومستوى الراتب النسبي مرتفع نسبيًا ، ومعدل النمو سريع نسبيًا.

منذ أن أصبح الإنترنت شائعًا ، قمنا بإنشاء كمية كبيرة من البيانات كل يوم ، وتم تطوير تقنية تخزين البيانات بشكل أكبر ، وبالتالي أصبحت القيمة الكامنة وراء البيانات الضخمة أكثر أهمية. في الواقع ، في مجال البنوك والتجارة الإلكترونية والمجالات الأخرى ، يحتوي تحليل البيانات بالفعل على بيئة مهنية كاملة ، ولكن تطوير تكنولوجيا المعلومات جلب المزيد من سيناريوهات التطبيق لتحليل البيانات ، وقد أدى التطور الحالي في مجال التجارة الإلكترونية وحده إلى تحقيق ذلك. تطبيقات البيانات مثل المشتريات والمبيعات والتخزين والنقل ، وحتى الصناعات التقليدية لها أيضًا متطلبات للتنقيب عن البيانات.في العقود القليلة القادمة ، لن ينخفض هذا الطلب ، وهناك فجوة كبيرة في توظيف البيانات الضخمة.

في الوقت الحالي ، للكليات والجامعات عدد قليل جدًا من النظراء في مجال تحليل البيانات الضخمة والذكاء الاصطناعي ، والعديد من المتخصصين هم من الكمبيوتر أو المالية أو الإحصاء. ومع ذلك ، هناك طلب كبير في سوق العمل ، وبالتالي فإن الأجور ترتفع أيضًا.

بالنسبة لمعدل النمو ، من ناحية أخرى ، يتم تحديث المشهد الصناعي الذي يواجه البيانات الضخمة وتوسيعه باستمرار. في الوقت الحاضر ، قد تكون صناعة التجارة الإلكترونية عبر الإنترنت أكثر شيوعًا ، وتحاول العديد من الصناعات التقليدية أيضًا استخدام البيانات الضخمة لتحسين اتخاذ القرار ؛ من ناحية أخرى ، تتقدم نظرية استخراج البيانات أيضًا مع الزمن.لذلك ، يحتاج الممارسون المرتبطون بخوارزميات التنقيب عن البيانات إلى الحفاظ على القدرة على النهوض بالمشروع في الممارسة العملية والاستمرار في تنفيذ التعلم النظري. يتمتع هؤلاء الممارسون بمعدل مرتفع من الإزالة والضغط ، لكنهم أيضًا ينموون بسرعة.

السؤال الثاني لماذا عدت إلى الصين. أحد الأسباب هو الاختيار الذي تم اتخاذه وفقًا لحالة المرء. لن أقول الكثير هنا. الاختلافات بين الصين والولايات المتحدة في صناعة البيانات الضخمة.

كدولة متطورة ، فإن الولايات المتحدة قد نضجت عمليات جمع البيانات وإدارتها وتحليلها في العديد من سيناريوهات التطبيق. بالإضافة إلى التقدم البحثي التكنولوجي المتطور ، من منظور التطبيق الصناعي ، لا تختلف الصين والولايات المتحدة بشكل عام ، وحتى الصين لديها مساحة تطوير أوسع في المستقبل ، ولكنها تشمل بعض الصناعات التقليدية أو الصناعات الجديدة مثل التجارة الإلكترونية والخدمات اللوجستية. لا يزال المستوى العام لتطبيق البيانات الضخمة بطيئًا نسبيًا.

ستوفر مساحة التطوير في الصين في مجال البيانات للجميع المزيد من الفرص ، لذا فهي في الواقع خيار جيد للغاية للتألق في صناعة البيانات الضخمة. سيصبح الأشخاص الذين يدخلون هذه الصناعة الآن ، إلى حد ما ، الدفعة الأولى من المواهب للاتصال وحل المشكلات في الصناعة.

السؤال الثالث هو ما الفرق بين الشركات الناشئة والشركات الكبيرة. في الواقع ، كلاهما لهما مزاياهما الخاصة. تتمتع الشركات الكبيرة بمزايا الاستقرار ، والأنظمة الواضحة ، والتعرض العميق لمستويات الأعمال ، والزراعة العميقة في التقسيمات الفرعية ، وقنوات الترويج الواضحة. تتمثل مزايا الشركات الناشئة في: الإدارة المسطحة ، والهيمنة ، والتعرض المكثف للمشاريع ، والاتصال المباشر بالعملاء ، و يمكن أن يشتغل في مجالات مختلفة من الصناعة ، مع منحنى نمو حاد.

من حيث العيوب ، قد تواجه الشركات الكبيرة مشاكل مثل الرؤية الضيقة ، وصعوبة الترقية دون تغيير الوظائف ، ومحتوى وطريقة العمل الثابتة ، والتحول إلى "لولب". الشركات الناشئة غير مستقرة نسبيًا ، وستؤثر موثوقية الفريق على إمكانية ضمان المزايا المذكورة أعلاه.

أنا شخصياً أفضل أن أذهب إلى الأقسام الرئيسية التي تم إنشاؤها للتو من قبل الشركات الناشئة أو المصانع الكبيرة ، لأن كلاهما له خاصية مميزة ، أي أنه يمكن أن يتعرض لعدد كبير من الوظائف والمشاريع ، بدلاً من أن يكون "براغي" في بعض المناطق المقسمة. في رأيي ، الشيء الأكثر أهمية في المرحلة المبكرة من دخول الصناعة هو رؤية الصناعة فقط من خلال رؤية الصورة الكبيرة يمكننا اتخاذ الخيار الأفضل في مجال الزراعة العميقة. لذلك ، كانت وظيفتي الرسمية الأولى شركة ناشئة. بالإضافة إلى ذلك ، يتمتع قسم البيانات الضخمة في أحد المصانع الكبرى التي مارستها بنفس المزايا ، فقد تم إنشاؤه للتو ويمكن ربطه بسرعة بمستوى الأعمال ، كما أن إدارته الداخلية مسطحة أيضًا ، مما قد يمنحني العديد من الفرص لممارسة الرياضة.

تشمل الأسباب الأخرى العمل الجماعي وفرص النمو. التقيت بالسيد Wang Zizhuo ، كبير التكنولوجيا في Shanshu Technology عن طريق الصدفة في Silicon Valley ، وقررت الانضمام إلى فريق Shanshu. نظرًا لأن Shanshu Technology لا تزال في مرحلة النمو ، فإنها يمكن أن تعرضني لعدد كبير من المشاريع ، وكل مشروع هو حل صناعي أو صناعي. بالإضافة إلى ذلك ، بالإضافة إلى الفريق المؤسس الذي يتمتع بقدرات بحثية ونظرية قوية جدًا ، فإن Shanshu Technology لديها مجموعة من كبار العلماء في الصناعة ، وهي موارد فائقة الجودة في الصناعة. لذلك ، بالنسبة للأفراد ، لا يعني عمل Shanshu Technology العمل مع هؤلاء العلماء البارزين فحسب ، بل يعني أيضًا العمل مع عدد كبير من المشاريع.

Shanshu Technology هي شركة استشارية تعتمد على البيانات الضخمة. وعملائها الرئيسيون هم الشركات الكبيرة والمتوسطة الحجم في الصناعة الصينية.يمكن أن تساعد حلول الحوسبة والصناعة المتطورة التي تعتمد على البيانات الكبيرة الشركات على تحسين مهارات اتخاذ القرار لديها.

السبب في أن آفاق Shanshu Technology جيدة جدًا هو أنه ، من ناحية ، بدأ المزيد والمزيد من الشركات الصناعية في الاهتمام بالبيانات في البيئة العامة ، ولكن قد لا يكون لديهم أموال كافية لجمع فرق البيانات مثل BAT ، وحتى BAT على نطاق واسع تحتاج الشركات أيضًا إلى الانخراط في خدمات الاستعانة بمصادر خارجية لقضايا معقدة محددة وغير طبيعية ، والتي تمثل أيضًا قيمة Shanshu Technology. من ناحية أخرى ، فإن الفريق المؤسس لشركة Shanshu Technology هم جميعًا مواهب ذات تعليم عالٍ في جامعة ستانفورد ، ومجهزة بخبرة صناعية وأكاديمية ثرية ، ولديهم قوة تقنية قوية وقوة بحثية نظرية متطورة. لقد عملوا مع Google و IBM و Boeing والولايات المتحدة. تحل وزارة الطاقة وشبكة الكهرباء الصينية ومؤسسات أخرى مشكلة تحسين اتخاذ القرارات التشغيلية.

محتوى احترافي لمهندس تحليل البيانات الضخمة

اسمحوا لي أن أتحدث عن المحتوى الوظيفي لمحللي البيانات الضخمة ، ومتطلبات عمل الشركة ومسارات التطوير الوظيفي.

إن مفهوم تحليل البيانات ليس مألوفًا للجميع ، فهو في الأساس استكشاف خصائص بعض مصادر البيانات ، أو استخلاص النتائج المقابلة أو تتبع أسباب بعض الظواهر التجارية. يختلف تحليل البيانات الضخمة عن تحليل البيانات التقليدي ، حيث لا يعتمد فقط على إحصائيات البيانات الخاصة به ، ولكن في بعض الأحيان يحتاج أيضًا إلى مراعاة بعض العوامل الخارجية لجمع وتنظيم ودمج مصادر البيانات الأخرى المطلوبة ، وحجم البيانات كبير نسبيًا. تحتاج إلى إتقان بعض الخوارزميات والأدوات المتوازية العاملة ، لا تقتصر على التحليل الإحصائي.

ومع ذلك ، بناءً على تجربتي ، لا يزال معظم محتوى العمل النهائي لمحلل البيانات يعتمد على بعض النظريات الإحصائية الشائعة الاستخدام وطرق تحليل البيانات التقليدية ، ولكن قبل هذه الخطوة ، يتم ترتيب الكثير من مجموعات البيانات الكبيرة ودمجها وحسابها. تتطلب العمليات ، وهذه العمليات بعض المهارات والنظريات الجديدة.

من بُعد واحد ، يحتوي تحليل البيانات الضخمة الحالي على اتجاهين عامين:

واحد هو اتجاه العمل ، يتطلب هذا الاتجاه من الممارسين أن يكون لديهم فهم أعمق للأعمال ، ومعرفة نظرية قوية نسبيًا بالإحصاءات ، ليكونوا قادرين على القيام بمعالجة بسيطة لمجموعات البيانات الكبيرة ، ومن ثم الحصول على الأبعاد المطلوبة للبيانات ، وأهم قدرة هي ، لتكون قادرًا على تحديد المشكلات والتوصل إلى استنتاجات بناءً على متطلبات السوق التجاري والأعمال. بشكل عام ، كلما قل عدد مصادر البيانات الخارجية المطلوبة للعمل ، كلما كان المنطق المادي أبسط في المرحلة المبكرة وكان أقرب إلى تحليل الأعمال التقليدي.

على سبيل المثال ، بعد الحصول على جميع الطلبات من قسم معين لشركة معينة في هذا الربع ، تحتاج إلى إجراء إحصائيات حول مصدر الطلب حسب المنطقة والفترة الزمنية ، ثم إخراج النتائج ومراقبة التشوهات وتحديد المصدر واقتراح الحلول بناءً على أداء البيانات. هذه العملية برمتها هي تحليل الأعمال. عندما تصل كمية البيانات إلى مقياس معين ولا توجد طريقة لتحليلها مباشرةً باستخدام أدوات مثل Excel ، فمن الضروري استخدام بعض الأنظمة الأساسية للبيانات الضخمة للمعالجة المسبقة للبيانات وحسابها مسبقًا. على سبيل المثال ، يتم توسيع البعد ليشمل جميع طلبات المؤسسة بأكملها في ربع معين. من بينها ، عندما نقوم بتحليل مخرجات النتائج بأبعاد متعددة مثل نوع المنتج ونوع العميل وما إلى ذلك ، فإن ما ينطوي عليه الأمر هو محتوى العمل لبعض محللي البيانات الضخمة المبتدئين.حتى هذه الخطوة ، يتم دمج تحليل البيانات ذات الصلة مع الأعمال. قريب جدا.

في الوقت الحالي ، يتمثل محتوى العمل الأساسي لمحللي البيانات الضخمة في العديد من المجالات في استخدام SQL والأدوات الأخرى لفرز البيانات واستردادها على النظام الأساسي للبيانات الضخمة ، وإجراء بعض الحسابات الأولية ، ثم استخدام Excel للتحليل والتشغيل. ومع ذلك ، في سيناريوهات مختلفة ، سيكون لهذا الموقف اتجاهات تطوير مختلفة: أولئك الذين يقومون بمنتجات البيانات يحتاجون إلى بعض التحكم في الطلب وقدرات إدارة المشروع ؛ أولئك الذين يقومون بدعم اتخاذ القرار يحتاجون إلى بعض حساسية الأعمال - في بعض الأعمال قبل الإطلاق ، من الضروري أن تكون قادرًا على استخدام الأبعاد المختلفة لبيانات السوق لتحليلها لتحديد ما إذا كان سيتم إطلاق عمل معين ، وما هي الخطط الموجودة ، والخطط التي يمكنها تعظيم الأرباح وتقليل المخاطر ، وما إلى ذلك ؛ يقوم البعض بعمليات البيانات ، بما في ذلك العملاء يجب أن تجمع العمليات وعمليات نمو المنتج ، وما إلى ذلك ، بعض البيانات التاريخية وقوانين البيانات للعثور على نقاط النمو وتنفيذ البيانات وتكرارها.

يمكننا أن نرى من محتوى العمل هذا أنه في الواقع ، يمكن لمحللي البيانات الضخمة الذين يميلون إلى العمل أن يكون لديهم اتجاهات تطوير متعددة جنبًا إلى جنب مع السوق أو المنتجات أو العمليات.يمكنهم الالتزام بأجزاء الأعمال والعمليات والمنتجات التي تتكامل بشكل وثيق مع السوق. استمر في النمو ، حتى دخول مستوى صنع القرار ، يكون الاحتمال مشرقًا للغاية.

متطلبات الوظيفة لمحلل البيانات الضخمة الموجه للأعمال ليست عالية جدًا من حيث المهارات. تعلم بشكل أساسي استخدام SQL لجلب الأرقام ، واستخدام النظام الأساسي للبيانات الضخمة لمعالجة بعض البيانات ، واستخدام عمليات Excel المتطورة لتحليل البيانات ، وكتابة التقارير ، ولديك تقنيات التصور الأساسية ، يمكنك محاولة العثور على عمل في هذا المجال. بالإضافة إلى ذلك ، تكمن الكفاءة الأساسية لهذا المنصب في حساسية عملك وعمق فهمك للأعمال ، وهذه هي القوة الناعمة التي يجب تجميعها في العمل الفعلي.

والآخر تقني ، أساسه لا يزال تحليل البيانات ، لكن تركيز العمل قد تغير. بالإضافة إلى مراقبة البيانات ، وقفل الاستثناءات ، وإيجاد الأسباب ، والمهام الأخرى ، يواجه محللو البيانات الضخمة في اتجاه التنقيب في البيانات مستوى إضافيًا من الطلب - وهو حل معين. على سبيل المثال ، إذا كان أحد مواقع الويب يريد زيادة أرباح الإعلانات إلى أقصى حد ، فيجب عليك التفكير في كيفية اعتماد خطة موضع مناسبة وخطة فرض رسوم وفقًا لتوزيع حركة المرور على موقع الويب ، أو حتى تحديد موضع مستهدف لعملاء مختلفين. وهذا يتضمن بعض مشكلات التوصية. يجب أن تأخذ مجموعة من نموذج التسليم المعقول ، لأعلى ، في الاعتبار تعظيم ربح خطة الإعلان ، ويجب أن ينظر إلى أسفل في التوصية بالإعلانات للعملاء لزيادة حركة المرور الحقيقية إلى أقصى حد ، وهذه السلسلة من المنطق ، لا تعتمد فقط على كمية كبيرة من جمع البيانات لتحليل الاستنتاجات ، اقترح أيضًا حلولًا تستند إلى منطق الأعمال ونظرية الخوارزمية والافتراضات القائمة على الخبرة - في الواقع ، في هذه المرحلة ، تقدم محللو البيانات الضخمة إلى مهندسي وعلماء البيانات الضخمة. في الوقت نفسه ، سيتم استخدام بعض خوارزميات التنقيب عن البيانات القائمة على أدوات البيانات الضخمة ، وخوارزميات الآلة التقليدية ، وحتى معرفة خوارزمية التعلم العميق في هذه العملية. بالمعنى الدقيق للكلمة ، هذه بالفعل وظيفة مهندس خوارزمية.

ومع ذلك ، في الواقع ، في العديد من سيناريوهات التطبيقات ، لا يحتاج محللو البيانات الضخمة إلى حل مشكلات مثل الأنظمة والفئات الضخمة مثل التوصية والتعريف ، ولكنهم يحتاجون فقط إلى إنشاء نماذج تعلم آلي بسيطة لبعض المشكلات الصغيرة في سيناريوهات عمل محددة. مثل الانحدار العشوائي ، المصنف اللوجستي ، إلخ. خذ سيناريو تطبيق صغير كمثال. بعد تقديم بيانات العميل ، يحتاج المصنف إلى التدريب لتحديد العملاء الذين يميلون إلى فئة فرعية معينة من المنتجات إلى أقصى حد ، وذلك لفحص هذا العميل وتقديم الخدمات المستهدفة. . هذه مشكلة تصنيف بسيطة نسبيًا ، ويجب استخدام طرق مختلفة للنمذجة وفقًا لمواقف مختلفة.

باختصار ، يحتاج محللو البيانات الضخمة الذين يفضلون التكنولوجيا ، سواء كانوا يستخدمون أساليب التعلم الآلي التقليدية أو أساليب التعلم العميق ، إلى اعتماد خوارزميات معينة لاستخراج البيانات لمحاولة بناء نماذج لحل المشكلات وتكرارها وتحديث البيانات وضبط المعلمات باستمرار. مجموعة كاملة من العمليات هي منطق العمل لمعظم عمال التنقيب عن البيانات.

يتم أيضًا تقسيم العديد من اتجاهات التطوير المختلفة في هذا الاتجاه ، مثل التسعير والتوصية والتعرف على الكلام و NLP وما إلى ذلك ، ولكن هذا الاتجاه يتطلب أساسًا قويًا للرياضيات والجبر الخطي ونظرية خوارزمية الكمبيوتر بسبب العتبة العالية نسبيًا. القدرة على الكود. بالإضافة إلى ذلك ، لا تزال خوارزميات التعلم الآلي والتعلم العميق قيد التحديث. بشكل أساسي ، ستظهر خوارزميات جديدة مع تحديث الأوراق. لذلك ، يتطلب هذا الجانب من الجميع مواصلة التعلم ، ومواصلة قراءة الأوراق ، وتحديث المعرفة الشخصية في أي وقت.

في الصناعة ، يتطور الأشخاص الذين يميلون أكثر إلى الناحية الفنية بشكل عام على غرار الخبراء التقنيين وعلماء البيانات ، أو يجمعون بين الصناعة والأوساط الأكاديمية لتنفيذ ابتكارات الخوارزمية بعد تراكم الخبرة. بالنسبة للباحثين عن عمل الذين يرغبون في التطوير المهني في هذا المجال ، أقترح عليك أولاً إدخال بعض وظائف تحليل البيانات الضخمة ذات المهارات المنخفضة ، وتجميع بعض قدرات معالجة المشكلات في الصناعة ، ثم العمل بجد للاقتراب من استخراج البيانات في مجالات محددة من خلال الدراسات المتقدمة .

في الوقت الحالي ، تتركز صناعات محللي البيانات الضخمة وعمال مناجم البيانات بشكل أساسي في مجالات الشؤون المالية والحكومية حيث يكون جمع البيانات وإدارتها ناضجًا ومنهجيًا نسبيًا. ومن بينها ، سيكون محللو البيانات الضخمة في الصناعة المالية كميًا نسبيًا ويركزون على تحليل الأعمال. يتطلب درجة عالية من المعرفة النظرية المالية. ومع ذلك ، قد تكون شركات الإنترنت هي الصناعة التي لديها أكبر فجوة في مواهب البيانات الضخمة في المستقبل. على سبيل المثال ، يجب تحقيق تحسين الإدارة الذكية واتخاذ القرار لسلسلة كاملة من التجارة الإلكترونية والصناعات اللوجستية بناءً على خوارزميات معينة للبيانات الضخمة ؛ وغالبًا ما يعتمد مجال الشؤون الحكومية على منصة الإنترنت +. واعتماد بعض أساليب الاستعانة بمصادر خارجية لتحقيق الإدارة الذكية. بالإضافة إلى ذلك ، ستحصل شركات الإنترنت القائمة على المعلومات مثل Toutiao أيضًا على وظائف شائعة تتعلق بتحليل البيانات الضخمة مثل توصيات الإعلانات ونمو المستخدمين.

باستثناء الشركات الناضجة التي تحمل معلومات الإنترنت عبر الهاتف المحمول ، تتركز طلبات الشركات الصناعية لتطبيقات البيانات الضخمة بشكل أساسي في العديد من المجالات الفرعية مثل تحسين التخزين والتحكم في التكاليف والتنبؤ الكمي. تولي الشركات التي لديها بيانات ضخمة أكثر نضجًا مزيدًا من الاهتمام لإنشاء نماذج مصقولة في مجال الزراعة العميقة ، مثل خوارزمية التوصية التي ذكرناها سابقًا ، ولكن بالنسبة للشركات ذات البيانات الضخمة التي بدأت في التبلور والشركات التقليدية ، فهي تعتمد على التحكم في التكلفة والربح يعد مخطط التحسين العالمي للخوارزمية البسيطة المحسنة أكثر أهمية.

هناك أيضًا اختلافات بين تحليل البيانات وعلوم البيانات. في الأساس ، هناك ثلاث مكدسات تقنية لتحليل البيانات: معالجة قاعدة البيانات ، معالجة النصوص التفصيلية (بعض الشركات لديها متطلبات معينة لهذه المهارة) ، تحليل الأبعاد + التصور. يعتمد علم البيانات على مهارات تحليل البيانات ، مما يتطلب مهارات برمجة قوية نسبيًا ومهارات رياضية ومهارات خوارزمية ، والعتبة مرتفعة نسبيًا.

أمثلة تطبيق سيناريوهات صناعية لتحليل البيانات الضخمة

اسمحوا لي أن أقدم لكم مثالًا موجزًا لتقديم عملي المتعلق بتحليل البيانات الضخمة في الصناعة. نظرًا لأن معظم وظائف تحليل البيانات تتطلب أيضًا بعض مهارات النمذجة الأساسية ، فأنا ببساطة أقوم بتصنيف العمل المتعلق بتحليل البيانات إلى ثلاثة سيناريوهات رئيسية:

الأول هو مراقبة البيانات. هذا النوع من السيناريوهات هو أساسًا منطق الوصول الثابت ، فهو يحتاج فقط إلى استخراج البيانات الوصفية من قاعدة البيانات وفقًا لاحتياجات سوق العمل أو نموذج البيانات ، ثم معالجة نتيجة المخرجات من خلال عمليات الدمج المنطقي والعمليات. تتميز مراقبة البيانات بخصائص التكرار. فهي تحتاج إلى إنشاء بيانات ذات عيار ثابت بشكل دوري ومراقبة توزيع البيانات على مدى فترة زمنية ، وقفل البيانات غير الطبيعية ، وعندما يتم العثور على تشوهات ، من الضروري التشخيص في قاعدة البيانات جنبًا إلى جنب مع العمل ، وأخيراً إنشاء تقرير تحليل . عادةً ما أستخدم SQL للوصول إلى الأرقام وإحصائيات Excel وأخيراً أقوم بإجراء PPT للإبلاغ.

الثاني هو تحليل البيانات. هذا السيناريو مشابه لرصد البيانات ، والفرق هو أنه ليس منطق الوصول الثابت ، والذي قد يتضمن وصولاً متعددًا وطرق تحليل مختلفة ، لأن هدفه النهائي هو العثور على أسباب واستنتاجات بعض الظواهر على مستوى البيانات. قبل التحليل ، يصعب علينا تحديد البعد مباشرة مما يتسبب في تأثير معين من بيانات مئات أو آلاف الأبعاد الصناعية. بالإضافة إلى ذلك ، فإن العرض التقديمي النهائي لهذا المشهد هو أيضًا تقرير ، والذي يتطلب بعض المعرفة الأمامية وبرامج التصور المريحة.

الثالث هو نمذجة البيانات. يجب أن يعتمد هذا السيناريو على التحليل ومخططات النماذج المجردة وفقًا لمتطلبات العمل واستكشاف مجموعات البيانات والنموذج لاستكمال المتطلبات المقابلة.

بالإضافة إلى هذه السيناريوهات الثلاثة ، هناك بعض السيناريوهات الأخرى.لا تنتمي إلى منصب محللي البيانات الضخمة ، ولكنها تحتاج إلى الاعتماد بشكل وثيق على الأعمال المتعلقة بالبيانات الضخمة ، مثل التسعير الصناعي ، والتنبؤ بالمبيعات الصناعية ، وإدارة المستودعات ، وتحسين سلسلة التوريد ، إلخ. يحتاج الجميع إلى الجمع بين أبحاث العمليات ومعرفة الخوارزمية الأخرى لاستخراج البيانات والنمذجة والتحسين.

فيما يلي حالة عمل محددة خاصة بي لإعلام الجميع بالتطبيق المحدد لهذه السيناريوهات الثلاثة في العمل الفعلي. هذا رابط فرعي ضمن مشروع تسعير قامت به شركتنا:

(للحصول على شرح حالة العمل المحددة لمشروع التسعير هذا ، يرجى الرجوع إلى الفيديو الساعة 00:26:30 ، )

اقتراحات الدراسة الذاتية لتحليل البيانات الضخمة / التنقيب

لتحليل البيانات الضخمة والدراسة الذاتية الأولية لاستخراج البيانات ، سأقدم بعض الاقتراحات وأزودك ببعض المعلومات.

اليوم ، المهارات المطلوبة لوظيفة تحليل البيانات الضخمة تشمل:

الأول هو مهارات الحصول على البيانات ، والبيانات التي يجب معالجتها / أي أبعاد / كيفية تحديد لتحليلها وغيرها من القضايا.تتطلب معظم الشركات استخدام SQL + R / Python وغيرها من البرامج للمعالجة المسبقة.

ثانيًا ، تتطلب مهارات معالجة البيانات أدوات إتقان مثل R / Python ، والتي يمكن أن تساعدك في إجراء تنظيف البيانات بشكل أكثر مرونة. ومع ذلك ، بالنسبة للبيانات التي تحتوي على كمية صغيرة نسبيًا من البيانات ، يمكنك استخدام Excel مباشرةً لمعالجتها ، الأمر الذي يتطلب منك إتقان مهارات Excel المتطورة.

والثالث هو مهارات تحليل البيانات ، ومن بينها المهارات اللينة التي تشمل الفطنة التجارية وفهم الأعمال والمعرفة الإحصائية.

الرابعة ، مهارات عرض البيانات ، تتطلب من كل شخص أن يكون لديه تصور ممتاز ومهارات تعبير جيدة.

التكوين القياسي هو SQL + Excel. يمكن أن يساعدك الاعتماد على هذه القدرات بشكل أساسي في العثور على بعض الوظائف أو فرص التدريب.

بالنسبة لـ SQL ، أقترح عليك الانتقال إلى البرنامج التعليمي للمبتدئين للتعلم ، بشكل أساسي لإتقان القواعد التطبيقية البسيطة نسبيًا ، ويمكنك التعلم أثناء التشغيل ، وإذا كنت لا تفهم ، فيجب أن تتعلم استخدام محركات البحث للاستعلام. بالإضافة إلى ذلك ، أقترح الذهاب مباشرة إلى موقع Leecode الإلكتروني ومراجعة أسئلة بنية البيانات ، سيكون للموقع حلول مختلفة بالترتيب من السهل إلى الصعب ، يمكنك تجربة طرق مختلفة لحل المشكلة. يمكن لإتقان SQL التعامل بشكل أساسي مع مهام الوصول إلى البيانات في الصناعة.

فيما يتعلق ببرنامج Excel ، لا يمكن للعمليات الأساسية تلبية المتطلبات. فهي تتطلب على الأقل استخدامًا بارعًا للأدوات الإحصائية الشائعة الاستخدام ، مثل معالجة بيانات الجدول البسيطة ، والاستعلام ، والفرز ، وما إلى ذلك ، والوظائف المتقدمة مثل vlookup ، والصيغ الرقمية المرجعية متعددة الأبعاد ، والمخططات المرئية (تحتاج إلى إتقان عرض المخطط ، والتجميل ، المخططات المتقدمة والمكونات الإضافية للرموز وما إلى ذلك) ومنظورات البيانات شائعة الاستخدام. بالإضافة إلى ذلك ، تتضمن بعض عمليات معالجة البيانات أيضًا تطوير VBA. إذا كنت مهتمًا بهذا الجانب ، يمكنك أيضًا التعلم بنفسك.

إذا كنت تتقن الأدوات الثلاث لـ SQL + Excel + PPT ، فيمكنك بشكل أساسي محاولة العثور على وظائف متعلقة بالبيانات الضخمة ، وبعد ذلك يمكنك تحديد اتجاه تحسين المهارات الخاصة بك وفقًا لاتجاه التطوير الشخصي واحتياجات الوظيفة.

بالإضافة إلى ذلك ، بالنسبة للطلاب الذين يرغبون في تعلم بعض لغات البرمجة النصية ، أوصي باستخدام Python. هذا البرنامج أسهل في الاستخدام وسهل البدء. يمكنك الانتقال إلى موقع Liao Xuefeng الرسمي للتعرف على طرق بناء جملة Python الأساسية وتخزين البيانات. للتعرف على معالجة البيانات ، يمكنك قراءة دليل الباندا مباشرة ( - بدءًا من الصفحة 500 ، فهو يقدم بشكل أساسي إرشادات بناء الجملة الشائعة. يتم عمل معالجة البيانات الحالية بشكل عام باستخدام أوامر SQL + pandas.

إذا كنت بحاجة إلى إتقان المعالجة المنظمة ، فيمكنك التعرف على حزمة البيانات غير المعقدة واستخدامها في عملك. في التعلم الآلي والتعلم العميق ، هناك العديد من التطبيقات لحزمة البيانات هذه.

يتطلب التنقيب عن البيانات استنادًا إلى تحليل البيانات أن يكون لدى الطلاب أنفسهم أساس جيد في الجبر الخطي ، والتعرف على التعلم الآلي والتعلم العميق. فيما يتعلق بنظرية التعلم الآلي التقليدية ، فإن الدورة التدريبية الكاملة نسبيًا هي CS229 الخاصة بـ Wu Enda. وتشارك مشاكل التصنيف والانحدار الشائعة في الصناعة ، مثل الفصل العشوائي و Bayes الساذج. يغطي CS229 ذلك أساسًا ، ولكن هذا المنهج نظري إلى حد ما ، لذا فإن متطلبات النظرية الرياضية عالية جدًا. قد تصادف العديد من "الأمراض الصعبة والمتنوعة" في عملك لاحقًا ، يمكنك قراءة المقالات ذات الصلة أو المدونات الفنية (ابحث عن الحلول والأفكار المقابلة). من بين الدورات التدريبية الأكثر عملية ، أوصي بدورة Stanford CS246 ، بما في ذلك بعض خوارزميات التوصية البسيطة القائمة على منصة Spark والتجميع المباشر والممارسات والدورات التدريبية الأخرى التي تتكامل بشكل وثيق مع الصناعة.

بالإضافة إلى ذلك ، بالنسبة لبعض الدورات التدريبية النظرية في التقسيم الفرعي لاستخراج البيانات ، قمت بإرفاق ورقة صفراء مشهورة بالمعلومات ( للرجوع إليها.

يمكن القول بأن إتقان هذه النظريات يعد إعدادًا مناسبًا نسبيًا. وتجدر الإشارة إلى أن الاختلاف الكبير بين العالم الصناعي والعالم الأكاديمي هو أن البيانات الصناعية في الصناعة "قذرة" للغاية ، فعندما نواجه العديد من المشكلات الصعبة ، لا يمكننا الحصول على البيانات المثالية للتدريب النموذجي ، مثل التصنيف. المشكلات الشائعة مثل عدم توازن التصنيف في الصناعة ، الأمر الذي يتطلب منا تجربة خوارزميات مختلفة وفهم التطبيقات الصناعية جنبًا إلى جنب مع السيناريوهات الصناعية لإيجاد حلول مناسبة. بالإضافة إلى ذلك ، سيختلف محتوى العمل المحدد لمواقف تحليل البيانات في الشركات المختلفة. لذلك ، أعتقد أن الخبرة في المجال والقدرة على التعلم والفهم أمران مهمان للغاية.

محتوى التوظيف في Shanshu Technology والقنوات الداخلية

بعد ذلك ، سأقدم Shanshu Technology وأخبرك باحتياجات التوظيف لبعض الوظائف.

تأسست Shanshu Technology في يوليو 2016 ، ومقرها في منطقة Dongcheng ، بكين ، ولديها شركة فرعية في Shanghai Yangpu District-Shanghai Shanshu Network Technology Co.، Ltd. في أغسطس من نفس العام الذي تم فيه تأسيسها ، تلقت Shanshu Technology استثمارًا مشتركًا من Zhen Fund و Northern Light Venture Capital. وصل التمويل المستدير من الملاك إلى 2.1 مليون دولار أمريكي ، مسجلاً ارتفاعًا جديدًا في مجال البيانات الضخمة في الصين في عام 2016. في يوليو 2017 ، أكملت شركة Shanshu Technology جولة تمويل بلغت حوالي 40 مليون يوان ، وقادت شركة Pagoda Investment الاستثمار ، وتابعت شركة Jiangmen Ventures و Lenovo Ventures.

شارك في تأسيس الشركة خمسة أساتذة من جامعة ستانفورد ودكتوراه. وهي تجمع فريقًا من العلماء من الدرجة الأولى في الداخل والخارج. والهدف هو استخدام تقنية اتخاذ قرارات الذكاء الاصطناعي الممتازة لتمكين كل شركة صينية من امتلاك القدرة على تخصيص وتحسين عملية صنع القرار ، ودمجها من خلال الابتكار تخدم بعض تقنيات التعلم الآلي والتعلم العميق ، بالإضافة إلى تقنيات تحسين أبحاث العمليات ، المؤسسات. يشمل الشركاء الحاليون شركات عملاقة في صناعات مختلفة مثل JD.com و SF Express و Debon و Wanda و Didi و Yonghui.

فيما يلي بعض المؤسسين الأوائل لشركتنا:

منذ إنشائها ، فازت Shanshu Technology أيضًا بالعشرات من الجوائز ، الكبيرة والصغيرة ، مثل "National High-tech Enterprise" و "Zhongguancun Technology Enterprise" و Dark Horse New Retail Top 50. مقارنة بشركات الاستشارات التقليدية ، تتمتع شركتنا ببعض المزايا: تقنية حلول التحسين القوية ، وقدرات الخدمة ذات الحلقة المغلقة من البيانات إلى اتخاذ القرار ، وفريق العلماء الأعلى لصنع القرار بشأن البيانات ، إلخ. بالإضافة إلى ذلك ، لدينا الكثير من الخبرة في التعاون مع الشركات الكبيرة ، وما زلنا نحافظ على تعاون متعمق مع الشركات الكبيرة.

تشمل مشاريع أعمالنا تقديم سلسلة من الحلول مثل التنبؤ الذكي وتحسين المخزون وأتمتة التخزين وإدارة الإيرادات واختيار الموقع الذكي للتجارة الإلكترونية وتجارة التجزئة وغيرها من الصناعات.

من بينها ، سأقدم الحالات الناجحة لـ Shanshu Technology ، مثل الاختيار الذكي للموقع وإدارة المستودعات. أثناء تنفيذ هذه المشاريع ، يمكننا أيضًا معرفة المواهب التي تحتاجها Shanshu Technology.

الحالة 1: الاختيار الذكي للموقع. من بين المشاريع ذات الصلة في صناعة البيع بالتجزئة ، قمنا بتنفيذ مشروع موقع المتجر. في اختيار الموقع التقليدي ، يتم تحديد المنطقة المستهدفة تقريبًا بناءً على خبرة الصناعة ، ويتم إرسال الموظفين لإجراء زيارات ميدانية والتأكيد النهائي. في هذا المشروع ، قلبنا طريقة اختيار الموقع التقليدية وحولنا مشكلة اختيار الموقع إلى مشكلة تحسين. والغرض الرئيسي من هذه المشكلة هو زيادة الإيرادات وإجراء تسويق للعلامة التجارية وزيادة التغطية السكانية والراحة.

فيما يتعلق بالإيرادات ، نظرًا لبيانات التدفق لعدد كبير من المتاجر ، جنبًا إلى جنب مع خبرة عمل معينة ، فقد استكشفنا العديد من الخصائص الرئيسية المتعلقة بإيرادات المتجر (الميزات المشتركة على نطاق واسع ، مثل التغطية السكانية ، والمسافة إلى أقرب محطة مترو أنفاق ، وما إلى ذلك) و ميزات صغيرة (ميزات أكثر تفصيلاً ، بما في ذلك ارتفاع درجات المتجر ، وما إذا كان هناك درابزين أمام الباب ، وما إلى ذلك). بعد تحديد الميزات ، تم اعتماد مجموعة متنوعة من النماذج التنبؤية ، مما يجعل دقة الإيرادات الشهرية تزيد عن 90. فيما يتعلق بالتغطية ، نضع الخصائص الرئيسية لشنغهاي في كل شبكة ، ونجد الوظيفة المثلى للإيرادات العالمية وتغطية السكان كهدف اختيار الموقع. بعد الحصول على الشبكة المثلى من خلال برمجة عدد صحيح ، ندمج المجال مع أفراد الأعمال. تحقق ، وابحث عن العنوان الذي يلبي الخصائص الصغيرة لأعلى عائد ، وحدده. في هذه العملية ، يُطلب من محللي البيانات الحصول على فهم أعمق للأعمال.

من بينها ، فيما يتعلق بتأثير ميزات المتجر على الإيرادات ، نقوم بتجريد مشكلات العالم الحقيقي في نموذج ، واستخدام الأهداف والقيود والأساليب المتعلقة بالتنبؤ بالتعلم الآلي. يتطلب ذلك من محللي البيانات الضخمة أن يكون لديهم بحث قوي عن البيانات ، وقدرات معالجة ، وتفكير منطقي ، وإمكانيات وصول ، ونمذجة.

الحالة 2: إدارة المستودعات الذكية. في هذا المشروع ، نحلل مشكلة التخزين بأكملها إلى العديد من المشاكل الفرعية ، ونقسمها إلى مشاكل التجديد ، ومشاكل التنسيب ، ومشاكل موجة الطلب ، واختيار مشاكل التوجيه من منظور عملية المشكلة. التحسين المشترك لهذه المشاكل الأربع الحل هو الحل الأفضل بأقل تكلفة للتزويد والاختيار.

مشكلة التجديد هي مشكلة تخزين كلاسيكية. نقوم أولاً بتجميع وحدات التخزين التعريفي للمخزون وفقًا لحجم المبيعات. بالنسبة للمنتجات ذات الحجم الكبير ، تتمثل استراتيجيتنا في فتح مساحة لها بشكل منفصل. تكون هذه المنتجات عمومًا في حالة ترويجية ؛ في حين أن المنتجات ذات الحجم المنخفض سيكون لها مساحة تخزين أقل ، ويمكن لهذه الكميات تلبية احتياجات فترة زمنية.

تتضمن قضية التنسيب أيضًا مسألة الحماس لمبيعات المنتج.بالإضافة إلى ذلك ، من الضروري أيضًا مراعاة العلاقة بين المنتجات. بادئ ذي بدء ، يجب وضع المنتجات الأكثر مبيعًا في الموضع الأقرب إلى نقطة بداية الانتقاء (إذا تم فصل نقطة البداية عن نقطة النهاية ، فيجب أن تكون أقرب إلى نقطة النهاية). من حيث الملاءمة ، كلما زادت احتمالية ظهور منتجين في طلب في نفس الوقت ، زادت أهمية المنتجات ، ويحتاج الملتقطون إلى تقليل مسافة الانتقاء قدر الإمكان. بالإضافة إلى ذلك ، نظرًا لأن نفس النوع من البضائع قد يظهر على أرفف مختلفة ، فإن هذا يجعل مشكلة التنسيب أكثر تعقيدًا.

تشير مشكلة إنشاء موجة الطلب إلى أن المنتقي قد يؤدي مهام انتقاء متعددة على مسار انتقاء واحد ، حيث يتم استخدام أجيال متعددة لإنشاء مهام انتقاء على نفس المسار في قائمة مهام واحدة. ستدخل الطلبات المتعددة التي تظهر في إدارة المستودعات إلى تجمع الطلبات ، وبعد ذلك ستحقق الطلبات في تجمع الطلبات دمج الطلبات الأمثل. في هذه المشكلة ، سننظر أيضًا في التوقيت المناسب لضمان موثوقية موجة الطلب. على سبيل المثال ، تتطلب الطلبات ذات الموقف التعاوني المنخفض نسبيًا والأوامر التي لها تأثير متوسط ولكنها دخلت إلى تجمع الطلبات لفترة طويلة الإنقاذ في الوقت المناسب.

مشكلة اختيار تخطيط المسار ليست مشكلة يمكن حلها بواسطة خوارزمية بسيطة لأقصر مسار. يمكن وضع نفس SKU على أرفف مختلفة. لذلك ، يمكن فقط تحديد مواضع الرف لجميع وحدات SKU في قائمة المهام قبل تنفيذ المزيد من تخطيط المسار. الوضع المذكور أعلاه أكثر تعقيدًا ، لكنه لا يزال ينتمي إلى فئة إدارة المستودعات التقليدية.

بالإضافة إلى ذلك ، لدينا أيضًا طرق إدارة جدولة المستودعات غير المأهولة. بالمقارنة مع جدولة المستودعات التقليدية ، فإن حجمنا أكبر والتنفيذ أفضل.

نظرًا لأن مشاريع شركتنا غالبًا ما يتم تقسيمها إلى العديد من المشاريع الفرعية ، فنحن بحاجة إلى أشخاص يتمتعون بقدرات شاملة قوية وتفكير نشط يمكنهم فهم طبيعة العمل بسرعة وبعمق ، ولديهم أفكار معينة في التنقيب عن البيانات وبحوث العمليات.

بالإضافة إلى ذلك ، قمت بتلخيص النقاط المشتركة لبعض المشاريع الكبيرة لتكنولوجيا Shanshu:

الأول هو محرك تنبؤ قائم على المشروع ، وهو العمل المسبق للعديد من المشاريع ، نحتاج إلى تحديد خصائص البيانات والتنقيب عنها لمنع الإفراط في التجهيز وتقديم توقعات أكثر دقة لحالات الطوارئ. أبعاد هذه البيانات عالية نسبيًا ، وغالبًا ما تكون هناك مشكلات شائعة مثل النقص والضوضاء وصعوبة التعبير عن المعلومات الأصلية.

والثاني هو خطة التجديد المتوقعة للقنوات الشاملة ، مما يحسن التجديد الحالي بناءً على إدارة المخزون ، وبالتالي تحسين دقة إدارة المخزون.

الثالث هو التسعير المستند إلى البيانات. استنادًا إلى الأنواع والخصائص الفريدة لبيانات الشركة الخاصة ، جنبًا إلى جنب مع البيانات الخارجية ، ووفقًا لعوامل الدفع المختلفة للأسعار ، سندخل تلقائيًا اتجاه التغييرات في المؤشرات الرئيسية مثل التسعير والأرباح. بالإضافة إلى ذلك ، سنقوم بتعديل استراتيجيات التسعير بمرونة بناءً على أهداف مختلفة. لحل مشاكل مثل التسعير الديناميكي والتسعير الترويجي وتسعير العملاء الرئيسيين والتسعير المجمّع.

بالإضافة إلى ذلك ، بالنسبة إلى حلول تخطيط النقل والتوزيع الذكي متعددة الأبعاد ومتعددة السيناريوهات ، من الصعب جدًا تخطيط جميع الموارد مع مراعاة قيود الأعمال المتعددة. بالإضافة إلى ذلك ، نحتاج أيضًا إلى تقليل تكاليف النقل قدر الإمكان مع ضمان مستويات الخدمة وتحسين استخدام الموارد وتحسين سرعة الاستجابة اللوجستية. في هذه العملية ، هناك حاجة إلى خوارزمية قوية نسبيًا لدعمها. ويمكن لخوارزمية تحسين جدولة المركبات لدينا تحسين كفاءة النقل بشكل كبير ، وحل قيود العمل الواقعية مثل مشاكل التعبئة ، ومطابقة الموارد غير المعقولة ، وتقسيم المناطق الحضرية ، وبالتالي تحرير تكلفة العمالة للجدولة اليدوية.

فيما يتعلق بحلول اختيار الموقع استنادًا إلى سيناريوهات الأعمال ، فإن المثال الذي ذكرناه أعلاه هو أحد حلول اختيار المواقع العالمية لمواقع البيع بالتجزئة والبيع بالتجزئة. سنجمع بين التعلم الآلي والتعلم العميق ونماذج التخطيط التشغيلي لتقديم تستكشف الشركات في إطار صناعة البيع بالتجزئة والطعام الجديدة فرصًا في دوائر الأعمال وفرص الأعمال ، مما يسمح لها بنشر المتاجر بسرعة وعلميًا. بالإضافة إلى ذلك ، قمنا بتجميع الكثير من البيانات الخارجية مثل بيانات المدينة ، والتي يمكن استخدامها لتوصيف الخصائص الإقليمية وتفعيل حيوية المنطقة التجارية.

تمتلك العديد من الصناعات التحويلية أيضًا حلولًا مقابلة ، مثل الجدولة الصناعية القائمة على الأعمال وجدولة دورة الإنتاج وتحليل المستخدم والتحكم في المخاطر وتصميم المنتج وما إلى ذلك.

بالإضافة إلى منتجات المشروع هذه ، قمنا بتسريع تجربة المشروع وتحويله إلى أصول Shanshu غير الملموسة لبناء سلسلة Shanshu الذكية. على سبيل المثال:

أول منتج لدينا PonyPlus ، يُطلق عليه أيضًا Xiaomajiajia ، وهو نظام تحسين النقل.من خلال خوارزمية تحسين جدولة السيارة الفريدة ، مع مراعاة قيود الأعمال المتعددة مثل نافذة الوقت وأولوية المتجر ، يتم تخطيط جميع الموارد ككل لضمان تلبية متطلبات خدمة العملاء. ، توفير حلول تحسين ذكية لطريق التسليم الأمثل ، ونافذة وقت التحميل والتفريغ ، وجدولة السائق وتحميل الصندوق ، وما إلى ذلك ، وبالتالي تقليل عدد المركبات ومسافة القيادة ووقت التسليم للمؤسسة ، وبالتالي تقليل تكلفة النقل الإجمالية. في الوقت الحالي ، تدعم Xiaomajiajia أيضًا مجموعة متنوعة من أوضاع التسليم ، والتي تغطي مجموعة متنوعة من سياسات تقييد المركبات ، وتدعم إعادة التحسين في الوقت الفعلي للطرق أثناء النقل ، وهو أمر عملي للغاية.

والثاني هو StockGo ، إنه نظام لإدارة المخزون ، وهو أيضًا منتج جيد نسبيًا قمنا بترشيحه من المشروع. ضع في اعتبارك البيانات كاملة الأبعاد ، مثل حركة المرور وبيانات التحويل وبيانات المخزون وبيانات الشراء وبيانات الطلب وبيانات الترويج وما إلى ذلك ، مع الأخذ في الاعتبار بشكل أساسي جميع معلومات الهبوط في سيناريو الأعمال واعتماد مجموعة متنوعة من خوارزميات التنبؤ ، مثل تحليل السلاسل الزمنية ، يمكن لتنبؤات التعلم الآلي ، وتنبؤات الشبكة العصبية المتكررة ، وما إلى ذلك ، التنبؤ بالمبيعات الديناميكية الحقيقية للمؤسسات ، وذلك لتوفير توصيات اتخاذ قرارات جرد ذكية ودقيقة لقنوات المرور المختلفة وسيناريوهات الأعمال المعقدة.

بالإضافة إلى ذلك ، لدينا بعض أنظمة التسعير في الوقت الفعلي.

هذه شركة واسعة النطاق عملت معها شركتنا من قبل وما زالت تعمل معًا. في العامين الماضيين منذ إنشائها ، حصلت Shanshu على موافقات متراكمة من العديد من الشركات المعيارية في الصناعات المحلية.

فيما يلي المزايا التي تقدمها الشركة للموظفين:

فيما يلي بعض الوظائف التي توظفها شركتنا:

من بينها ، ينقسم مهندسو الخوارزميات إلى اتجاهين: بحث العمليات والتحسين والتعلم الآلي. ما نشاركه اليوم هو في الأساس اتجاه التعلم الآلي الذي يتضمن البيانات الضخمة. بالنسبة إلى وظائف التطوير الأخرى ، لدينا أيضًا بعض الفجوات في المواهب.

يمكنك معرفة المزيد عن المعلومات ذات الصلة من خلال حسابنا الرسمي. بالإضافة إلى ذلك ، يمكنك إرسال سيرتك الذاتية عبر البريد الإلكتروني job@shanshu.ai.

إذا كان لديك أي أسئلة ، يمكنك تنظيمها وإرسالها إلى بريدي الإلكتروني kezhen@shanshu.ai ، وسأجيب عليها نيابة عنك.

أجاب المعلم Zhao Kezhen أيضًا على الأسئلة التي طرحها الطلاب بعد المشاركة. يمكنك الانتقال إلى المجتمع ( لمعرفة المزيد.

ما سبق هو كل المحتوى الذي شاركه الضيوف في هذا العدد. لمزيد من مقاطع الفيديو الخاصة بالفئة العامة ، يرجى الانتقال إلى Leifeng.com (الحساب العام: Leifeng.com) مجتمع أبحاث الذكاء الاصطناعي لمشاهدتها. اتبع حساب WeChat العام: AI Research Club (okweiwu) ، يمكنك الحصول على أحدث معاينة لوقت البث المباشر للفئة العامة.

طريق الحرير

البضائع الجافة استراتيجية البحث عن وظيفة لمهندس تحليل البيانات الضخمة

التجربة الشخصية ولماذا تختار Shanshu Technology

محتوى احترافي لمهندس تحليل البيانات الضخمة

أمثلة تطبيق سيناريوهات صناعية لتحليل البيانات الضخمة

اقتراحات الدراسة الذاتية لتحليل البيانات الضخمة / التنقيب

محتوى التوظيف في Shanshu Technology والقنوات الداخلية

"سوبر بوي العقد،" تشن وراءه: "في ذلك الوقت كل شيء بسرعة كبيرة."

العليا س لويس فويتون ليس الأقوى؟ 2017 أفضل أسرة مشتركة تختار؟

جديد السوق هل Kewei لانج / GS Weilang: بيع 135900 من

بعد 11 عاما، وهذا يتوقف على طريقة خطوة خطوة المراجعة، خماسية للدور التقليدي للمضيف هوانغ تشى ون

منتجات جديدة سوبر مقنعة المفرج عنهم، فيفو X23 نسخة من نجمي يأتي تألق

في الشوط الثاني حتى يتأهل! زانج يونينغ جيانغ Shenglong الهدايا الدفاع مرتين لادراك التعادل مرتين الرأس، الاوليمبية 2: 2 ماليزيا التأهل لبطولة U23

وجهة نظر | في الصين بعد عامين من "قصة محاضرة" لينكولن وأخذ ما لعبة الشطرنج؟

CNCC 2018 بايت نبض الكلام ما Weiying: الذكاء الاصطناعي مما يتيح إنشاء المحتوى وتبادل

كشفت أخيرا! مخازن a يحمم قرد باريس لا يشير سلسلة الكشف الكامل!

تاي تظهر علنا المودة، الأمر الذي جعل فقط من الأزواج TVB الكلب الغذاء لا تحصل على عدد المتزوجين كما البلطجة؟

الأوعية الدموية هي بهدوء لفترة طويلة "بقعة"، 4 خدعة بسيطة يمكن تنظيف

2018 سوق بويك هيديو: بيع 10،99-14،39 وان

اثنين من أحد عشر وشراء سماعة بلوتوث لاسلكية حقيقية، TicPods مجانية فقط إلى 398 يوان

ابنة إيسون تشان البالغة من العمر 14 عاما في الحب، وتعلمت ابنة جرو الحب حياة الملك من الأخبار -

كونتيننتال، شعاع، جون بوينر، وعلى ضوء المعركة "ملف مايو"، 1000000000 في شباك التذاكر بشكل صحيح بشكل صحيح؟

هانغتشو "مدينة الدماغ" للمرة الأولى في الأراضي لا سرعة المشاركة في المدينة العالمية

فيرجيل Abloh، ترافيس Sccott مساعدة من سلاح الجو 1، كل واحد هو إنتاج الطبقة محدودة!

اختيار COMFORT تجربة واحدة أربعة 205/55 R16 الإطارات

إنجيل كسول: حجر التنظيف روبوت التنظيف الذكي

ابنة إيسون تشان البالغة من العمر 14 عاما في الحب، وتعلمت ابنة جرو الحب حياة الملك من الأخبار -

+ الحصري محدودة! سلسلة بطل سعيد المحملة الكاملة من الطاقة الإيجابية!

يقف التكوين التكنولوجيا قفزة إلى اختبار قيادة جولف 280TSI جديدة

التجربة الشخصية ولماذا تختار Shanshu Technology

محتوى احترافي لمهندس تحليل البيانات الضخمة

أمثلة تطبيق سيناريوهات صناعية لتحليل البيانات الضخمة

اقتراحات الدراسة الذاتية لتحليل البيانات الضخمة / التنقيب

محتوى التوظيف في Shanshu Technology والقنوات الداخلية

الأحكام ذات الصلة