جيدة إلى الأعلى، طريقك من العلماء بيانات قصيرة من مهارات 13

أطروحة 4579 الكلمات، وعندما يكون التعلم مدى المتوقع 9 دقيقة

هناك على LinkedIn مثل هذا السؤال: ما هو الفرق بين العلماء بيانات المتميز وكبار العلماء البيانات؟

سؤال حول ينكدين

والإجابة على الأسئلة من جميع مناحي الحياة تلقت العديد من العلماء أعلى البيانات، بما في ذلك ما يقرب من جميع الإجابات أيضا أن تصبح العلماء أعلى البيانات لديهم مهارات.

في الواقع، هناك فرق بين العلماء بيانات جيدة والعلماء بيانات أفضل. باحث البيانات لا يمكن أن يكون جميع المهارات المذكورة في هذه المقالة. ولكن من هذه المهارات، حتى أن العلماء أعلى البيانات لتبرز من العديد من العلماء البيانات المعلقة.

بعد الأمل أنه بعد قراءة هذا المقال، سوف البيانات تساعد العلماء المهنية.

1. التعليم

المصدر: pexels.com/@pixabay

مستوى العلماء البيانات 'من التعليم العالي، و 88 من العلماء بيانات لديها على درجة الماجستير، و 46 لديهم درجة الدكتوراه. وبطبيعة الحال، وبالتأكيد بعض الاستثناءات. لتصبح عالما البيانات، فإنه يتطلب مستوى عال من التعليم من أجل تطوير العمق الضروري للمعرفة. لتصبح عالما البيانات، يمكنك الحصول على درجة البكالوريوس في علوم الحاسوب، والعلوم الاجتماعية، والعلوم الفيزيائية والإحصاءات. في معظم المناطق المشتركة للبحث في الرياضيات والإحصاء (32)، تليها علوم الكمبيوتر (19 في المئة) والهندسة (16). هذه الأماكن تسمح لك لإتقان المهارات اللازمة لعملية وتحليل البيانات الكبيرة.

حتى لو أكملت برنامج درجة، وتعلم الطريق لم تنته بعد. في الواقع، فإن معظم العلماء بيانات لديها، وشارك أيضا الماجستير أو درجة الدكتوراه مثل كيفية استخدام Hodoop أو التدريب البيانات الكبيرة الاستعلام عبر الإنترنت لتعلم مهارات معينة. لذلك، يمكنك الاشتراك في العلوم الماجستير درجة برامج البيانات، والرياضيات، والفيزياء الفلكية وغيرها من المجالات ذات الصلة. والمهارات المكتسبة أثناء الدراسة للحصول على درجة تساعدك على تسهيل الانتقال إلى علم البيانات.

بالإضافة إلى التعلم داخل الفصل، يمكنك أيضا إنشاء التطبيق، كتابة بلوق أو استكشاف وتحليل البيانات لممارسة ما تعلموه في الصف، وبالتالي اكتساب المزيد من المعرفة.

طالما لديك القدرة على إنجاز العمل، الماجستير أو درجة الدكتوراه هو خيار اختياري. في معظم الصناعات في نطاق العمل، طالما أنها حل المشاكل التجارية، لا تحتاج إلى دراسة واعتماد نماذج تعلم آلة المتطورة الجديدة.

لغة البرمجة 2. R

واحد على الأقل الأدوات التحليلية لديهم فهم أفضل، على البيانات من حيث العلمي، R لغة البرمجة عادة ما يكون الحق الأول. لغة R المصممة لتلبية احتياجات البيانات البيانات وتصميم العلمية يمكن أن تستخدم من أجل حل أي مشاكل واجهتها في مجال العلوم. في الواقع، 43 من العلماء البيانات تستخدم R لحل المشاكل الإحصائية. ومع ذلك، فإن R البرمجة تعلم انحدارا منحنى.

إذا كنت تعرف لغة برمجة، ثم R يصبح من الصعب تعلم اللغة. ومع ذلك، لا يزال هناك العديد من الموارد على الانترنت تسمح لك لغة التي R، مثل البيانات R لغة البرمجة الامير الرومانسي التدريب العلمي والبيانات تطمح العلماء، وهذا هو كبير من الموارد.

3. بيثون البرمجة

الثعبان هو العلم بيانات لغة البرمجة الأكثر شيوعا، وبطبيعة الحال، جافا، بيرل، أو C / C ++. للعلماء البيانات، بيثون لغة البرمجة هي أفضل البيانات. هذا هو السبب في 40 من المستطلعين سوف أورايلي بيثون كلغة برمجة الأولية.

بسبب تنوعها، بيثون الخطوات لجميع البيانات في العملية العلمية، والبيانات في أشكال مختلفة يمكن استخدامها، ويمكن إدخال بسهولة في الجدول رمز SQL، ويمكن أيضا إنشاء مجموعة البيانات، محرك جوجل للبحث على المطلوب أي نوع من البيانات.

قراءة الكتب التالية لفهم أساسيات بايثون أكثر وتطبيقاتها في العلوم البيانات:

الدليل العلوم البيانات بيثون

بيثون البيانات للتحليل

تعلم بايثون

4. منصة Hadhoop

على الرغم من أن هذا ليس منصة أساسية، ولكن في كثير من الحالات، وهذا هو منصة للاختيار. شهدت خلية أو الخنزير هو نقطة بيع جيدة. الأمازون S3 سحابة وغيرها من أدوات مألوفة أيضا جيدة. أجريت دراسة عن 3490 وظيفة علم البيانات ينكدين من قبل CrowdFlower المعرض، 49 في المئة من Hadhoop أباتشي على العلماء بيانات لإتقان مهارة مهمة الثانية.

قد تواجه العلماء البيانات مثل هذه الحالة: كمية البيانات قد تجاوز ذاكرة النظام، أو الحاجة إلى إرسال البيانات إلى ملقم آخر. هذا هو المكان دور Hadhoop، Hadoop يمكن بسرعة نقل البيانات إلى نقاط مختلفة على النظام، وهذا هو مجرد غيض من فيض، ويمكن Hadoop أيضا استكشاف البيانات، تصفية البيانات، وأخذ العينات وموجزة.

5. قاعدة بيانات SQL / برمجة

وعلى الرغم من NoSQL وHadoop هو جزء مهم من البيانات العلمية. لكن لا تزال تتوقع المرشحين قادرا على كتابة أو تنفيذ استعلامات معقدة مع SQL. SQL (لغة الاستعلام الهيكلية) هي لغة البرمجة التي يمكن أن تساعد البيانات إضافة وحذف واستخراج من قاعدة البيانات وغيرها من العمليات يمكن أن تساعد أيضا في وظائف التنفيذ والتحليل لتحويل بنية قاعدة البيانات.

كعالم البيانات يجب أن يكون بارعا في SQL. لأنه تم تصميم SQL للوصول والاتصالات ومعالجة البيانات وتصميم، واستخدامها في الاستعلام عن قاعدة بيانات سوف تحصل على بعض البصيرة. يتطلب أمر بسيط يمكن توفير الوقت وتقليل كمية من البرامج لتنفيذ استعلامات الصعبة. المساهمة التعلم SQL إلى فهم أفضل لقواعد البيانات العلائقية وتعزيز معلوماتهم الشخصية.

6. سبارك أباتشي

أباتشي سبارك أصبحت معظم تقنيات البيانات الكبيرة شعبية في العالم، والحوسبة بيانات Hadoop كبيرة الإطار، والفرق الوحيد هو أسرع من Hadoop سبارك، لأن Hadoop يحتاج إلى القراءة والكتابة إلى القرص، وسوف تبطئ سرعة، ويتم احتساب النتيجة سبارك مؤقتا في الذاكرة.

أباتشي تصميم سبارك خصيصا لبيانات علمية لمساعدة الخوارزميات المعقدة تشغيل أسرع. المساهمة في نشر معالجة البيانات في وقت هائلة من البيانات، وبالتالي توفير الوقت، ويمكن أيضا مساعدة العلماء لمعالجة البيانات ومجموعات البيانات غير المهيكلة على جهاز واحد أو مجموعة من.

أباتشي البيانات العلمية سبارك لمنع فقدان البيانات، ومنصة هو ميزة سرعته، يمكن للبيانات تنفيذ المشاريع العلمية بسهولة. مع اباتشي شرارة يمكن أن تؤدي تحليل البيانات الواردة من الحوسبة الموزعة.

7. آلة التعلم والذكاء الاصطناعي

معظم البيانات لا يتقن العلماء وتقنيات التعلم الآلي، بما في ذلك الشبكات العصبية، تعزيز التعلم والتعلم المواجهة. تريد أن تبرز، عليك أن تعرف كما تعلم تحت إشراف الجهاز، مراجعة المنطق شجرة القرارات وآلة تقنيات التعلم. ويمكن لهذه التكنولوجيا أن تساعد في حل مشاكل مختلفة استنادا إلى البيانات العلمية التنبؤ بنتائج المنظمة الرئيسية.

وأظهرت البيانات العلمية المطلوبة في تطبيق المهارات في مختلف مجالات التعلم آلة مسح Kaggle أنه ليس هناك سوى جزء صغير من المهنيين بيانات لإتقان آلة متطورة مهارات التعلم، على سبيل المثال، والتعلم تحت إشراف الجهاز، تعلم الآلة غير خاضعة للرقابة، السلاسل الزمنية، اللغة الطبيعية تجهيز وفحص القيم المتطرفة، رؤية الكمبيوتر، محرك توصية وتحليل البقاء على قيد الحياة، تعزيز التعلم والتعلم المواجهة.

تحتاج البيانات العلمية للتعامل مع مجموعات كبيرة من البيانات، قد ترغب في أن تكون بارعا في آلة التعلم للتعامل مع هذه مجموعات البيانات.

8. التصور البيانات

المصدر: pexels.com/@pixabay

وسوف يستمر العمل لإنتاج كميات كبيرة من البيانات التي تحتاج إلى أن تترجم إلى صيغة مفهومة. وبالمقارنة مع البيانات الأصلية، فإنه من المفهوم أكثر سهولة شكل رسوم بيانية من الصور، "صورة تساوي ألف كلمة".

كعالم البيانات يجب أن تكون قادرة على مساعدة ggplot من هذا القبيل، d3.js، Matplotlib وتصور البيانات أدوات مثل تصور البيانات تابلوه. هذه الأدوات تساعد على وضع نتائج المشاريع المعقدة في صيغة مفهومة. والمشكلة هي أن الكثير من الناس لا يفهمون وقيمة تسلسل ارتباط ص، فمن الضروري لتمثيل بصريا مضمون حيث انعكس في النتائج.

تقدم آلية التصور البيانات الفرصة للتعامل مباشرة مع البيانات. أنها يمكن أن بسرعة نظرة ثاقبة البيانات إلى اغتنام الفرص في صدارة المنافسة.

9. البيانات غير المهيكلة

البيانات غير منظم هو أمر حاسم لعلماء البيانات. البيانات غير المهيكلة ليست مناسبة للمحتويات غير محددة من جدول قاعدة البيانات، على سبيل المثال، وأشرطة الفيديو، بلوق وظائف وتعليقات العملاء والمقالات وسائل الاعلام الاجتماعية، ومصادر الفيديو والصوت وغيرها، من خلال كومة كبيرة من النص معا. لأن هذه البيانات تبسيط ليست كافية، فإنه من الصعب تصنيف.

ونظرا لتعقيد البيانات غير المهيكلة، ومعظم الناس يسمونه "تحليل الظلام." تساعد البيانات غير المهيكلة توضيح رؤى مفيدة لصنع القرار. كعالم البيانات، يجب أن يكون لديك القدرة على فهم وتشغيل البيانات غير المهيكلة من منصات مختلفة.

10. الفضول

ليس لدي أي موهبة خاصة، والفضول فقط. ألبرت أينشتاين

ليس هناك شك في الآونة الأخيرة في العديد من الأماكن يمكن أن نرى هذا الشهيرة، وخصوصا عندما العلماء والبيانات ذات الصلة. وقبل بضعة أشهر، مدونة ضيف فرانك لو نشرت، وأوضح معناها والحديث عن الأساسية الأخرى "المهارات الناعمة".

ويعرف الفضول حريصة على معرفة المزيد. ونتيجة لبيانات يحتاج العلماء لتكون قادرة على طرح الأسئلة من البيانات، وذلك لأن العلماء بيانات قضى ما يقرب من 80 من الوقت لإيجاد وإعداد البيانات. علم البيانات هو التطور السريع جدا في هذا المجال، يجب اكتساب مزيد من المعرفة لمواكبة الاتجاهات.

الحاجة إلى قراءة بانتظام المحتوى عبر الإنترنت واتجاهات البيانات العلمية الكتب المتعلقة بالموضوع لتحديث احتياطيات معارفهم. لا مبهور بها كميات كبيرة من البيانات عبر أغرقت شبكة الإنترنت. عليك أن تعرف كيفية استخدامها، وهي واحدة من الفضول لتصبح عالما البيانات المهارات الأساسية. على سبيل المثال، في البداية، والبيانات التي تم جمعها قد لا تكون على علم بما من، ولكن الفضول تقودك للعثور على إجابات في البيانات وتحقيق المزيد من البصيرة.

11. الفطنة

لتصبح احتياجات عالم البيانات صناعاتها ما هي المشاكل التي يتعين حلها مع فهم سليم، وفهم الشركة. على البيانات العلمية، بالإضافة إلى طريقة جديدة لتحديد استخدام بيانات الأعمال، ولكن قادرة على تحديد ما يمكن حل مشكلة الأعمال هو ضروري.

للقيام بذلك، يجب أن تتعلم كيفية حل المشكلة سوف تؤثر على الأعمال التجارية. فهم عمل المؤسسات، من أجل التحرك في الاتجاه الصحيح.

12. مهارات الاتصال

أبحث عن يبحثون العلماء بيانات ممتازة لمثل هذا الشخص، وقال انه كان قادرا على العثور على اضحة وسلسة سيتم الإعلان تقنية لفرق غير التقنية مثل التسويق أو المبيعات إدارات. بالإضافة إلى ضرورة تفهم احتياجات الموظفين غير الفنيين الإدارات من أجل مناقشة البيانات المناسبة، يجب على العلماء البيانات أيضا التأكد من أن القرارات التي اتخذتها الشركة لديها دعم رؤية ذات جودة عالية.

بالإضافة إلى استخدام اللغة التي يمكن فهمها خارج الشركة، فإنه يجب أيضا استخدام البيانات القص على التواصل. ونتيجة لاحتياجات عالم البيانات لمعرفة كيفية بناء خط القصة بحيث يمكن للأشخاص الآخرين بسهولة فهم حول البيانات. على سبيل المثال، قدمت بيانات رديئة مباشرة لتبادل هذه الأفكار للبيانات فعالة في شكل رواية القصص. شكل قصة يساعدك على التواصل مع بيانات صاحب العمل الحق وجدت.

AC، تولي اهتماما لنتائج التحليل وقيمة البيانات. معظم أصحاب العمل لا يريدون أن يعرفوا على تحليل ما يهم أنها في أن تنتج أي أثر الإيجابي لهذه البيانات يؤثر على الخدمة. تعلم لتقديم قيمة وبناء علاقات دائمة من خلال التواصل.

13. العمل الجماعي

المصدر: pexels.com/@rawpixel

العلماء البيانات لا يمكن أن تذهب وحدها. يجب معا المديرين التنفيذيين للشركة والبحوث الاستراتيجية، ومديري المنتجات والمصممين لنعمل معا لتطوير منتجات جديدة، وموظفي التسويق للقيام بأنشطة تحويل أفضل مع مطوري العميل وبرنامج الخادم لإنشاء البيانات إلى جانب خطوط الأنابيب وتحسين سير العمل. وعلينا أن نعمل معا مع الجميع في الشركة، بما في ذلك العملاء الخاص بك.

في الأساس، فإن أعضاء فريقك التعاون لتطوير واستخدام الحالات، من أجل حل مشكلة اللازمة لفهم أهداف العمل والبيانات، ومعرفة الطريقة الصحيحة للتعامل مع الحالات، يحتاج البيانات إلى حل المشكلة، وكيف يمكن لأصحاب المصلحة يفهم بسهولة طريقة لتقديم النتائج.

انتباه رسالة الابهام

معا نحن نشارك في التعلم وتطوير AI الجاف

ترحب منظمة العفو الدولية انتباه منصة الشنق كله من الطبقة سائل الإعلام "قراءة التقنية الأساسية"

500000 الجائزة الكبرى! دانتشو مكافأة القبض على 93 الاحتيال الهاربين الاتصالات السلكية واللاسلكية، يرجى الاطلاع على الشرطة

اكتشف هواوي عملية باولو! 2799 يوان الجهاز الجديد، لمساعدتك على الجراحة التجميلية والساقين رقيقة وسحبها

يجب أن نرى! المادة سيد الأكثر تقدما في الوقت الحقيقي نظام الكشف عن وجوه YOLO

سرعة المروحة! فيلم نظام توصية لتأسيس حقها

اليوم صوت الأساسية | الطوارئ! أبل ليتذكر بعض ماك بوك برو، يمكنك اطلاق النار لا؟

"IU"، "حصة" 190623 "دي لونا فندق" لو تشن IU لعكس اعتراف تسعة؟ "هكذا فقط في رأيي."

نساء تتحقق، والسجن الاجتماعي؟ الجنس الروبوت "الفاحشة" ذلك؟

"GFRIEND '' الأخبار '190623 يو تشو - غالاكسي الخروج" مرحبا "للعمل على الطريق! يدا بيد الحب الحميمة

190623 تساى شو كون "الأزياء كوزمو" صفحات داخل رائعة المشورة منغ شياو كوي هي الختم الرسمي للشهادة

يمكن التعلم العميق أيضا قطع البطيخ الخضر؟ سوف تكون قادرة على تحقيق الحد الأدنى رمز

وظيفة تصنيف كبيرة PK: السيني وSoftmax، على التوالي، وكيفية استخدامها؟

السياحة شينجيانغ هي المرة "مدينة النفط" كاراماي الوليد الأخضر