يبحثون المزيد والمزيد من المحللين عن طرق جديدة لاستخدام المعالجة الرقمية بيثون وفهم البيانات.
الكاتب | Lipei وانغ
المترجم | الاتحاد السوفيتي مثل هذا، ذبيان | قوه روي
أنتجت | CSDN ( ID: CSDNnews)
وفيما يلي ترجمة:
بيثون، واحدة من الأداة المفضلة باعتبارها واحدة من أكثر لغة البرمجة شعبية، بل هو أيضا تحليل البيانات وتصور البيانات. بالإضافة إلى مجموعة واسعة من المجتمع بيثون المطور، هناك استخدام فريق مهم بايثون لتحليل البيانات، واقتراح أفكار قابلة للحياة، وبالتالي اتخاذ القرارات.
الثعبان لديها عدد كبير من المكتبات ومساعدة منصة، والبيانات التي يمكن أن تكون أداة استكشاف بسرعة، تكرارية. ويشمل الثعبان جمع مكتبة كل شيء من التصور إلى التحليل الإحصائي، والتي يمكن أن تساعد المستخدمين بسهولة الوصول إلى البيانات والبدء في تحديد أنماط.
بالإضافة إلى التكرار السريع في البيانات والتحليل الإحصائي في الخارج، بيثون هناك الكثير من الأنابيب المستخدمة لإدارة البيانات وسير العمل أدوات مفتوحة المصدر. يبحثون المزيد والمزيد من المحللين عن طرق جديدة لاستخدام المعالجة الرقمية بيثون وفهم البيانات.
بيثون ما هي الفائدة؟
بيثون وSQL نفسه: أنها قادرة على الإجابة على أي أسئلة. الثعبان هو مجتمع كبير، ولقد تم اعتماد معدل لها في الارتفاع.
هناك العديد من سهلة الاستخدام لمكتبة بيثون، يمكنك بسرعة وسهولة أداء استكشاف البيانات. وهذا يتيح تحليل البيانات التكرارية ممكن. مع بيثون، يمكنك استكشاف حقا فضولك يأخذك إلى أسفل حفرة أرنب غامضة (مما يعني أنه يمكن الحصول على الجزء السفلي، نرى التجوال أليس في بلاد العجائب).
وأخيرا، بيثون العملي والمرونة يسمح لها لمجموعة متنوعة من المهام داخل كومة البيانات العلمية. على سبيل المثال، لويجي تدفق الهواء والسماح الأنابيب وإدارة البيانات سير العمل في بيثون. من خلال استكمال تحليل استكشافية في بيثون، يمكن في بعض الأحيان أن هذا العمل إدخالها في عملية الإنتاج للمتابعة.
مقارنة مع بيثون، SQL ما أكثر شعبية استخدام القضية؟
يستخدم SQL لبيانات الاستعلام واستخراج من قاعدة البيانات. وهذه خطوة أولى ضرورية لتحويل البيانات إلى تنسيق صالحة للاستعمال. على سبيل المثال، SQL يسمح لك بسهولة ربط مجموعات بيانات متعددة لإنشاء جدول لمزيد من البحث.
لم يتم تصميم SQL للعمل في بعض الطريق أو البيانات تحويل البيانات والتصميم. بيانات علمية مشتركة معالجة البيانات المتقدمة (مثل التحليل الإحصائي، الانحدار وخطوط الاتجاه، وبيانات السلاسل الزمنية) في SQL ليس من السهل تحقيقه.
وعلى الرغم من هذه القيود، ولكن لأنه مطلوب SQL لاستخراج البيانات، لا يزال غالبا ما تستخدم لعمليات معقدة. يتم استخدام الاستعلام التالية لحساب البيانات quantile من سلاسل مختلفة:
مع تفاصيل AS ( سلسلة SELECT، القيمة، ROW_NUMBER OVER (PARTITION BY سلسلة ORDER BY قيمة) AS ROW_NUMBER، SUM (1) OVER (PARTITION BY سلسلة) AS مجموعه من البينات. )، الربعية AS ( سلسلة SELECT، القيمة، AVG (CASE WHEN ROW_NUMBER > = (طابق (الكل / 2.0) /2.0) وROW_NUMBER < = (طابق (الكل / 2،0) /2.0) + 1 قيمة ثم / 1.0 END ELSE ) OVER (PARTITION BY سلسلة) AS Q1، AVG (CASE WHEN ROW_NUMBER > = (إجمالي / 2.0) وROW_NUMBER < = (إجمالي / 2.0) + 1 قيمة ثم / 1.0 END ELSE ) OVER (PARTITION BY سلسلة) AS الوسيط، AVG (CASE WHEN ROW_NUMBER > = (سقف (الكل / 2.0) + (طابق (الكل / 2.0) /2.0)) وROW_NUMBER < = (سقف (الكل / 2.0) + (طابق (الكل / 2،0) /2.0) + 1) قيمة ثم / 1.0 END ELSE ) OVER (PARTITION BY سلسلة) AS Q3 من التفاصيل ) سلسلة SELECT، MIN (CASE WHEN قيمة > = Q1 - ((Q3-Q1) * 1.5) قيمة THEN END ELSE) AS الحد الأدنى، AVG (Q1) AS Q1، AVG (الوسيط) AS الوسيط، AVG (Q3) AS Q3، MAX (CASE WHEN قيمة < = Q3 + ((Q3-Q1) * 1.5) قيمة THEN END ELSE) AS أماه الحادي عشر ماما من الربعية GROUP BY 1متى تستخدم بايثون؟
الثعبان لديها عدد كبير من المكتبات (مثل الباندا، StatsModel وSciPy)، وهو التحليل الإحصائي والرياضي والتصميم. تقوم هذه المكتبات أيضا بشكل جيد للغاية في التفاصيل مجردة، مما يلغي الحاجة لحساب جميع الرياضيات الأساسية يدويا. وعلاوة على ذلك، يمكنك الحصول على نتائج فورية، يمكن أن تكون البيانات البحثية متكررة باستخدام بيثون.
لست بحاجة إلى القول "أريد أن يكون الانحدار"، وقضاء نصف ساعة من الجلوس والرقم من أين تبدأ الاستفسارات SQL، مكتبة بيثون يمكن تشغيل التحليل، عرض النتائج. في بيثون، ليس هناك تأخر كثيرا بين الإلهام والعمل.
على سبيل المثال، إذا كنت حقا بحاجة الى اظهار يعرف مجموعة البيانات quantile، سأكتب في الاستعلام. لأن كل شيء يمكن القيام به في السطر التالي من التعليمات البرمجية بايثون، ولذا فإنني سوف انجاز العمل في وقت سابق في عملية التحليل، وربما تجد أن بعض النتائج لا أريد.
dataset.describeوهناك طريقة أخرى للنظر في الفرق بين بيثون وSQL هي، بيثون يسمح لك أن تبدأ مع طاولة كبيرة، بدءا من طاولة كبيرة، يمكن أن تجعل تحليلات مختلفة في فروع مختلفة. مسار إلهام يمكن أن يأخذك إلى الطريق الأخرى، مما يجعل سرعة تحليل والمرونة لاستكشاف العديد من مسارات أسهل.
SQL وبيثون لديها مزايا وعيوب، لغتين دمج معا، وقد تم السماح المحللين في كل العالم على أفضل نتيجة.
وقال المحلل SQL، ما يحتاج إلى تعلم بايثون؟
مثل العديد من المهارات، وتعلم كيفية استخدام بيثون هو أفضل وسيلة لتنفيذ تحليل مضنية البحوث ذات الاهتمام، فقد كان اهتمام والمشاكل مألوفة إلى حد ما.
عندما كنت تفعل شيئا أن مصالح لك، وتميل إلى بذل المزيد من الجهد في العمق. هذا الفضول يمكن أن تدفع لك لتذهب أبعد من ذلك، ولكن هذا هو مصدر الكثير من التعلم الحقيقي.
يجب عليك أيضا التعامل مع بعض من كنت معتادا على البيانات، حتى تعرف ما ظلموا. سيكون لديك الحدس الأفضل أن تعرف ما حدث وما يمكن توقعه. ومع ذلك، عندما تكون البيانات كنت تتعامل مع شيء عندما كنت تعرف شيئا عنها، على سبيل المثال، معالجة البيانات حجم البتلة (التي هي موجودة في العديد من بيثون مجموعات سبيل المثال البيانات الشعبية). إذا خلص تحليلك أن "جميع بتلات من هذه الزهور هي حجم اثنين سنتيمترا"، ولكن لا أعرف ما إذا كان من المعقول، قد مجرد افتراض أنه الحق، ثم الانتقال.
تعلم بايثون بالتأكيد يمكن أن تعزز مهارات المحللين البيانات.
تحتاج المحللين على التواصل القيمة التجارية للبيانات. جزء من عملهم هو محاولة لإيجاد فكرة عن العمل من البيانات، ويشمل عمل أكثر فعالية أيضا في جميع أنحاء الذي يمكن أن تتخذ إجراءات لإجبار زملائه الرؤى الخاصة بك، بما في ذلك السياق الصحيح والعرض. وعلاوة على ذلك، واستخدام البيانات وتحليلها لقرارات جعل في مكان العمل يصبح من المهم على نحو متزايد، بالتالي، أن المحللين تقديم تحليل شامل لدور أكثر أهمية من أي وقت مضى.
الأصل: HTTPS: // شريحة كوم / المدونة / SQL-مقابل-بيثون /
هذه المقالة CSDN الترجمة، يرجى الإشارة إلى المصدر من المصدر.
[END]