تعمل مجموعة النقيض من SQL وبيثون: صالح هو الأفضل!

للمحللين أو بيانات العلماء، على دراية مجموعة متنوعة من لغات البرمجة يمكن تحليلها للفوز ميزة في بيئة البيانات اليوم. حوار متعدد اللغات في صلب القانون، لغة SQL بشكل خاص ولغة بيثون، وغالبا ما يوصف بأنه منفصلة وظيفية.

SQL وبيثون يمكن تحقيق العديد من المهام. اثنين من لغات البرمجة لاستكشاف وظائف متداخلة يمكن أن يساعد فقط الناس الذين هم على دراية بلغة البرمجة أكثر دراية مع لغة برمجة أخرى. واستخدام مزيج من كل لغة البرمجة، ويتمكنوا من اتخاذ قرارات أكثر استنارة وأفضل اختيار الأداة المناسبة لكل مهمة. تعلم كيفية إكمال المهمة في SQL أو بيثون، سوف تساعدك على اختيار أفضل وسيلة للحصول على الوظيفة.

عمليات تعيين

تحتاج المشاكل التحليلية لدراسة أكثر من مجموعات مختلفة عموما من البيانات. في عملية الحل، لإنشاء مجموعة جديدة من مجموعة البيانات عن طريق مقارنة مجموعة البيانات أو مجموعة مختلفة، فمن فعالة جدا.

على سبيل المثال، قد يكون لديك جدولين منفصلة، والتي تحتوي على الجدول الصفقة يمكن تحويلها إلى بيانات المعاملات واحد، وتريد أن الجمع بينها في الجدول، أو إنشاء يحتوي على جدول المعاملات الجديدين جداول البيانات.

في SQL، يمكن للمشغلين تعيين حل هذه المشكلة. مقارنة يدعم مشغل مجموعة عمليات، وربط مشروط مجموعات النتائج اثنين من البيانات SQL. وضع SQL مشغلي يتألف:

UNION: عوائد بيان تنتج الصفوف من اثنين من الاستفسارات يمكن مقارنتها. افتراضيا، إذا ركزت نتائج بيانين SQL على وجود نفس الصف، UNION لن يعود الصفوف المكررة. إذا كنت ترغب في العودة الصفوف المكررة، يمكن أن توفر الكلمة اختياري ALL لمشغلي مجموعة UNION.

INTERSECT: عودة البيان من سطرين إلى أن تقارن مجموعة نتائج الاستعلام.

باستثناء (أو الطرح): الرجوع إلى بيان غير خط يمكن مقارنتها مجموعة نتائج الاستعلام.

رغم عدم وجود محددة مجموعة من مشغلي الأنواع بيثون، ولكن الثعبان لا تزال طائفة واسعة من الوظائف التي يمكن تنفيذ هذه المهام.

لتوضيح كيفية استخدام هذه العمليات المنصوص عليها في الممارسة، افترض أنك، كعالم بيانات السوق الثنائي. هناك المشترين والبائعين في السوق، وهما لا يتعارضان. الآن، المشترين والبائعين من المشترين والبائعين موجودة في جدول قاعدة البيانات. دعونا نلقي نظرة على عملية جمع قد تلعب دورا في عدة مشاهد.

الاندماج وتوحيد جميع

افترض أنك تريد فقط للمستخدمين موجودة في المشترين والبائعين في الجدول دمجها في، منفصل الجدول "المستخدم" الجديد.

في SQL، يمكنك استخدام عامل التشغيل UNION ALL والكلمة الاختيارية إلى تحقيق ما يلي:

- SQL

حدد USER_ID

من modeanalytics.buyers

اتحاد كل

حدد USER_ID

من modeanalytics.sellers

في بيثون، التي يمكن أن تستخدم الباندا .concat () نسخ وظيفة UNION ALL مجموعة من العمليات التي تجرى أعلاه.

الباندا .concat () طريقة الباندا كائن الاتصال (مثل Dataframes، سلسلة الخ) على طول المحور المحدد. وتقول دعونا لديك المشترين والبائعين جداول قاعدة البيانات USER_ID البيانات الميدانية المخزنة في اثنين من الباندا صندوق الكائن (المشترين والبائعين)، يمكنك استخدام نسخة تنفيذ التعليمات البرمجية التالية بيثون من عمليات مجموعة أعلاه UNION ALL:

# بيثون

المستخدمين = pd.concat ( )

وتجدر الإشارة إلى أن استخدام والكلمات الرئيسية UNION ALL في SQL، أو استخدام أسلوب الباندا CONCAT () في بيثون، سوف موجودة في الجدول المستخدم اثنين (وهذا هو، المشترين والبائعين المستخدمين) العودة إلى تكرار الخط. ومع ذلك، إذا كنت ترغب في العودة مثيل واحد فقط من المستخدم موجود في كلا الجدولين في الحالات التالية:

في SQL، إزالة الكلمة من UNION ALL المشغل مجموعة من:

- SQL

حدد USER_ID

من modeanalytics.buyers

الاتحاد

حدد USER_ID

من modeanalytics.sellers

في بيثون، و.drop_duplicates () على طريقة الباندا ارتباط اتصال الكائنات:

# بيثون

المستخدمين = pd.concat ( ) .Drop_duplicates ()

تقاطع طرق

من ناحية أخرى، إذا كنت ترغب في إنشاء كل من المشتري والبائع مستقلة من الجدول المستخدم ذلك؟

في SQL، يمكنك استخدام مشغلي مجموعة INTERSECT:

- SQL

حدد USER_ID

من modeanalytics.buyers

تتقاطع

حدد USER_ID

من modeanalytics.sellers

في بيثون، يمكنك استخدام الباندا .merge () طريقة في المربع بيانات:

الثعبان

buyers_and_sellers = buyers.merge (البائعين)

افتراضيا، الباندا .merge () طريقة سيحاول كل إطار من البيانات عمودين دمج "الداخلي". خطوات هذه العملية الازدواجية الأساسية الافتراضية SQL INTERSECT المشغل مجموعة.

مجموعة الفرق

الآن، إذا كنت تريد المستخدم للعودة إلى جميع المشترين، وليس الباعة المستخدم.

في SQL، يمكنك استخدام باستثناء عمليات تعيين:

- SQL

حدد USER_ID

من modeanalytics.buyers

يستثنى

حدد USER_ID

من modeanalytics.sellers

تجدر الإشارة إلى أن مجموعة SQL من باستثناء المشغل لا يمكن أن ترجع إلى الجدول الأول، لا يمكن العودة إلى الجدول الثاني. إذا كنت ترغب في العودة إلى طاولة البائع، تحتاج إلى عكس ترتيب عبارة SELECT:

- SQL

حدد USER_ID

من modeanalytics.sellers

يستثنى

حدد USER_ID

من modeanalytics.buyers

في بيثون، وتقنيات الفهرسة واستخدام منطقية الباندا الباندا .isin () لنسخ SQL المؤشر باستثناء وظائف المشغل تعيين:

# بيثون

buyers_not_sellers = المشترين

sellers_not_buyers = الباعة `

عدم وضوح الحدود

هنا، كنت تعرف كيفية نسخ عدد كبير من شركات مجموعة SQL في وظيفة بيثون. في نهاية المطاف، واختيار يعتمد على أسلوب البرمجة يمكنك حتى تغيير واحدا تلو الآخر على أساس المشروع. فقط من خلال السيطرة على تحليل لغة وظائف متداخلة، من أجل اتخاذ قرارات فعالة. هذه هي الفائدة من استخدام مجموعة متنوعة من لغة تحليل البيانات: يمكنك تخصيص نهج الهجين لتلبية احتياجات المتنامية.

تعاون السكان الأصليين شو صناعة ريفية جديدة لناحية جديدة هانغ تشو حصاد ثمار التي

مفصل الرمز: بناء API REST بسيط التعلم العميق Keras +

ما اعضاء يعانون من الجوع سعر علة ثلاثة دولارات في الشهر، وسحب الصوف ليكون سقوط النظام

أريد أن أبقى بعيدا underfitting OR overfitting؟ تسوية أوضاع أكثر فعالية!

أنت بالتأكيد لا أعرف! يمكن أن مجموعة القنوات الصغيرة قيام بهذه المهمة!

اي فون الجديد مكلفة للغاية؟ رد كوك: أنت تستحق أن دفع ثمن هذا الابتكار

لم زوكربيرج لا يجرؤ على الذهاب إلى إنجلترا؟ انتقد تقرير لجنة برلمانية بريطانية الفيسبوك: العصابات الرقمية!

اي فون الجديد ليس لها اي مبلغ التعيين الاستثنائي، سامسونج يتكلم السيئة: لأنها أبل؟

"مو أبطال" الإصلاح وتعزيز تنمية عالية الجودة ممارسة نينغبو

فرشاة صغيرة جيل الأمير الدخن 4 من مرحلة تاريخية، لن دعم MIUI10

وبسبب هذا الحادث، فقد كان السيد ما على مستوى منخفض مع الناس في دائرة من الأصدقاء حصل في معركة!

وضع الطيران تفعل؟ لماذا لا لفتح وضع الطائرة الطائرة؟