من المواجهة إلى التكامل، ليعلمك إلى الاستفادة الكاملة من R + بيثون!

علينا أن نركز على المهارات بدلا من التركيز على الأدوات.

إذا كنت تعمل في علم البيانات قد يعتقد على الفور اثنين من لغات البرمجة: R وبايثون.

في الواقع، R وبيثون نفسه هو أداة جيدة، ولكن يعتبر عموما منافس. سيوصي مقال اليوم للمقارنة بينهما، بدلا من التعامل معها بوصفها خيارين.

إذا قمت بإدخال R مقابل بيثون في شريط البحث جوجل، وتحصل على الكثير من المقالات حول مزايا الحزب على الفور.

وأحد أسباب هذه النتيجة هو أن الناس وفقا لعلم بياناتها تنقسم وفقا لاختيار لغة البرمجة المستخدمة للمخيم، مخيم ومخيم بيثون R. وأن المعسكرين في كثير من الأحيان لا في وئام، التي يعتقد أعضاء أن لغتهم هي أفضل من الآخر. حتى في الطريق، وهذا الاختلاف ليس أداة، ولكن إلى حد ما -

لماذا لا تستفيد منها؟

هناك عدد قليل جدا من البيانات العلمية من الناس باستخدام كل بيثون وR. ولكن في الواقع، هناك الكثير من الناس الذين، على الرغم سوى لغة البرمجة، ولكنها تحتاج أيضا إلى استخدام بعض الميزات من البرامج الأخرى. على سبيل المثال، للمستخدمين R يريدون أحيانا لاستخدام قدرات وجوه المنحى بيثون من الجهاز، ونفسه، وبعض المستخدمين بيثون تحتاج أيضا إلى استخدام توزيع مختلف الإحصاءات R.

هذا الرقم هو نتيجة لدراسة استقصائية أجريت في الأحمر الراهب 2018 الربع الثالث. يأتي بيانات المسح من تجاوز المكدس وشعبية من اللغة على جيثب، لكنه يظهر بوضوح شعبية R وبيثون مرتفعة. لذلك، ليس هناك من سبب متأصل لماذا لا يمكننا استخدام سواء في نفس الوقت على نفس المشروع. هدفنا النهائي ينبغي أن يكون أفضل تحليل وفهم أفضل، يجب اختيار لغة البرمجة لن تكون عقبة أمام تحقيق هذا الهدف.

R واستعراض بيثون

دعونا ننظر اللغات التالية فضلا عن مزاياها وعيوبها.

الثعبان

منذ صدوره عام 1991، وكان بيثون شعبية جدا وتستخدم على نطاق واسع في معالجة البيانات. المزايا هي:

وجوه المنحى اللغة.

مجموعة واسعة من الاستخدامات.

* هناك العديد من ملحقات (وظائف) وبدعم قوي من المجتمع.

بسيطة وسهلة الفهم والتعلم.

* في هذه الباندا حزم، نمباي وscikit التعلم، بيثون هو خيار ممتاز لأنشطة التعلم الجهاز.

ومع ذلك، فإن R مختلفة، بيثون لا عروض خاصة لإجراء العمليات الحسابية الإحصائية.

R

R صدر الإصدار الأول في عام 1995، ومنذ ذلك الحين أصبحت واحدة من أداة في هذه الصناعة الأكثر استخداما للبيانات العلمية.

حزمة التثبيت تتضمن التطبيقات الإحصائية التي يمكن تصورها تقريبا. لديها كرا حاليا أكثر من 10K الحزمة.

* مجهزة كاملة؟ مكتبة التصور، مثل ggplot2.

أن يكون قادرا على إجراء تحليل مستقل.

أداء جيد للغة R ليست الذاكرة أسرع، وأحيانا أكثر من اللازم عند العمل مع مجموعات كبيرة من البيانات.

الاستفادة الكاملة من كل من اللغات

في نفس الوقت يمكننا استخدام القدرات الإحصائية وبيثون قدرات البرمجة من R؟ عندما يمكننا بسهولة تضمين كود SQL في R أو بيثون النصي، لماذا لا تخلط R وبيثون معا؟

هناك أساسا طريقتان يمكن استخدامها في وقت واحد في مشروع R. بيثون واحد و

R المستخدمة في بيثون

PypeR

(Http://bioinfo.ihb.ac.cn/softwares/PypeR/)

يوفر PypeR طريقة بسيطة للوصول إلى بيثون عبر خط R. PypeR أيضا المدرجة في مؤشر بيثون حزمة، التي تنص على تثبيت أكثر ملاءمة. عندما لا نقل البيانات التفاعلية متكررة بين بيثون وR، PypeR مفيدة بشكل خاص. خط أنابيب يمر عبر R، برنامج بيثون في منصات نظام التشغيل عملية (بما فيها ويندوز، GNU لينكس وماك OS) التحكم في العمليات الفرعية، ومراقبة الذاكرة والمرونة لا يمكن أن يتحقق من حيث قابلية.

PyRserve

(Https://pypi.org/project/pyRserve/)

تستخدم pyRserve Rserve كبوابة اتصال RPC. من خلال هذا الصدد، يمكن تقديم R مع متغير بيثون، قد يكون R استدعاء دالة النائية. كائنات R مع حالات فئة تنفيذها في بيثون كشفت، في كثير من الحالات، R بوصفها وظيفة من ربط هذه الكائنات.

Rpy2

(Https://rpy2.bitbucket.io/)

rpy2 تشغيل عملية بيثون جزءا لا يتجزأ من R. يخلق الإطار، يمكن تحويلها إلى كائنات كائن R بيثون، ويمر بها على وظيفة من R، R وإخراج العودة تحويلها إلى كائن بيثون. rpy2 أكثر شيوعا، وفي التنمية النشطة.

ومن مزايا استخدام R في بيثون يمكن استخدامها بسهولة في بيثون R مجموعة من البرامج القوية، مثل ggplot2، tidyr، dplyr مثل. وكمثال على ذلك، دعونا ننظر كيف رسم الخرائط ggplot2 في بيثون.

المشهد الأساسي

https://rpy2.github.io/doc/latest/html/graphics.html#plot

الهندسة

https://rpy2.github.io/doc/latest/html/graphics.html#geometry

بيثون المستخدمة في R

يمكننا استخدام طريقة بديلة حيث ما يلي البرامج النصية تعمل في بيثون R:

RJython

(Https://r-forge.r-project.org/projects/rjython/)

هذه الحزمة من قبل واجهة جيثون بيثون تحقيقه. وهي مصممة بحيث حزم أخرى يمكن أن تكون جزءا لا يتجزأ كود الثعبان مع R.

RPython

(Https://cran.r-project.org/web/packages/rPython/index.html)

يسمح rPython R للاتصال حزمة بايثون. تشغيله في R بحيث رمز بيثون، استدعاء دالة، واسترداد توزيع المتغيرات ممكن.

SnakeCharmR

(Https://github.com/asieira/SnakeCharmR)

SnakeCharmR هو rPython النسخة الحديثة. هو 'rPython "فرع، فإنه يستخدم" jsonlite ستكون له الكثير من التقدم والمكان نسبة rPython.

PythonInR

(Https://bitbucket.org/Floooo/pythoninr/)

PythonInR من الداخل من خلال توفير الوظائف التفاعلية مع بيثون، بحيث R الداخلي من بيثون بسهولة جدا.

شبكي

(Https://github.com/rstudio/reticulate)

توفر حزمة صافي مجموعة شاملة من الأدوات لقابلية التشغيل البيني بين بيثون وR. في جميع الخيارات المذكورة أعلاه، وهذا هو الأكثر استخداما على نطاق واسع، ولكن أيضا لأنه يجري تطويرها بنشاط Rstudio. شبكي جزءا لا يتجزأ من بيثون R جلسة محادثة سلس إمكانية التشغيل المتداخل عالية الأداء. وتمكن هذه الحزمة التي لشبكة رمز بيثون إلى R، لإنشاء مشروع جديد سوف نسج معا لغتين.

توفر حزمة صافي التسهيلات التالية:

في طرق مختلفة للاتصال بيثون من R، بما في ذلك R تخفيض السعر، والحصول على بيثون النصي لاستيراد وحدات بيثون وتفاعلي باستخدام بيثون في جلسة R.

التحويل بين الأشياء وبيثون R (على سبيل المثال، R والباندا بين إطارات البيانات، أو بين R و نمباي مصفوفة مجموعة).

ربط مرنة لإصدارات مختلفة من بيثون، بما في ذلك البيئات الافتراضية والبيئة كوندا.

استنتاج

R وبايثون هي لغة قوية جدا، أي لغة هي كافية لتنفيذ مهام تحليل البيانات. ومع ذلك، وهذا هو بالتأكيد بعض مزايا وعيوب كل من، إذا نحن قادرون على الاستفادة من الاثنين معا، يمكن أن نفعل ما هو أفضل. في أي حال، فإن الفهم الكامل اثنين تسمح لنا بالعمل في أكثر البيئات.

لماذا لعنة الأبعاد؟ كيفية حل؟

تشجيانغ تعزز بقوة التنمية المتكاملة لمنطقة دلتا نهر اليانغتسى لبناء فريق المدينة من الطراز العالمي

70 عاما منذ اليوم، عقد جيش التحرير الشعبى الصينى في بكين يدخل المدينة، وترك تلك الصور القديمة الثمينة!

محرك أقراص الشبكة UC جديدة على الخط: السوبر الفروع في الشهر الأول من 9.9 يوان التمتع الفضاء 6T

تشجيانغ تعزز بقوة التنمية المتكاملة لمنطقة دلتا نهر اليانغتسى لبناء فريق المدينة من الطراز العالمي

Jingdong تعبير عن الخدمة الشخصية على الخط، الجبهة الحظ فقط جيدة، وتفقد رسوم تسعة الأجر الأدنى

اليوم صوت الأساسية | سامسونج هواوي أكره مرة أخرى: نحن من الأول من الكاميرا

لعب الدخن الإصدار الجديد الذاكرة 6GB: 1299 يوان

حتى النهاية لك! الدقيقة الرسالة التي صدرت أمس، وهما العملية "وظيفة"

طليعة هذه الصناعة: الجمع بين المنطق والشبكات العصبية ILP، فإنه لديه ميزة مدرستين

100M المحمول ذات النطاق العريض مجانا لنقول جيدة، ولكن لم أكن أتوقع مثل هذا اللعب الروتيني معي

شمال بنغ يوزين: تحليل المعلومات الاستخبارية وسائل الإعلام عبر تطبيق