حصريا | هارفارد أستاذ مفتوح المصدر R اللغة، يعلمك لجعل الرقم العمل GIF مع R

العنوان الأصلي: مدونة متحركة التعليمية بلدي

المؤلف: رافائيل ايريزاري

الترجمة: جيا لين

طول هنا 1800 كلمة القراءة الموصى بها 4 دقيقة

رافائيل ايريزاري هو تطبيق أستاذ الإحصاء في جامعة هارفارد ومعهد دانا فاربر للسرطان، ركز على دراسة علم الجينوم، وأستاذ العلوم البيانات على عدد من البوابات الدورات. في هذه المقالة هو تفصح عن رمز المصدر لغة R نفسك GIF الرقم العمل عند استخدام التدريس، ولكن أيضا على العديد من الموضوعات في معرض بسيط لتريد أن تعرف البيانات من المبادئ العلمية، وكيفية استخدام اللغة R لتصور القراء لدينا المساعدة.

في سياق التدريس اليومية، وأنا في بعض الأحيان استخدام الرسوم المتحركة لبصريا شرح المفاهيم والمشاركة على وسائل الاعلام الاجتماعية من خلال حسابrafalab (https://twitter.com/rafalab).

طلب جون ستوري مؤخرا إذا كان بإمكاني فتح شفرة المصدر. وبما أنني لست منظم جدا، وهذه الرسوم المتحركة هي مصدر إلهام للخروج، وذلك قبل لا يرتبط المنتشرة التعليمات البرمجية في عدة ملفات. طلب جون دفعني لوضع هذا النوع من التعليمات البرمجية نشرها هنا.

يتم فرضه عن الرقم العمل GIF مع لغة R رسم بعض الصور من. في رمز ترون، لقد استخدمت عدة أساليب مختلفة لفصل الصور في خريطة GIF حيوية. الطريقة الأولى (غير مستحسن) هو ملفات الصور المخزنة، ومن ثم استدعاء أداة تحويل يماغيماغيك (https://www.imagemagick.org/script/index.php). في بيئة R، طريقة استخدامها الآن saveGIF حزمة وظيفة الرسوم المتحركة، والتي تعلمت في بلدي بلوق simplystats التعليقات التالية من قبل القراء يي شيه. عندما تعادل مع ggplot، وأود أن استخدام ديفيد روبنسون من حزمة gganimate (https://github.com/dgrtwo/gganimate). والأسلوب الأخير هو عندما إضافة المؤثرات الخاصة (مثل المرحلة التحوير) سيتم استخدامها: صانع اون لاين المتحركة GIF (https://ezgif.com/maker).

ما يلي هو رمز مصدر الرقم العمل GIF، I فرز عموما شعبية. لأن يتم كتابة التعليمات البرمجية في عجلة من امرنا، من فضلك لا يكون من الصعب جدا على لي. في الواقع، أنت حر في انتقاد، هذه هي الطريقة التي نتعلم.

مفارقة سمبسون

هذا هو ذكر مفارقة اف سمبسون: نحن نرى X و Y المتغيرات لها ارتباط سلبي قوي. ومع ذلك، مرة واحدة كنا الطبقات مع عامل الخلط Z متغير، بألوان مختلفة لتمثيل Z، سيتم تحويل كل طبقة من أهمية في وجود علاقة إيجابية. البيانات هنا هي وهمية، ولكن على افتراض أن قال X يمثل عدد من الطلاب للمشاركة في تقديم المشورة، ودرجات الاختبار Y يمثل الصف التاسع، ثم استخدام درجات الاختبار لطلاب الصف الثامن والطبقية إلى Z، سوف نجد أيضا هذه الظاهرة.

هذا الرقم عمل تتكون من ثلاث صور فقط. يمكنني استخدام وظيفة RStudio تصدير منهم البقاء على قيد الحياة، ثم استخدم صانع الرسوم المتحركة GIF (https://ezgif.com/maker) لجعل المتحركة. وفيما يلي ثلاث صور هذا الرمز:

محليا الانحدار المرجح تجانس مبعثر (اللوس)

أشارك أول التدريس FIG المنقولة لشرح مبعثر المرجحة محليا الانحدار تجانس (اللوس) من حيث المبدأ. على وجه التحديد، لدينا لكل متغير مستقل، مثل X0، ويسمح أن يكون له أي قيمة إيجابية الترجيح قرب نقطة، خط المرجحة الانحدار مناسبا، والاحتفاظ بعد تركيب النتائج التي تم الحصول عليها، ومن ثم ينتقل إلى النقطة التالية .

المصدر هنا هو التجارب رقاقة الجينات. هو مبين في الشكل. FIG MA، أي نسبة لوغاريتم العلاقة بين متوسط العدد. يمكنني استخدام حزمة الرسوم المتحركة لحفظ الرقم العمل المتحركة.

العمر المتوقع عند الولادة مقابل الخصوبة

هذا الرقم العمل GIF هو نسخة هانز روزلنج (https://en.wikipedia.org/wiki/ Hans_Rosling) في محاضرته "إن النتائج الجديدة على الفقر" (رؤى جديدة حول الفقر، (https://www.ted.com / محادثات / hans_rosling_reveals_new_insights_on_poverty؟ لغة = EN)) الرسوم المتحركة المعرض. هذا الرقم هو أيضا لإظهار دور التصور البيانات في سوء الفهم والقضاء، ويظهر هانز روزلنج هذا الرقم العمل هو الآن منذ 40 سنوات ليست بسيطة بقدر الإمكان إلى تقسيم العالم إلى نصفين. قبل، والناس عموما لديهم حياة أطول من العالم إلى الدول الغربية أقل ثراء على حجم الأسرة وأقصر العمر المتوقع، فإن عدد سكان كثير من الأسر في البلدان النامية، ويبين هذا الرسم البياني لاعقلانية هذا التقسيم.

شكرا حزمة gganimate، والرموز المستخدمة في رسم هذه الخريطة هو في غاية البساطة.

وضع الانتخابات للامم المتحدة

هنا، ونحن نستخدم إريك Voeten وانطون Strezhnev البيانات الانتخابية المقدمة من الأمم المتحدة لشرح مفهوم المسافة.

هنا هو رمز. يتم توفير بيانات رمز التشطيب ديفيد روبنسون (https://twitter.com/drob). سترى أننا سنكون على مسافة زمنية متفاوتة ممهدة، وبالتالي تجنب بعض نقطة في ضرب نطاق كبير جدا.

الغابات عشوائية

في الماضي فترة طويلة جدا من الزمن، أجد أنه من الصعب أن نفهم لماذا كانت الغابة عشوائية كما خوارزمية القائم على شجرة قادرة على انتاج توقعات على نحو سلس. الشكل GIF هنا لمساعدتي في فهم لماذا. يمكنني استخدام قاعدة البيانات 2008 الانتخابات الرئاسية، لأنني أعتقد أن الاتجاه العام للبيانات على نحو سلس، ولكن هناك عدد قليل من حواف حادة، حتى المرجح محليا الانحدار مخطط التشتت تجانس يصعب التنبؤ بها. علما بأن لدينا سوى عامل واحد، ولا يمكن شرح هذا GIF ميزة أخرى هامة من الغابات العشوائية: عشوائية اختيار ميزة يمكن أن تقلل من درجة الارتباط بين الشجرة وكانت الشجرة.

تستطيع أن ترى الطريقة التي تستخدم في رمز تقليدية، وأنا لا أنصح طرق: إنقاذ جميع ملفات الصور وثم استدعاء تحول نظام القيادة.

مغالطة البيئية

في تحريك سهم خريطة بعد مفارقة سمبسون، سألني بعض الناس مغالطة البيئية ليست هي نفس الوضع. في الواقع، وهما مختلفان. مغالطة البيئية هي أن نحاول أن نستنتج وجود علاقة بين الأفراد من خلال المتوسط ارتباط قوي. إلى أفضل تفسير، I dslabs حزمة يأتي مع البيانات رسم بياني ( التحرك لوضع خريطة تبين لوغاريتم عدد بقاء الأطفال حديثي الولادة من الدخل اليومي متوسط العلاقة بين. تستطيع أن ترى سواء على المستوى الإقليمي هو درجة عالية جدا من الارتباط، ولكن ارتباط منخفض جدا على جميع المستويات الوطنية. وذلك لأن الخلافات بين دول المنطقة بنفس النتيجة في البلاد.

الرقم العمل

يتكون هذا اف فقط من ثلاثة أرقام. I حفظ صورة باستخدام وظيفة التصدير RStudio، ثم استخدم صانع الرسوم المتحركة GIF (https://ezgif.com/maker) لجعل المتحركة.

الرقم الأول هو المتوسط في المنطقة؛ قيمة أفريقيا جنوب الصحراء الكبرى، يمكنك ان ترى ينقسم المتوسط إلى عدد من قيم مختلفة، وثالثا هو الحال في جميع البلدان. I تغيرات ملحوظة في بعض البلدان الكبرى (مقارنة بالمنطقة)، ومع من عمى الألوان يمكن تحديد الألوان. هنا هو رمز معقدة بعض الشيء، لأنه كان على تجهيزها البيانات Gapminder.

قانون بايز ل

هذه الخريطة المتحرك البسيط العرض هو يطبق طريقة التشخيص الدقيق جدا لحدوث منخفض جدا من الجماعات التشخيص. فإنه يدل على أنه، في تشخيص يعرف احتمال مسبق من حدوث حالات نقص إيجابية، أي أقل من أول اختبار لدقة التشخيص. يمكنك استخدام قانون بايز لتحديد الاحتمال الشرطي صحيح. لمزيد من التفاصيل، يرجى الرجوع إلى هنا (https://simplystatistics.org/2014/10/17/bayes-rule-in-a-gif/).

الرقم العمل

لأننا يجب أن نفعل خريطة ديناميكية، رمز لديه بعض التعقيدات.

بكمن

وأخيرا، وأنا قدمت هذه الرسوم المتحركة لتظهر لك فقط استخدام الرسم البياني.

الرقم العمل

الرابط الأصلي:

https://simplystatistics.org/2017/08/08/code-for-my-educational-gifs/

المحرر: هوانغ Jiyan

أكثر إثارة يرجى الانتباه إلى جامعة تسينغهوا - معهد العلوم وبيانات القناة الصغيرة تشينغداو منصة الرسمية العامة "THU فصيل البيانات"

قاعدة السحابة بكين الصيد مشترك سحابة نسيج فحم الكوك "AI +" حملة ترويجية خاصة، 7 مشروع الحملة الترويجية خبز طازج

اكفاء المواهب التقرير بيانات الكبير: تدفق علاج الدرجة المتوقع أن تكون مكسورة في مكان العمل

وراء "منشارا الدموي ريدج"، والعنف القاتل متجذرة في الجينوم البشري

شبكة فول الصويا: قناة الدقيقة 60 ثانية لكسر القيود المفروضة على الصوت، والصوت المحتوى أدوات حية مساعدة أصحاب المشاريع

الحصول على حجز للعب 24 ثانية! سوبر استنساخ رائع المشهد، U23 مراهق 1 الخطوة مذهل!

"مزدوجة 11" 10 سنوات لتغيير طريقة عيش الناس والشهود الذين لا يعرفون شيئا عنك

سوبر GIF- والصراع! تشانغ تشاو سحبت تقريبا أسفل المساعدات الخارجية الكبيرة، وحاصرت الناس في الحكم

حصريا | علم الغابات عشوائية

حفر شعب أيسلندا حفرة سخونة في العالم، إلى الطاقة لالصهارة

انتظرت 1996 يوما! سجلوا أخيرا الكرة الأولى فائقة، والجمهور تحول يا رجل يلعب الأمواج!

العلوم البيانات نظرة عامة المادة بانوراما: قانون الخوارزمية، ونوع المشكلة ......

السابق 2-11، منطقة التقليدية من المنافسة التجارية