البيانات الكبيرة في Hadoop خلية التعلم خارطة الطريق

 في السنوات الأخيرة، مع شعبية للمنتجات الإنترنت، وهو مزيج من الانترنت وغير متصل. شركات الإنترنت والشركات التقليدية توجه عن كثب. وهذا التغيير وتسمح للمستخدمين لدفع المزيد من الاهتمام لتطوير التمتع البصرية، وأصبح تطوير التكنولوجيا بيانات كبيرة جدا تقدر على نحو متزايد من قبل الشركات. في الوقت الحاضر، وتطوير البيانات الكبيرة الضخمة والكوادر الفنية تتطلب الفجوة. 2017، وتدريب الكوادر الفنية لتطوير Hadoop يصبح من المهم على نحو متزايد.

 في Hadoop الخلية هي المنتجات مستودع البيانات، خلية أكبر ميزة هي لتوفير مثل SQL بناء الجملة، بتغليف عملية مابريديوس الأساسية، بحيث رجال الأعمال لديهم بيانات كبيرة على أساس SQL، يمكن تشغيلها مباشرة Hadoop. وهذه نقطة لحل عنق الزجاجة من محلل البيانات الخام لتحليل البيانات الكبيرة.

 بناء دعونا تصل البيئة خلية لمساعدة غير مطوري يمكن أن نفهم على نحو أفضل البيانات الكبيرة.

  1. خلية مقدمة

 خلية نشأت في الفيسبوك، والذي يسمح الاستفسارات SQL ضد Hadoop وقت ممكن، حتى أن غير المبرمجين يمكن استخدامها بسهولة. ويستند خلية على أدوات تخزين البيانات Hadoop، يمكنك تعيين هيكل ملف البيانات إلى جدول قاعدة البيانات ويوفر الاستفسارات SQL الكاملة، يمكنك تحويل البيانات SQL لتشغيل المهام مابريديوس.

 ويستند خلية على البنية التحتية مستودع البيانات Hadoop. وهو يوفر مجموعة من الأدوات التي يمكن استخدامها لتحميل التحول استخراج البيانات (ETL)، وهو مخزن، الاستعلام، وآليات البيانات على نطاق واسع المخزنة في تحليل Hadoop. خلية يعرف مثل SQL لغة الاستعلام بسيطة تسمى HQL، الذي يتيح للمستخدمين دراية SQL لبيانات الاستعلام. في نفس الوقت، واللغة كما يسمح للمطورين دراية مابريديوس المطور من مخطط الذات والمخفض محددة للتعامل مع تحليل مركب المدمج في مخطط والمخفض لا يمكن أن تكتمل.

  2. خلية التعلم خارطة الطريق

 المعرفة خلية، لقد سردت في الشكل، يريد مساعدة الآخرين فهم أفضل للخلية.

 ثانيا، استخدم خبرتي، لا الاختصار واحد. تخفيف أسفل القلب، فإنه ليس من الصعب ذلك.

  3. I تجربة استخدام

  يمكنني استخدام خلية ديك اعتبارين:

 1. المحللين بيانات مساعدة أي خبرة التنمية، والقدرة على التعامل مع البيانات الكبيرة

 2. بناء على موحدة مابريديوس عملية التنمية

 1) يساعد المحللين بيانات أي خبرة التنمية، والقدرة على التعامل مع البيانات الكبيرة

 في الامتثال الكامل لمفهوم التصميم والخلية، وقد أكد ذلك، وغني عن القول.

 2) بناء عملية التنمية مابريديوس موحدة

 هذا الجانب هو الاتجاه ونحن بحاجة إلى العمل على.

 أولا، خلية تم تعبئتها مع بناء الجملة عملية SQL-مابريديوس، وعملية التعبئة والتغليف وتوحيد عملية مابريديوس.

 عندما نقوم به عمل أو أدوات، سيكون المشهد لمجموعة منطقية، وهي الطبقة الثانية على رأس حزمة يتم تغليف في الخلية. عندما تغليف الطبقة الثانية، ونحن نريد كما الكثير من التفاصيل كدرع خلية، حتى أن واجهات واحدة، وانخفاض مرونة أقل، وتبسيط البنية النحوية من HQL مرة أخرى. نلتقي فقط متطلبات النظام، واجهة معينة.

 عند استخدام واجهة الحزمة الثانية، يمكننا بالفعل لا أعرف ما هو خلية لا تعرف ما Hadoop نعم. نحن فقط بحاجة الى معرفة والاستعلامات SQL (SQL92 قياسي)، وكيفية كتابة كفاءة عالية، وكيفية الكتابة يمكن القيام به احتياجات العمل على ذلك.

 عندما انتهينا من العبوة الثانوية خلية، يمكننا بناء عملية التنمية مابريديوس موحدة.

 عن طريق التفكير على الخريطة، يمكننا توحيد تطبيقات المؤسسة لاعتماد خلية ل، وعندما رفع نوعية الموظفين، يمكن أن يكون هناك جرد خلية استبداله، مع حزمة حل أفضل الأساسية إذا كان نفس واجهة، حتى عند استبدال استخدام التجاري خلية لا أعرف، لقد حل محل الخلية.

 هذه العملية من خلال الذهاب، وهذا هو معنى. عندما كنت أفكر في بناء أدوات التحليل Hadoop إلى Hadoop خلية كواجهة الوصول هو الأكثر فعالية.

  3) المتعلقة بتشغيل وصيانة الخلية:

 لأنه يعتمد بنيت Hadoop الخلية، ببساطة، هو عبارة عن مجموعة من وصول واجهة Hadoop، خلية في حد ذاته ليس أكثر من اللازم، وبالتالي فإن تشغيل وصيانة فوق اهتمامنا على الأسئلة التالية على خط المرمى.

 1. استخدام بيانات اساسية تخزين قاعدة بيانات منفصلة

 2. تحديد مفتاح معقول وجدول التقسيم

 3. تعيين كمية معقولة من دلو البيانات

 الجدول 4. ضغط

 5. استخدام تعريف جدول خارجي

 6. السيطرة المعقولة مخطط، وعدد من المخفض

 4. حالات الاستخدام خلية

 تم تنظيم المقالات في قضية

 غزاة تركيب واستخدام خلية

 بيانات خلية في 10G اختبار

 سلسلة خلية R NoSQL من السيف

 عكس إعادة الشراء استخراج المعلومات من البيانات التاريخية مع RHive

 قبل الطلاب للمجتمع، آلاف التعليم فنغ للطلاب مساعدة في التطوير الوظيفي، السيرة الذاتية الكمال، ومقابلات وهمية، وجوانب أخرى من الطلاب وتقديم المشورة والمساعدة لتحديد موقع بدقة مواقعهم الخاصة، اضغط قدراتهم الذاتية. ليس ذلك فحسب، وهناك توصية العمل، استنادا إلى الأداء الفردي من القدرة الحقيقية، ونحن نوصي الوظائف والشركات المناسبة.

 الصورة 4.png (28.9 KB)

2017/03/1417:20

[1] لمعرفة البيانات الكبيرة، أستطيع التركيز إحالة التعليقات أدناه، بريد إلكتروني خاص "المواد".

[2] بعض المعلومات لديها مهلة زمنية، واغتنام الوقت الآن!

أشكركم على دعمكم!

البيانات الكبيرة مسار التعلم

حالة واتجاهات تطوير البيانات الكبيرة

فشلت تشاو Mingxiu مجد V204800 كاميرا وان: CEO المدونات الصغيرة حل شخصيا

هذه المنتجات يمكن أيضا أن تكون مأخذ ذكي استخدمته ذلك؟

كنز دردشة المنحل، متعددة فلاش، المرحاض MT يكون وراء ذلك بكثير؟

المحموم ظهرت في تشاينا موبايل Fetion والشحن المدونات الصغيرة: التعاون؟

أكاديمية الصينية للعلوم الدكتوراه طالب تشن الشعر الجمعية المزيد من نهائيات للفوز القوة العسكرية للتفسير "آلهة محاربة"

رمي الرصاص الكرة للصراع، يستبروك وكارتر الشجار كل أكل خطأ تقني

Hadoop التكنولوجيا من الداخل: رؤى جاهزة Hadoop Hadoop وHDFS كود 1.3 مصدر

تفسير أول شارع بعد إدراج أرباح الفطر: صافي خسارة ضاقت إلى حد كبير سقف الأرباح التنمية

Hadoop التكنولوجيا من الداخل: رؤى جاهزة Hadoop وHDFS 1.2 مصدر البيئة مدونة القراءة

أرباح لينوفو مما كان متوقعا، ولكن أسوأ أيام قد بدأت للتو فقط