دليل المبتدئين كاساندرا

الكاتب | تشو Mingyao

تحرير | الرماد

هذا المقال هو نص العلم، كاساندرا للمبتدئين.

مقدمة أساسية

أباتشي كاساندرا هو توزيع قواعد البيانات غير العلائقية، والأداء الرفيع، قابلة للتطوير، وخصائص لذلك لا مركزية. قاعدة بيانات كاساندرا مناسبة لسيناريوهات الأعمال الشبكات الاجتماعية، لمعالجة المعاملات في الوقت الحقيقي، وتوفير البيانات التفاعلية. دينامو الأمازون في قاعدة بيانات موزعة بشكل كامل كأساس، بالتزامن مع جوجل جداول كبيرة عمود الأسرة (عمود الأسرة) نموذج البيانات استنادا إلى تحقيق تخزين P2P اللامركزية.

مفتاح معلومات مقدمة

صفوف المفهوم: وهناك مجموعة من البيانات يحتوي على أزواج اسم القيمة يسمى صف (الصف)، ولكل مجموعة من أزواج الاسم القيمة (اسم / قيمة زوج) ويسمى عمود (عمود). يتم تخزين البيانات فضفاض الجدول هيكل Duoweihaxi في قاعدة البيانات، ما يسمى بنية مفتوحة، ويشير كل صف إلى صف يمكن أن يكون لها بنية مختلفة، كما هو مبين:

سوبر العمود: يمكن سوبر الأعمدة إنشاء ارتباط بين الأعمدة، أعمدة الدعم إضافة إلى الأعمدة فائقة الفرعية.

Keyspaces: قد يكون مفهوما كاساندرا حاويات البيانات مفتاح الفضاء، وقاعدة بيانات علائقية وقاعدة البيانات (قاعدة بيانات). لKeyspace، يتم تعريف عدد نسخة من العقد يتألف تعريف كل صف من البيانات في سياسة الإحلال حلقة التجزئة متسقة من عقدة في العمود المجموعة (الأسر العمود) وغيرها من المفاهيم.

عائلة الأعمدة: حاوية العمود، وهيكلها مثل جدول أربعة Weiha شي، .

عمود: وهناك مجموعة من أزواج مفتاح القيمة.

مبادئ CAP

CAP من حيث المبدأ (المعروف أيضا كوسيلة نظرية CAP أنه في نظام توزيع والاتساق الاتساق، وتوافر توافر والتقسيم أقسام التسامح الخطأ والتسامح، وثلاثة لا يمكن أن يكون على حد سواء) على، HBase تحديد CP، كاساندرا هم أكثر ميلا ل AP، ولكن في الواقع كاساندرا الاتساق هو قابل للتعديل، ليست ثابتة هو الاتساق في نهاية المطاف. قاعدة بيانات محددة المقابلة CAP "الوقوف في" الوضع، يمكننا أن نرى في الصورة أدناه:

تاريخ الإصدار

V0.6: الإصدار الأول صدر في وقت لاحق في أبريل 2010، ليصبح المشروع أباتشي المستوى الأعلى. وتشمل الخصائص:

  • وHadoop التكامل، مما يسمح لقراءة البيانات من كاساندرا عن طريق مابريديوس

  • خط التخزين المؤقت المتكاملة، كاساندرا الحد من الاعتماد على تقنيات التخزين المؤقت أخرى

  • V0.7: كانون الثاني 2011، يحتوي على خصائص ونقاط التحسين:

  • مؤشر الثانوي، ومؤشر يتيح بناء على حقل المفتاح الأساسي غير

  • على نطاق واسع تصميم خط الدعم، يمكن أن تحتوي على ما يصل الى 2 مليار الأعمدة

  • دعم التغيير وضع على شبكة الإنترنت، بما في ذلك زيادة البيئة العنقودية على الانترنت، وإعادة تسمية، إزالة، وإلى الأسرة KeySpaces

  • وقت انتهاء الصلاحية يمكن تعيينها من قبل TTL العمود (الوقت للوصول الى حي) خصائص كل عمود

  • إدخال NetworkTopologyStrategy، ويدعم نشر مركز متعدد البيانات، مما يسمح KeySpace عبر النسخ مراكز البيانات من التكوين

  • ملفات التكوين من صيغة XML إلى YAML أكثر قابلية للقراءة

  • V0.8: في يونيو 2011، وهذا هو يتضمن بيان ترقية رئيسي الميزات:

  • إضافة نوع البيانات الجديدة عدادات -Distributed، زيادة عداد للبيانات الاستيراد مقدمة sstableloader الدعم أداة دفعة

  • إدخال مخبأ للشخص العادي كومة، مما يسمح للذاكرة المحلية المتاحة للاستخدام خارج كومة الذاكرة JVM

  • السماح مواضيع متعددة لتنفيذ في ضغط مواز، ضغط من قدرة SSTable للحد من تدفق

  • تحسين معلمات تكوين الذاكرة، مما يتيح السيطرة أكثر مرونة من حجم memtables

  • V1.0: أكتوبر 2012، وبعد إطلاق سراح بدأت العديد من الشركات المصنعة لاستخدام كاساندرا في بيئة الإنتاج. وتشمل الخصائص:

  • CQL العديد من التحسينات، بما في ذلك القدرة على الجداول التغيير والصفوف، العد والدعم TTL، الحصول على العد

  • وهو يدعم استراتيجية ضغط متعددة، وتقديم الدعم سرعة وصول أسرع

  • الملفات المضغوطة SSTable، يتم تكوينه على أساس مستوى الجدول

  • V1.1: في نيسان 2011، ويتضمن ميزات:

  • CQL3 زيادة نوع timeuuid، ودعم استخدام طرق المفتاح الأساسي المركبة لإنشاء جدول

  • دعم "ترتيب حسب" فرز البيانات

  • الدعم الاستيراد والتصدير عبر CSV ملف أداة cqlsh

  • انها تسمح البيانات التي يتم تخزينها في شكل جدول على القرص أو SSD

  • مخطط في الجدول تخزينها في نظام

  • يسمح حجم ذاكرة التخزين المؤقت التكوين keyspace

  • على أساس اعتماد من العزلة على مستوى الصف، لمنع تحديثه أو مكتوبة في أعمدة متعددة تظهر عند قراءة القذرة الظاهرة

  • V1.2: في يناير 2013، ويتضمن ميزات:

  • CQL3 نوع جديد مجموعة (مجموعات والقوائم والخرائط)، وبروتوكول ثنائي جديد ليحل محل التوفير

  • أداء عقدة افتراضية تدعم توزيع البيانات عبر العقد في الكتلة، ترقية عقدة جديدة أو استبدال

  • زيادة وضعية التتبع، مما يسمح للعملاء لعرض التفاعل بين العقد القراءة والكتابة

  • يتم نقل جميع هياكل البيانات من الذاكرة إلى ذاكرة كومة JVM المحلية

  • V2.0: في يونيو 2015، وهذا الإصدار هو علامة بارزة، ليس فقط لتعزيز أداء على نطاق واسع، وتصل إلى 5 سنوات على حل الكثير من الديون التقني. وتشمل الخصائص:

  • بروتوكول باكسوس اضاف لدعم الصفقة خفيفة الوزن

  • وتشمل التغييرات CQL3 دعم دلالات القيادة DROP ALTER، والظروف الوضع جديدة (في حالة وجود، IF NOTEXISTS)، يسمح بإنشاء مؤشر اثنين على حقل المفتاح الأساسي

  • تحتاج Java7 وقت التشغيل

  • يتم تشغيل إدخال آلات لعملية الكتابة، على الزناد يمكن تنفيذها في أي لغة JVM

  • V3.0: في نوفمبر 2015، وهذه النسخة يستخدم إنتل اختراع "القراد توك نموذج الإفراج"، وهذا هو، إجراء تغييرات على بنية النظام في وقت قصير، وبالتالي فإن V3.0 نسخة لكاساندرا، التغييرات التي أدخلت على المخطط على مستوى معين، إصلاحات عيوب عديدة من قبل، وأكثر مناسبة للحديث عالية الأداء ومتطلبات قاعدة البيانات المتوفرة إلى حد كبير. وتشمل الخصائص:

  • إعادة الكتابة رمز المحرك التخزين، وأكثر ملاءمة بنية CQL

  • عرض فعلي جديد (وتسمى أيضا المؤشر العالمي)

  • واستنادا إلى الترجمة Java8 الرسمي وتشغيل

  • إزالة التوفير القائم واجهة سطر الأوامر (CLI)

  • كيف غير مركزية

    كاساندرا لم مركزية، كل عقدة قد تكون بمثابة دور المنسق المؤقت، قد يكون أيضا بيانات احتياطية دور، والتي أيضا الوسائل التي لا يوجد فرق بين كافة العقد، وليس الخلافات، لأن كل الأفعال وفقا لقواعد مقيدة عشوائي السلوك.

    لدعم بدون حاجز المركز وتسامحا خطأ، كاساندرا باستخدام بروتوكول القيل والقال يسمح لكل عقدة لتتبع حالة العقد الأخرى من المعلومات العنقودية.

    يفترض بروتوكول القيل والقال (وتسمى أيضا بروتوكول القيل والقال) عموما أن الشبكة عرضة للفشل في نظام شبكة كبيرة وغير مركزية، ويستخدم أيضا لآلية النسخ الاحتياطي تلقائيا في قاعدة البيانات الموزعة. اسمها في حد ذاته يأتي من السلوك القيل والقال البشرية، يمكنك تبادل المعلومات والمهتمين في بعضها البعض. القيل والقال أكثر ملاءمة للاستخدام كمعلومات تزامن في المشهد ليس متطلبات التوحيد عالية جدا. معلومات حول تزامن وقت سجل (N)، N يمثل عدد من العقد. كل عقدة يحافظ على مجموعة من القيل والقال في الدولة، وقالت يمكن للدولة أن استخدام زوج مفتاح / قيمة التي تأتي أيضا مع رقم الإصدار رقم إصدار التحديث من دولة كبيرة.

    ما يلي هو العمل من القيل والقال:

  • وكل ثانية، النمام باختيار عشوائي عقدة في الكتلة وتهيئة الدورة النمام. كل القيل والقال جولة يحتاج إلى ثلاث قطع من المعلومات.

  • القيل والقال الأولي يرسل GossipDigestSynMessage لاختيار الأصدقاء الخاص به (العقد الأخرى).

  • عندما يحصل هذا الصديق الرسالة وإرجاع GossipDigestAckMessage.

  • عندما يتلقى ACK الأولي المعلومات من هذا الصديق، فإنه يرسل GossipDigestAck2Messae لهذا الصديق لإكمال القيل والقال.

  • وإذا أردنا أن نفهم من مستوى الرمز، كاساندرا الشفرة المصدرية التي تنفذها النمام بروتوكول الطبقة القيل والقال، سيتم تشغيل القيل والقال في الثانية تلقائيا، التعليمة البرمجية التالية ستبدأ بانتظام الطبقة GossipTask، ويقع GossipTask في الطبقة الدنيا org.apche.cassandra.gms.Gossip الطبقة الداخلية هي المسؤولة عن إدارة القيل والقال العقدة المحلية. عند بدء عقدة الخدمة، وفئة لتسجيل نفسه النمام، لتلقي معلومات الحالة النهائية.

    لا يعمل GossipTask وبعد القيل والقال تبدأ منعت على الفور listenGate هذا المتغير، عندما يبدأ القيل والقال قيد التشغيل عند الاستماع لخدمة الدعوة، كما هو موضح في التعليمات البرمجية التالية:

    بعد ذلك، النسخة الأولى المحدثة من ضربات القلب هذه العقدة، كما هو مبين في التعليمات البرمجية:

    ثم تكوين ليتم إرسالها إلى gDigests العقد رسالة أخرى، كما هو مبين في التعليمات البرمجية:

    وفي وقت لاحق، على قيد الحياة عقدة تم اختيارها عشوائيا من عقدة الإرسال، العقدة تم اختيارها عشوائيا من انتقال فاشلة. إذا كان التيار هو أقل من عدد البذور على قيد الحياة العقد بإرسال رسالة إلى نقطة التي البذور، وكما هو مبين في التعليمات البرمجية:

    والخطوة الأخيرة هي للتحقق من حالة من العقد، إذا كان العقدة قد تلقت للتو رسالة التي لم يتح لها الوقت للتعامل مع (ووقت الاستلام أقل من 1 ثانية)، أن موضوع سوف ينام ل100MS، لمعالجة الرسائل.

    كيف يتم توزيع البيانات بالتساوي

    في كاساندرا، يتم استخدام مفتاح الرمز المميز لتقسيم البيانات. كل عقدة لديها رمز فريد من نوعه، والبيانات تشير إلى مجموعة توزيع العقدة. العقد المنوال المنوال تشكل حلقة. عند استخدام مثل الاتساق التقسيم تجزئة قيمة المفتاح من قيمة التجزئة لتحديد تناسق حقيقي الذي ينبغي البيانات تنتمي رمز.

    اعتمادا على استراتيجية التقسيم، وأنواع والمبادئ المنصوص رمز يختلف أيضا. كاساندرا (V3.10 نسخة) نفسه يدعم أربع استراتيجيات التقسيم:

    • Murmur3Partitioner: هذا هو الجهاز القسم الافتراضي، الذي يقوم على أساس الصف

    • شفرة التجزئة لأهم حقول موزعة بالتساوي، وتوفر هذه الاستراتيجية وظيفة تجزئة بشكل أسرع.

    • RandomPartitioner: هذا المجزىء المجزىء هو عشوائي، والخصائص الأساسية وMurmur3Partitioner ما شابه ذلك، ولكن يمكن استخدام القيمة MD5 البعثرة المحسوبة، لالتطبيقات الأمنية العليا.

    • ByteOrderedPartitioner: استخدام البيانات بايت صف مفتاح فقا لنوع، قسم الدعم صف مفتاح تتراوح استفسار.

    • OrderPreservingPartioner: هذا التقسيم هو أيضا صف مفتاح الاستفسارات مجموعة الدعم. ويستخدم ترميز UTF-8 صف مفتاح الفرز.

    كيفية تحديد العقد تستخدم للقراءة والكتابة

    اعتمد كاساندرا نهج يسمى يخبر عنه (مخبر) يتم تحديد نسبة إلى مسافة الرئيسية لكل عقدة في الكتلة، والذي يستخدم لتحديد العقدة لاستخدامها في القراءة والكتابة. يخبر عنه معلومات طوبولوجيا الشبكة بالكامل التي تم جمعها حتى كاساندرا بكفاءة طلبات الطريق.

    عندما بدء كاساندرا طلب للقراءة، فإنه يحتاج مستوى الاتساق من خلال التفاعل مع العديد من مجموعة النسخ الاحتياطي. من أجل توفير طلب أقصى سرعة قراءة، كاساندرا اختيار نسخة واحدة من الكائن بأكمله عن الاستفسارات وطلبات للحصول على نسخ إضافية لأداء قيمة التجزئة، لضمان الحصول على أحدث نسخة من البيانات المطلوبة. دور واش هو مساعدة تحديد أي نسخة هي أسرع العودة، وهذا يحتاج إلى تحتوي على نسخة من جميع الاستفسارات البيانات.

    كاساندرا الحالية لمختلف العروض هندسة الشبكات كانت مجموعة متنوعة من حلول أخبر عنه الخوارزمية، حقق كل واش اجهة IEndpointSnitch. يخبر عنه مقسمة حاليا إلى ثلاثة أنواع وفقا لتحقيق ما يلي:

  • SimpleSnitch: هذه الاستراتيجية لا تعترف مركز البيانات والمعلومات الإطار، ومناسبة للاستخدام في مركز بيانات واحد؛

  • NetworkTopologySnitch: توفر هذه الاستراتيجية مخطط الشبكة لتوجيه الرسائل بشكل أكثر كفاءة.

  • DynamicEndPointSnitch: هذه الاستراتيجية قد سجل الفاصل الزمني بين العقد الاتصالات، وتسجيل السرعة من الاتصالات بين العقد، وذلك لتحقيق حيوي حدد معظم العقدة المناسبة.

  • كتب في الماضي

    هذه المادة هي في المقام الأول للمبتدئين كاساندرا، يدخل الأولى المفاهيم الأساسية والتعاريف الأساسية، وكاساندرا حتى جعل كامل نسخة V3.0 عملية النشر ملخصا موجزا، ومن ثم التركيز على آليات التنفيذ لغير مركزية، وخاصة آلية رسالة الاتصالات ، جعلت بيانات عقدة تخزين آلية المعلومات الإحصائية بعض المناقشات. سوف يحد من طول المتابعة تكون مخصصة لكتابة المقالة للحصول على شرح متعمقة شواهد القبور، فلاتر بلوم، SEDA هذه المفاهيم الثلاثة.

    إدخال المؤلفين

    تشو Mingyao 2004، تخرج من جامعة تشجيانغ، والهندسة. 13 عاما من الخبرة لتطوير البرمجيات والتكنولوجيا ما يقرب من 10 عاما من الخبرة إدارة الفريق، 4 سنوات من الحوسبة الموزعة، تجربة تكنولوجيا البيانات الكبيرة. مؤلف كتاب "غربا جافا ضبط الأداء"، "في عمق فهم من JVM وG1 GC"، "تقنية القيادة - كيف يمكن زراعة الرمز مع الفريق" الشخصية مايكرو الإشارة michael_tec، الرقم الشخصي العام "، وقال مايك العم 10:00 كل ليلة".

    نص اليوم الموصى بها

    انقر أدناه لقراءة الصورة

    اختبار قد مات؟ لا أعتقد ذلك!

    190324 "، وقال الحكم لقومية تشوانغ روي،" جي المعرفة المتقدمة! تشير المعرفة هذا الأسبوع تحصل عليه؟

    رؤية ريو كيف يمكن للعالم الحقيقي "تتحرك" على السحابة؟

    صوفي لاول مرة مهرجان بكين السينمائي، سرقة الأضواء وقلادة من الزمرد ليس فقط في خطابه استشهد أيضا محاورات كونفوشيوس

    "ذاكرة الحصرية" نبيلة براقة، لعبت في الفيلم الشهير ستيفن تشو، وكان للعب مع تشنغ شوانغ

    وجيليان تشونج دونج جي هو أيضا من العمر 38 عاما، والفرق بين المكرر و "القذرة" في لمحة!

    "التنين كويست X" 10 نوفمبر مفتوح بداية الاختبار

    190324 للجماهير "، نتزوج،" لا يدع مجالا ل"الجدار الحديدي الملك" فتيان بانقتان JIN

    بعد الدفع بواسطة الهاتف النقال مفتوح، ماذا تنتظرون لنهج "جيب التخزين"؟

    كوروساوا "راشومون" لتغيير الدراما الولايات المتحدة! سبيلبرغ التكيف للشركة للحصول على الحق في

    إدارة النفايات الصلبة G01 سويفت سيارة في سان سيرو لاول مرة منذ قرون، وعلم الجمال نية للتأثير على السوق الراقية

    "الملك وراء الكواليس" حيث البطلة هي قطعة قماش كوتاني، ومن الواضح ZhouDongYu أنا آه

    وقالت انها هي "ملائكة الكونغ فو" المال الوحيد فاتنة الساحقة الكنوز الفاعل، وهو رياضي وطني!