فكاهي: ما هي مجموعة الأحرف والترميز؟ ASCII، UTF-8، UTF-16، ثم ما هو؟

بعد الظهر

--------

في الجزء السفلي من جهاز الكمبيوتر، مثل اسمك، "منغ" ليست في الكمبيوتر في شكل النص، ولكن سلسلة من الأرقام الثنائية، مثل "011001100110 ..."

البشر لا يعرفون سوى النص، ولكن جهاز الكمبيوتر تعترف فقط 0 و 1، وكلا الجانبين لا يمكن حل وسط، ثم يجب أن يكون هناك تخطيط من النص إلى 0،1.

من النص يمكننا أن نرى تعيين 0،1 يسمى الترميز، فك بدوره دعا من 0،1 إلى النص. هذا هو معنى رمز.

لأن الكمبيوتر فقط يمكن التعامل مع الأرقام، وإذا كنت ترغب في نص العملية، فإنه يجب أولا تحويل النص إلى الأرقام لتتم معالجتها. أقرب أجهزة الكمبيوتر المستخدمة في تصميم 8 بت (بت) كما بايت (بايت)، وبالتالي، يمكن أن تمثل الأعداد الصحيحة أقصى بايت 255 (عشري 255 = 11111111 في ثنائي)، 0-255 يستخدم للإشارة إلى حجم حروف الكتابة والأرقام وبعض الرموز، ويسمى الجدول ترميز كود ASCII، مثل حروف مدونة صغيرة الترميز هو 65، z غير 122.

يونيكود يعرف ترميز الأحرف تقريبا جميع دول العالم (وهذا هو، عيناك على الطابع، مثل ABC، وشخصيات، الخ) تمثيل العدد، ولكن أيضا يونيكود متوافق مع الإصدارات القديمة من الكثير من معايير الترميز، على سبيل المثال، قد تحدث فقط حول رمز ASCII.

الجميع في بلدنا يتوافق إلى رقم فريد من نوعه، ويونيكود أيضا أصدر بطاقة هوية لكل حرف، سلسلة من معرف رقمي فريد تحدد الأحرف على هذه "الهوية".

هذه السلسلة من الأرقام الفريدة في العالم بأسره من أجهزة الكمبيوتر، سلسلة Unicode من المعرف الرقمي لاسم يسمى [نقطة كود].

"تنسيق التحول يونيكود" هو حل "نقطة رمز" في تخزين الكمبيوتر والتصميم.

"نقاط الرمز" سلسلة الثنائية التي تم الحصول عليها بعد وحدة تنسيق رسم الخرائط تحويل تسمى "الرمز" (وحدة القانون). "نقطة المدونة" هي عبارة عن سلسلة من الأرقام الثنائية، "الرمز" هي طريقة لخفض عدد ثنائي من النقاط.

على سبيل المثال، إذا كان هناك رمز حرف نقطة ثنائي تمثيل ن بايت (ن * 8 أرقام ثنائية)، التي رمز هو 8 بت (1 بايت)، ثم أنه يحتوي على عدد رمز ن.

ترميز Unicode إلى اليوم تمديد إلى 21، لماذا تمتد إلى 21 من أصل؟ لبداية، فإن الأميركيين تنظر فقط بأنفسهم أن 26 الأحرف الإنجليزية والأرقام، والمزيد والمزيد من البلدان لغة ترميز اللغة، يونيكود لا يجوز الاستمرار في التوسع، حاليا 21 بما فيه الكفاية لاستخدامها.

UTF-32 هو الأفضل فهمها. وقالت UTF-32 الوسائل التي رمزها هو 32، لقراءة حوالي 32 ياردة لكل نقطة، ويتم ترميز نقاط ترميز يونيكود على الحروف في الجبهة، وكان أطول 21، لذلك UTF-32 في قد تمثل القيم مباشرة رمز المقابلة لهذه النقطة.

ما هي المساحة الترميز؟ وقال في وقت سابق يونيكود، فإنه هو 21 بت. وهذا يوفر 21 نقطة كود 1114112، 1114112 الذي هو رمز النقاط كود الفضاء المقابلة.

وبالمناسبة هنا لأقول، حتى نقطة الكثير من رمز لا يعني أن هناك الكثير من الشخصيات، ويستخدم حاليا حوالي 10 فقط من المساحة، والمجتمع البشري لم يخلق 1114112 العديد من الشخصيات.

وينقسم إلى 17 طائرة الفضاء مدونة (طائرة)، كل طائرة لديها 65،536 حرفا (2 بايت ملء عادل، 16). ودعا 0 طائرات "الأساسية طائرة متعددة اللغات" (BMP، الأساسية طائرة متعددة اللغات)، ويغطي تقريبا جميع الشخصيات التي يمكن من أي وقت مضى الوفاء، بالإضافة إلى رمز تعبيري (التعبيرية التي تقع في رقم (1) طائرة - -). ويطلق على طائرات أخرى طائرات التكميلية فارغة في الغالب.

UTF-16 هو أكثر شيوعا بكثير، ورمزها هو 16، مما يعني أن كل 16 لقراءة حول النقاط رمز للحصول على أول نقطة رمز المكون من 16 حتى يتم الانتهاء من القراءة.

ترميز مكانيا استخدام ها، كل نقطة رمز BMP طائرة (أي إلى حد كبير أمام وقال متعددة الطائرة) - مباشرة في رمز لتعيين UTF-16 واحدة.

منذ BMP تشمل تقريبا جميع الشخصيات المشتركة، UTF-16 UTF-32 يتطلب عادة حوالي نصف مساحة. أما بالنسبة للنقاط التعليمات البرمجية في طائرات أخرى نادرا ما تستخدم من قبل اثنين من رموز المشفرة 16-بت.

UTF-8 استخدامات 1-4 بايت إلى نقطة رمز تشفير واحد. هذه النقاط كود 0-127 تعيين مباشرة في البايت (النص لا يتضمن سوى أحرف من هذا النطاق، وهذا يجعل من مطابقة لASCII وUTF-8). نقاط الترميز القادمة تعيينها في 19202 بايت، كل نقطة رمز المتبقية تتطلب ثلاثة بايت في BMP. غيرها من النقاط رمز Unicode في الطائرة مطلوب 4 بايت. ويستند UTF-8 على حرف 8 بت، لذلك لا حاجة إليها للقلق حول ترتيب بايت (أي 8 بايت لأن الطريقة، وغيرها UTF-16 و UTF-32 على مختلف بيئة مترجم آلة بايت للنظر ترتيب الأسئلة).

الكاتب: qogir، الكمبيوتر HIT بهذا الحجم والمهندسين بايدو، الأرقام العامة التي لا ونحن نريد أن نجعل الأصدقاء. تنويه: هذه المادة هي تقديم كل محتوى ينتمي إلى المؤلف، والشخصيات الكرتونية من الشبكة المستخدمة هنا، CSDN نشر هذه المقالة لأغراض المعلومات أكثر، CSDN لا تتحمل أية مسؤولية بالتالي للمستخدم.

الجديد ROEWE RX5 تشي التيتانيوم الشبكات المدرجة 1.5T مأخذ القدرة / السعر من 159800 يوان

قبضة أحدث تصنيفات: فاكر فقدت أصدقاء العرش: شقيق لي لا قلبك لم اجبارها العد؟

Songpiao! حديقة السياحة البيئية على الساحل الغربي، حدث في انتظاركم لانفاق ما يقرب من

MPV مع كبار النجوم لمعرفة؟ الذهب F5010،49-10،89 عشرة آلاف يوان من نماذج جديدة للبيع

دانيال دعا ليست لامبورغيني فقط، فضلا عن فورد توروس، وتبادل الخبرات سيارة

الجيل السابع من العملية الجديدة سيارة TEANA، وأصحاب: الاحتفاظ بها والعودة يسمى عالية

أعلنت شركة سامسونج رسميا أول حظة العربية فلاش SSD 860 QVO: 1TB 1040 يوان

كوريا الجنوبية خارجا! توتنهام دفع الرسمي "عقد الظهر"، إلا أن المشجعين لا تبخل

Niaoqianghuanpao، وأخيرا لم يعد ركوب دراجة نارية، ووضع السيارة مي روي باو XL!

ماذا عن بيجو 508؟ سيارة عامين، يعطى المالك إجابة

موهبة الفقراء مبرمج، يمكنك القيام بذلك إلا أنه في منتصف الطريق؟

H5 العلم الأحمر الضربة الأولى، وإصلاح كامل الشهر، صاحب رثى: الأمن هو حقا المكان تماما