من السهل فهم التعلم الآلي! 3 حالات شرح مفصل للتجميع ، الانحدار ، خوارزمية التصنيف

المصدر: Big Data

هذه المقالة 7300 كلمة ، اقترح القراءة 10+ دقائق.

كيف تعلمت الآلة وماذا تعلمت؟ كيف يعلم البشر التعلم الآلي؟ تخبرك هذه المقالة بوضوح مبادئ وتطبيقات الخوارزميات المختلفة من خلال الحالات.

باختصار ، التعلم الآلي هو أن البشر يحددون خوارزميات حاسوبية معينة ، ويسمحون للكمبيوتر بتلخيص وتلخيص خصائصه وخصائصه بناءً على عينات الإدخال وبعض التدخل البشري ، واستخدام هذه الخصائص والخصائص لتشكيل علاقة رسم خرائط مع أهداف تعلم معينة. في المقابل ، عملية الاستجابة تلقائيًا وفقًا لذلك.

قد يكون رد الفعل هذا هو وضع علامات أو أحكام مقابلة ، أو قد يكون إخراج جزء من صور المحتوى ، رمز البرنامج ، النص ، الصوت ، وما تعلمته الآلة يمكن وصفه كوظيفة ، برنامج ، مجموعة من الاستراتيجيات ، إلخ. وصف العلاقة المعقدة نسبيًا.

عندما ظهرت الخوارزمية لأول مرة ، كانت سلسلة حتمية لتنفيذ تعليمات الآلة ، وهذا ما تم تعيينه على الجهاز في بداية البرنامج. على الرغم من أنه من الممكن الاعتماد على معلمات محدودة لتعيين الكائنات المشاركة في عملية تنفيذ البرنامج ، وعدد عمليات التنفيذ ، وشروط فرع التنفيذ ، وما إلى ذلك أثناء تنفيذ البرنامج ، فقد تم تحديد منطق السلوك الأساسي إلى حد كبير.

في هذه العملية ، يكون جهاز الكمبيوتر سلبيًا جدًا ، وينفذ بصرامة وصارمة تسلسل تنفيذ التعليمات المعين من قبل المبرمج دون أي سلوك "تعلم". هذه ليست طريقة ، لأن نموذج آلة تورينج الأصلي تم تصميمه لتوقع الكمبيوتر بهذه الطريقة.

التعلم الآلي من أنواع التعلم ، الأكثر شيوعًا الذي اعتدنا على تقسيمه إلى نوعين:

يسمى واحد "تعليم غير مشرف عليه" (تعليم غير مشرف عليه)
يسمى واحد "التعلم تحت الإشراف" (التعلم تحت الإشراف)

يشير ما يسمى "التعلم غير الخاضع للرقابة" إلى نوع من أعمال التعدين حيث يحاول الناس معرفة علاقة التضمين الداخلية الخاصة بهم بدون ملصقات بعد الحصول على بيانات ناقلات التدريب. في هذه العملية ، قد يضطر المستخدمون إلى إعداد بعض ليست هناك حاجة لوضع علامة أو حتى التدخل في هذه العينات بخلاف المعلمات المفرطة ؛ يختلف "التعلم تحت الإشراف" ، وكل عينة لها تسمية واضحة ، وأخيرًا نريد فقط تلخيص هذه العينات التدريبية و رسم خرائط التسمية.

لذا في هاتين الطريقتين ، يختلف منطق المعالجة تمامًا بالنسبة للمبتدئين ، تحتاج إلى إيلاء اهتمام إضافي.

1. التكتل

Clustering-English هو Clustering ، وهو ما نسميه "التعلم غير الخاضع للرقابة" النموذجي ، وهو عملية التحليل لتجميع مجموعة من الأشياء المادية أو الأشياء المجردة في فئات متعددة تتكون من كائنات مماثلة.

لا ينبغي لنا أن نعتقد أن سلوك التجميع هذا غامض للغاية ، أو أن هذا الشيء فريد لتعلم الآلة ، بل على العكس ، فإن أصل السلوك العنقودي هو من صنع الإنسان . جميع خوارزميات أو أفكار تعدين البيانات أو التعلم الآلي التي نتعلمها هي طرق التفكير الخاصة بالبشر ، لكننا نعلمها للآلات للسماح لها بالقيام بالعمل ، والسماح لها بأن تصبح امتدادًا لأطرافنا وقدراتنا بدلاً من السماح لها باستبدالها. نقوم بالإبداع والتفكير.

ما هي ظاهرة التكتل؟ في عملية فهم العالم الموضوعي ، واجهنا نحن البشر دائمًا مشاكل في القدرات ، كل شجرة ، كل زهرة ، كل حشرة ، كل حيوان ، كل شخص ، كل مبنى نواجهه ... ... في الواقع ، يختلف كل فرد ، ولا تزال بعض الفجوات كبيرة جدًا. عندها سيكون شعبنا مؤلمًا للغاية في عملية إدراك وتذكر هذه الأشياء الموضوعية ، لأن الكمية أكبر من أن تتحملها.

لذلك ، في عملية الفهم "من أسفل إلى أعلى" للعالم ، اختار البشر "بتكاسل" طريقة الاستقراء والتصنيف. لاحظ أن هذه الطريقة من "الكسل" هي طريقة فطرية للبشر.

كانت لدينا تجربة مماثلة عندما قام أطفالنا بتعليم الثرثرة من خلال النظر إلى الصور والتحدث في الصور عندما كنا صغارًا. تم رسم قرد على الصورة ، لذلك علمنا أن هذا قرد ؛ تم رسم الصورة على الصورة سيارة ، لذا علمنا أن هذه سيارة ...

عندما نذهب إلى الشارع أو نذهب إلى حديقة الحيوانات ، ننظر إليها مرة أخرى. القرود ليست قرود مطلية ، والعديد من القرود تبدو مختلفة أيضًا. كل منها مختلف. سنتعامل معها كأشياء جديدة واحدة تلو الأخرى. ؟؟؟ نحن ننظر إلى السيارات بنفس الطريقة ، كما أن الحجم واللون والأسلوب وحتى صوت البوق متنوع ، فهل هي جديدة في أعيننا؟ لا ، ما زالت سيارات.

هذه الأشياء مختلفة بالفعل ، ولكن هل تسبب الكثير من المشاكل لإدراكنا؟ لا على الاطلاق. على أي حال ، نحن لا نعترف بالقرود والسيارات كنوع من الأشياء. القرود تختلف عن بعضها البعض ، لكن الشعر ، والسلوك ، والأشكال المختلفة تجعلنا نعتقد أن هذه الأنواع المختلفة من القرود لا تزال فئة كبيرة من القرود. الحيوانات ، ناهيك عن الخلط بينها وبين السيارات ، يسهل فصلها عن الفقاريات مثل الكلاب والخيول والدببة.

يولد البشر بهذا الاستقراء والملخص القدرة على جمع الأشياء المعرفية معًا في فئة من الأشياء ، يمكن أن تكون مختلفة عن بعضها البعض ، ولكن هناك "حد" في قلوبنا ، طالما أن هذا الحد ، فإن الخصائص تكون قليلاً الفرق لا يهم ، فهي لا تزال نفس النوع من الأشياء.

في هذا النوع من الأشياء ، هناك أيضًا هذه الظاهرة. بعض الأفراد متشابهون نسبيًا ، وآخرون متشابهون نسبيًا. لا يزال بإمكاننا التعرف بوضوح على الفرق بين هذين الشخصين ، ثم هذا الجزء سيتم إعادة تقسيم الأشياء إلى قسمين مختلفين ضمن الفئة الكبيرة للتعرف عليها. على سبيل المثال ، يمكن تقسيم السيارات بصريًا إلى سيارات وشاحنات وعربات وما إلى ذلك ، ويمكن تمييز الحشرات بسهولة عن الحشرات الطائرة والزواحف واليرقات عن طريق المظهر ...

قبل أن لا يعلمنا أحد على وجه التحديد عناوين وخصائص مجموعات صغيرة مختلفة ، فإننا نمتلك بطبيعة الحال هذه القدرة المعرفية الذاتية لنا ، في نفس شكل أو سمة مميزة مماثلة ، يتم تصنيفها وفقًا لمفهوم ، وأشكال مختلفة من أشكال الميزات تحت مفاهيم مختلفة ، هذه هي طريقة تفكير مجمعة.

خوارزميات التجميع الأكثر استخدامًا هي K-Means و DBSCAN ، إلخ. الفكرة الأساسية هي استخدام "المسافة" بين كل ناقل يشير هذا إلى المسافة الإقليدية أو مسافة مانهاتن في الفضاء. من مسافة بعيدة ، قم بالحكم على ما إذا كان بعضهم البعض أكثر ملاءمة للمرؤوسين ونفس الفئة.

إذا كانت هناك ثلاث عينات أحادية البعد ، واحدة 180 ، واحدة 179 ، واحدة 150 ، إذا كان سيتم تقسيم هذه المتجهات الثلاثة إلى فئتين ، يجب أن يكون الاثنان 180 و 179 في فئة واحدة ، 150 في فئة واحدة. والسبب هو أن المسافة بين 180 و 179 هي 1 ، والمسافة بين 180 و 179 هي 150 و 30 و 29 وحدة على التوالي - بعيدة جدًا ، حتى من المعنى البصري. إذا تم استخدام الجهاز للتعلم ، فيمكنه أيضًا اكتشاف المسافة بين هذه المتجهات تلقائيًا من خلال خوارزمية ، ثم تجميعها بالقرب من بعضها البعض لتمييزها عن المجموعات الأخرى.

عند استخدام آلات التعلم العنقودي ، تتوافق كل خوارزمياتنا مع مبدأ الحساب المقابل ، ويمكننا تجميع ناقلات الإدخال التي تبدو "متشابهة" مع بعضها البعض في المجموعة. ثم في الخطوة التالية ، عادة ما يدرس الناس القواسم المشتركة لكل مجموعة من العناصر معًا وتلك النقاط المعزولة بعيدًا عن كل مجموعة - هذا النوع من أبحاث النقاط المعزولة في التحقيق الجنائي ، والتحقيق الخاص في الأمراض ، وما إلى ذلك. هناك تطبيقات.

في هذه العملية ، من الحصول على متجه عينة محدد إلى الحصول على نتيجة تجميع ، لا يحتاج الناس إلى التدخل. هذا هو أصل مصطلح "غير خاضع للرقابة".

الثاني ، العودة

الانحدار هو طريقة حل المشكلات ، أو طريقة "التعلم" ، وهو أيضًا مفهوم مهم في التعلم الآلي.

الانحدار في اللغة الإنجليزية هو الانحدار ، وربما تعني كلمة "انحدار" "الانحدار ، الانحدار ، الانحدار". في الواقع ، الانحدار - تحليل الانحدار يعني استعارة معنى "الانحدار ، إلى الوراء". ببساطة ، إنها عملية "ناتجة من الفاكهة" ، وهي فكرة استقرائية عندما أرى الكثير من الحقائق ، أستنتج سبب أو علاقة التضمين الموضوعي ؛ عندما أرى الكثير من الملاحظات ، تكون المتجهات (الأرقام) نوعًا من الأنماط ، أصممها فرضية لوصف العلاقة بينهما.

في مجال التعلم الآلي ، فإن الانحدارات الأكثر استخدامًا هي فئتان - واحد هو الانحدار الخطي ، والآخر هو الانحدار غير الخطي.

يشير ما يسمى الانحدار الخطي إلى العلاقة الخطية بين المتجه وقيمة الوظيفة النهائية أثناء المراقبة وتحريض العينات. ثم صمم هذه العلاقة على النحو التالي:

y = f (x) = wx + b

هنا ، w و x هما مصفوفة 1 n و n 1 ، على التوالي ، ويشير wb إلى المنتج الداخلي لهاتين المصفوفتين. بالمعنى المجازي ، على سبيل المثال ، إذا لاحظت أن بعض المؤشرات للمريض تظهر علاقة خطية في التجربة (لاحظ أن هذه مقدمة رئيسية ، إذا لاحظت علاقة خطية ونمذجتها بنموذج خطي ، ستحصل على نتيجة عدم ملاءمة).

يمثل X الذي تم الحصول عليه متجهًا بخمسة أبعاد يمثل العمر والطول والوزن وضغط الدم والدهون في الدم. التسمية y هي قيمة مؤشر تصف مستوى الجلوكوز في الدم. القيمة. بعد الحصول على عدد كبير من العينات (أي عدد كبير من x و y) ، أعتقد أن المتجه (العمر والطول والوزن وضغط الدم والدهون في الدم) ومستوى y في مستوى السكر في الدم لهما مثل هذه العلاقة:

y = w1 العمر + w2 الارتفاع + w3 الوزن + w4 ضغط الدم + w5 الدهون + ب

ثم خذ قيمة المتجه المحددة لكل مريض (العمر والطول والوزن وضغط الدم والدهون في الدم) ، وأدخل أيضًا مستوى غلوكوز الدم. بهذه الطريقة ، بعد إدخال جميع بيانات المريض ، ستظهر سلسلة من المعادلات الخطية المكونة من ستة عناصر ، المجهول هي w1 ~ w5 و b-أي محتوى المصفوفة w ومحتوى الإزاحة b. والشيء التالي الذي يجب القيام به هو إيجاد الحل الأنسب لمحتوى المصفوفة w ومحتوى الإزاحة b. مفهوم "الملاءمة" هو الحصول على مجموع الفرق بين y التي تم الحصول عليها من خلال تعيين f (x) في النطاق العالمي و y الذي لاحظته بالفعل. وقد تمت كتابته بهذه الطريقة:

كيف نفهم معنى الخسارة؟ حق

يمثل الجمع ، وهو ما يعادل إجراء حلقة ، i هو متغير الحلقة ، من 1 إلى n ، ويغطي كل متجه عينة في مجموعة التدريب. محتوى الإضافة هو الفرق بين wxi + b و yi. يتم تعيين كل متجه تدريب xi إلى قيمة الملاحظة الفعلية yi بعد أن يتم تعيينه بواسطة العلاقة f (x) = wx + b التي افترضناها للتو. تعني القيمة المطلقة أن الفجوة هي نفسها سواء كانت أكبر أو أصغر من القيمة المرصودة. بإضافة قيم الفجوة n في النطاق العالمي ، نسميه قيمة إجمالي الفجوة ، وهذا ما يعنيه هذا.

من الواضح أنه إذا كان المثال الذي قدمته w و b في علاقة التعيين هذه ، فيجب أن تكون قيمة الفجوة 0 ، لأن كل x بعد التعيين "محطم" ومتسق مع قيمة الملاحظة - هذا الموقف مثالي للغاية ، في الواقع لا ينظر إليه في التطبيق. ومع ذلك ، كلما كان الخسارة أصغر ، كلما كان وصف الخرائط أكثر دقة. لا يزال هذا بديهيًا للغاية. ثم فكر في طريقة لوصف الخسارة على أنها:

الخسارة = f (w ، b)

ثم استخدم الطريقة المقابلة للعثور على قيم w و b للتأكد من أن الخسارة صغيرة قدر الإمكان ، حتى لو قمت بذلك. سنتحدث لاحقًا عن الكيفية التي يمكن أن يأتي بها الكمبيوتر بهذا النوع من الحلول المضمونة ، فهناك طريقة ، حتى إذا لم تكن بحاجة إلى حل المعادلات في وقت واحد. بمجرد حصولك على خطأ صغير بما يكفي w و b ويمكن أن يكون لديك أداء الدقة الذي يلبي المتطلبات الحالية في مجموعة بيانات التحقق. على سبيل المثال ، توقع خطأ غلوكوز الدم لدى المريض هو أن متوسط الخطأ أقل من أو يساوي 0.3 لتحمل الإنترنت ، والأداء في مجموعة التحقق بعد التدريب هو أن متوسط الخطأ هو 0.2 ، ثم يعتبر مؤهلاً.

يرجى ملاحظة أنه في خوارزميات الانحدار والتعلم الآلي للتعلم الآلي ، هناك عملية لتقسيم مجموعة البيانات التي تم الحصول عليها إلى مجموعة التحقق لمجموعة التدريب. استخدم بيانات مجموعة التدريب للتدريب والعلاقة الاستقرائية ؛ استخدم بيانات مجموعة التحقق للتحقق لتجنب التجهيز الزائد. إذا كنت لا تفهم معنى التجهيز الزائد ، فلا بأس. سنتحدث عنه لاحقًا. لا تقلق. يمكن تقسيم مجموعة البيانات إلى ثلاثة أو سبعة ، ولا يمثل اثنان أو ثمانية مشكلة. في الوقت الحاضر ، تستخدم بيئة الإنتاج هذه النسبة بشكل عام. على أي حال ، يستخدم الجانب التدريبي المزيد من البيانات.

لأن المدخلات x وقيمة الملصق y في هذا الافتراض في علاقة خطية y = f (x) = wx + b ، يطلق عليه الانحدار الخطي. الشكل الأكثر شيوعًا هو y = f (x) = ax + b ، مما يعني أن x هو ناقل أحادي البعد و w هو أيضًا ناقل أحادي البعد. إذا كان يظهر علاقات أخرى مثل العلاقة الأسية والعلاقة اللوغاريتمية ، فستستخدم في هذا الوقت الانحدار الخطي لتلائمها وستجد أن وظيفة الخسارة كبيرة جدًا ، والخطأ المعروض على مجموعة التحقق كبير جدًا. هذا نوع من ظاهرة عدم الملاءمة ، سنتحدث عنها أيضًا لاحقًا ، الجميع أولاً التكنولوجيا مثل هذا المصطلح.

من بين الانحدار غير الخطي ، فإن الانحدار اللوجستي هو الأكثر استخدامًا على نطاق واسع في مجال التعلم الآلي. يسمى كل من ذلك والانحدار الخطي الانحدار ، ولكن الانحدار اللوجستي يبدو أشبه بالتصنيف. نذكر أولاً طريقة عمل هذا الانحدار في قسم الانحدار. على عكس الانحدار الخطي الذي ذكرناه سابقًا ، في هذا النموذج ، يفترض المراقب أن y لديها قيمتين فقط ، واحدة هي 1 ، والأخرى هي 0 ، أو "نعم" أو "لا".

إن wx + b و wx + b المذكورين أعلاه في الانحدار الخطي السابق هو مفهوم يشير إلى المنتج الداخلي لمصفوفة w و x وإضافة إلى الإزاحة b. إذا قمنا بتعيين z = wx + b ، فيمكن إعادة كتابة نموذج تصنيف الانحدار على النحو التالي:

الصورة الوظيفية هي:

المحور الأفقي هو z ، والمحور الرأسي هو y. يتم عرض x متعدد الأبعاد x على y بعد هذين التعيينين وهو توزيع ذو حدين بقيم 1 و 0. أي أن ما قلناه سابقًا أنتج تصنيفًا بـ "نعم" أو "لا".

عملية التدريب هي نفس الانحدار الخطي العادي ، باستثناء أن شكل دالة الخسارة مختلف. ومع ذلك ، فإن معنى وظيفة الخسارة لا يزال يعني هذا العلاقة بين المخلفات المجهزة والمعاملات غير المحددة ، والتحسين التكراري من خلال الوسائل المقابلة ، وأخيرًا تقليل المتبقي عن طريق ضبط المعاملات غير المحددة تدريجيًا. يأتي أصل تعريف تعبير الانحدار اللوجستي من توزيع برنولي. سيكون لدينا أيضًا وصف مفصل نسبيًا لاحقًا. هنا سنقوم بفهم إدراكي.

3. التصنيف

التصنيف هو أكبر فئة من الخوارزميات التي نستخدمها في التعلم الآلي. وعادة ما نطلق على خوارزميات التصنيف "المصنفات".

هذا البيان في الواقع حيوي للغاية ، في رأينا ، إنه صندوق أسود به مدخل ومخرج. نلقي "عينة" عند المدخل ونتوقع "تسمية" سرية عند المخرج.

على سبيل المثال ، يمكن أن يصنف المصنف تسمية محتوى الصورة. نرمي صورة لنمر عند "مدخل" ونحصل على علامة وصف "نمر" عند "خروج" ؛ عندما نرمي صورة في "مدخل" للحصول على صور الطائرات ، احصل على تسمية وصف "طائرة" في "تصدير" ، هذه هي عملية التصنيف الأساسية لمصنف.

عندما يولد نموذج المصنف (تمت تهيئته) ، فإنه لا يحتوي على هذه الوظيفة ، ولكن لجعله يحتوي على هذه الوظيفة ، فقط من خلال إعطائه عددًا كبيرًا من الصور وتصنيف الملصق المقابل للصور ، دعه يؤدي وظيفته بالكامل فقط من خلال التلخيص والتلخيص يمكن أن يكون لدينا مثل هذه القدرة.

لقد رأينا بالفعل بعض القرائن في طريقة الانحدار اللوجستي التي رأيناها للتو. يختلف الانحدار اللوجستي عن الانحدار الخطي العادي ، وتركيبه هو طريقة غير خطية. على الرغم من أن الناتج النهائي "قيمة الملصق" هو متغير حقيقي ، فمن المتوقع أن تكون نتيجة التصنيف النهائية قيمة معينة "نعم" (1) أو "لا" (0). عادة ما يكون ناتج المصنفات الأخرى متغيرًا منفصلاً ، والذي يعكس أيضًا خصائص التصنيف غير الخطي.

عندما كتبنا الكود لتعليم المصنف كيفية التعلم ، كنا نعلمه بالفعل كيفية بناء منطق رسم الخرائط من الإدخال إلى الإخراج ، والسماح له بتعديل هذه العلاقة المنطقية نفسها ، مما يجعل المنطق أكثر منطقية.

إن الحكم على ما إذا كان معقولًا أم لا هو أيضًا واضح جدًا ، أي أن مؤشري معدل الاستدعاء ومعدل الدقة - يشير معدل الاستدعاء إلى نسبة العينات ذات الصلة التي تم استردادها وجميع العينات ذات الصلة في مكتبة العينات (يتم اختبار مكتبة الكائنات). هو معدل استدعاء المصنف. معدل الدقة هو نسبة عدد العينات ذات الصلة المستردة إلى العدد الإجمالي للعينات المستردة ، ويقيس دقة المصنف.

على سبيل المثال ، على سبيل المثال ، إذا كان هناك مجموعة تدريب مكونة من 1000 عينة ، فهناك 1000 صورة ، 200 منها قطط ، و 200 كلاب ، و 600 أرانب ، مقسمة إلى ثلاث فئات. نحن نوجه كل صورة ونضيف ملصقها

"قطة" - "0"
"كلب" - "1"
"أرنب" - "2"

هذا يعادل العلاقة المقابلة بين x و y ، أدخلها في مجموعة التدريب للتدريب (لكن التسميات 0 ، 1 ، 2 في هذا المكان ليست تعريفات أرقام حقيقية ، ولكنها تعريفات تسمية منفصلة ، عادة ما تستخدم واحدة ساخنة وحدها تمثيل مشفر على الساخن). بعد عدة جولات من التدريب ، قام المصنف بتعديل العلاقة المنطقية إلى مستوى مستقر نسبيًا ، ثم استخدم هذا المصنف لتصنيف 200 قطط و 200 كلب و 600 أرنب. تجد:

من بين 200 صورة للقطط ، تم تحديد 180 صورة بشكل صحيح على أنها قطط ، و 20 تم تعريفها بشكل خاطئ على أنها كلاب.

يمكن الحكم على كل 200 صورة للكلاب على أنها كلاب.

من بين 600 صورة للأرانب ، تم تحديد 550 بشكل صحيح كأرانب ، و 30 تم تصنيفها على أنها قطط ، و 20 تم تصنيفها على أنها كلاب.

لا تفاجأ ، يكاد يكون من المستحيل القضاء على المعدل الإيجابي الكاذب في جميع مشاريع التعلم الآلي أو التدريب على التعلم العميق ، لا يمكن تخفيض معدل سوء التقدير إلا بأكثر الوسائل العلمية الممكنة. لا يصعب على الجهاز. في الواقع ، لا توجد طريقة للتأكد من أن جميع المعلومات يتم الحكم عليها بنسبة 100 بشكل صحيح ، خاصة في حالة حجم الصورة ووضوح الصورة والفرق بين الضوء والظلام ، أليس كذلك؟ ثم ناهيك عن الآلة ، لا يمكنها القيام بذلك.

دعنا نشرح مشكلة معدل الاستدعاء ومعدل الدقة. في المثال الآن ، من بين إجمالي 1000 صورة ، 200 من القطط ، ولكن 180 فقط تم تحديدها بشكل صحيح ، لذا فإن معدل استدعاء القطط هو 180 200 = 90 من بين 600 أرنب ، 550 تم تحديدها بشكل صحيح ، لذا فإن معدل استدعاء الأرانب هو 550 60091.7 ، لذا احسب.

في 1000 صورة ، عندما استرجعت الكلاب ، تم استرداد 240 صورة للكلاب ، منها 200 من الكلاب بالفعل ، و 20 من القطط التي أسيء الحكم عليها ، و 20 من الأرانب التي أسيء الحكم عليها. ، لذا فقط 200 صورة من 240 صورة للكلاب صحيحة ، ثم دقة الكلب 200 24083.3. ماذا عن هذين المفهومين؟

عملية التدريب على التصنيف وعملية التدريب على الانحدار هي إجراءات روتينية للغاية.

أولاً ، أدخل نموذج التسمية والعنوان.
ثانيًا ، أنشئ نموذجًا لفرضية معينة y = f (x).
ثالثًا ، تم حل علاقة التعيين بين خسارة الخسارة العالمية والمعامل غير المحدد w ، Loss = g (w).
رابعًا ، من خلال التحسين التكراري لتقليل الخسارة تدريجيًا ، وأخيرًا العثور على w يمكنه تلبية معدل الاستدعاء ومعدل الدقة لتلبية احتياجات السيناريو الحالي. لاحظ أن هذا يشير على وجه التحديد إلى الأداء في مجموعة بيانات التحقق.

يُرجى الانتباه إلى هذه الخطوات الأربع ، فقد لخصنا واحدة من أكثر العمليات العلمية العامة من أبسط أمثلة التعلم الآلي في المقدمة. تُستخدم هذه العملية على نطاق واسع ويمكن تنفيذها بنجاح في سيناريوهات تعلُّم الآلة الأخرى.

إن تدريب المصنف وعمله على هذا النحو ، يبدو أن عملية عمل المصنف بسيطة للغاية ، ولكن من الضروري معرفة أن السلوك الذكي للإنسان هو في الواقع مصنف دقيق للغاية أو مثالي. يمكنه التعامل مع محتوى الإدخال المعقد للغاية والمجرد للغاية - سواء كان نصًا أو صوتًا أو صورًا أو حتى منبهات لا يمكن تفسيرها مثل البرد والساخ والوخز والحكة ، ويمكن أن يؤدي بشكل معقول في وقت قصير نسبيًا المخرجات - مثل الردود أو التعبيرات أو التعليقات أو التعليقات أو الصراخ أو الضحك ، إلخ.

من وجهة نظر التعريف ، الإنسان في الواقع مصنف معقد للغاية وذكي للغاية. المصنفات التي نستخدمها في الصناعة عادة ما تكون من جانب واحد ، وجزئية ، وتدرس فقط المصنفات "المهنية" لشيء أو بضعة أشياء ، والتي تختلف كثيرًا عن قدرتنا على التصنيف البشري.

4. تطبيق شامل

حتى الآن ، فإن معظم بيئات تطبيقات التعلم الآلي التي رأيناها بسيطة للغاية - يتم تنظيف المتجهات ويتم تحديد الحدود بوضوح.

على سبيل المثال ، يمكن لفرز البريد العشوائي تحديد ما إذا كان البريد غير مرغوب فيه عن طريق إدخال محتوى البريد ؛ يمكن أن يحدد التصنيف التلقائي للأخبار نوع الأخبار أو السمة التي تصف المحتوى من خلال تصنيف المحتوى ؛ التعرف الإلكتروني ، والتعرف على خط اليد ، يمكن لهذه التطبيقات الحصول على متجه المعلومات النصية الموجودة بها عن طريق إدخال صورة ، وما إلى ذلك. هذه حقول ناضجة نسبيًا في السنوات الأولى. في سيناريو التطبيق هذا ، يمكن للآلة استبدال بعضها بحتة من خلال التعلم. أعمال يدوية.

في السنوات الأخيرة ، مع تحسين قدرات الكمبيوتر ، وخاصة تعميم الحوسبة المتوازية GPU ، أصبحت العديد من سيناريوهات الحوسبة الأصلية عالية الكثافة أقل وأقل ، وبدأ الناس في المجال التجاري في البحث عن شبكات التعلم العميق للقيام ببعض الأشياء التي لا يمكن تصورها في الأصل.

على سبيل المثال ، يستخدم هذا النوع الشبكات العصبية التلافيفية لمعالجة الصور ، والتقاط صورة عادية للمدخلات ، ثم التقاط صورة بأسلوب فني قوي ، ثم معالجتها عبر شبكة الالتفاف ، وأخيرًا "تم إنشاؤها" بواسطة الكمبيوتر. يعتمد جزء من المحتوى على صورة ولكن النمط يعتمد على عمل جديد للرسم. هذا النوع من الأشياء كان لا يمكن تصوره قبل بضع سنوات ، لأنه بدا "ذكيًا" جدًا و "مبدعًا جدًا".

على هذا النحو ، نقوم بإدخال صورة ، ثم نسمح للكمبيوتر بإنشاء صورة متشابهة جدًا ولكن مختلفة استنادًا إلى نمط الصورة ومحتواها. لاحظ أن هذه الوظيفة مختلفة تمامًا عن Photoshop ، فهي تلقائية بالكامل. في هذه الصور ، تكون الصور الموجودة على اليمين كلها صور مصدر ، والصور الموجودة على اليسار كلها صور تم إنشاؤها بواسطة الكمبيوتر ، مع تموجات الماء ، والسحب ، والزهور ، والكتابات الفنية العشوائية. ماذا عن ذلك ، هناك عدد غير قليل منها حقيقي. هذا هو نتيجة المعالجة باستخدام الشبكات العصبية العميقة.

ثم بخلاف ذلك ، مثل التعرف على الكلام واكتشاف الأشياء في مقاطع الفيديو ، فإن هذه المحتويات شائعة أيضًا في السنوات الأخيرة وتنضج تدريجيًا. في الواقع ، على مستوى التنفيذ ، هناك العديد من الطرق لتطبيق مثل هذه التطبيقات.

في المجال الأكاديمي ، هناك أيضًا نوع جديد من حقول البحث يعتمد على الشبكات العصبية للتعلم العميق ، يسمى "التعلم العدائي" والذي يمكن تنفيذه بطريقة مماثلة. في مجال التعلم العميق ، سنستخدم "الشبكة العدائية التوليدية" (الشبكة العدائية التوليدية) ، وتتميز هذه الشبكة بتوليد محتوى معقد ، بدلاً من إنشاء تسمية بسيطة.

طريق الحرير

من السهل فهم التعلم الآلي! 3 حالات شرح مفصل للتجميع ، الانحدار ، خوارزمية التصنيف

بدأت 15 عاما بتكلفة قدرها 80 مليار المشترين الانتحار: أكبر المشاريع التي لم تكتمل في العالم في دبي "جزيرة العالم"

دانيال يريد أن يكون البيانات العلمية؟ عليك أن تبدأ (وصلات) من بلوق

CCTV بث الليلة التركيز على الحرب المانيا VS هولندا، أن فان دايك كسر أربعة أهداف نوير التوالي؟

الغرب كأس السوبر: C + أحمر لوه كسر ريال مدريد 3-1 في مباراة الذهاب من برشلونة! يوفنتوس 2-3 بالاحباط كأس السوبر

العلوم الإنسانية تشيلو | لاو شه راكوغو "هاوى" وزارة Xiaofan من الجامعة الصينية تشيلو

مجموعة 15 مجموعة إجابات رئيسية من CNN ، يجب أن تكون مقابلة التوظيف في المدرسة لعام 2019!

التصفيات الأوروبية كسر تهز مفاجأة: أول لقطة في العالم 182 أول فوز له مساحة الارض هايديان هو أفضل!

أول عرض نيمار الكبير في باريس تقدم 1 هدف 1 مساعدة تألق! كبير 3-0 الفوز على باريس! Loukakou 2 أهداف مانشستر يونايتد 4-0

تسببت عمرها 8 سنوات في عداد المفقودين فتاة، معلومات التتبع المدينة إلى الأمام هانت، هل أنت قلق الجميع

المنتخب الوطني خمس مباريات متتالية اندلعت + الخدمة الفعلية أولا، هو الأكثر احتمالا ليسجل يعود قائد ريال مدريد!

مفضلة | 12 قه ggplot2 توسيع البرنامج لمساعدتك على تصور تعزيز R

ساعد في تنفيذ المخابرات "خط فريق الخبراء كبار الخبراء خدمة سيتشوان تسيقونغ" في Gongjing

من صفر إلى | المطلوب 14 AI إدخال دفتر قائمة القراءة (مرفق رابط PDF)

الشعب الصيني فقط سوف تمرير وو لي أيضا 32 سنة، وكان وطني الماضي مايسترو خط الوسط لكرة القدم؟

بيع 1 سنة 100،000! "واتهم حقيبة" بعيدا فاز 20 مليون $ الجولة B التمويل

توعية المواطنين النار شهر تجربة حية "النجدة" هو أقصر في ثواني فقط 19

حصريا | تفسير بيانات الأداء توليف النص في تقنيات التعلم الآلي

الإرهاب الجسدي! لعبة 90 دقيقة، كما قام سون هيونغ مين وقفة واحدة الزنادقة التجاوز!

ما الفيلم تبادل لاطلاق النار، والذكاء الاصطناعي لها الكلمة النهائية؟

سوف مدرب تايلاند ان يخرج بعد كأس الصين؟ الأصل لا تسمح لكرة القدم خسر مدرب!

الموسيقى أول مهرجان اللوز ميلان رائع يا يصم الآذان

جمع | الأكثر استخداما محلل بيانات 10 آلة خوارزميات التعلم! (حل المرجعي)

الأحكام ذات الصلة