البنك اللغة السويدية: معتدل كشف ضعف الادراك على أساس تحليل حركات العين أثناء القراءة

EMNLP 2017 ورقة طويل تم الكشف عن أساس الضعف الادراكي المعتدل على تحليل حركات العين أثناء القراءة تحليل العين الحركات أثناء القراءة للكشف عن الضعف الادراكي المعتدل البنك السويدية اللغة الضفة اللغة السويدية، قسم السويدية

مجردة آلة استخدام وتعلم الجانب الفرنسي للحصول على معلومات التتبع لتحليل حركة العين للكشف عن الضعف الادراكي المعتدل، التدهور المعرفي المرتبط يميل إلى رفع خطر الإصابة بالخرف. أجرينا مجموعتين من اختبارات المقارنة (والقراءة بصمت)، في حين أن مقارنة طريقتين (المرتبطة دمج) من البيانات التجريبية. وبالإضافة إلى ذلك، نقرأ كلمة ووضع علامة على فئات معدل والنحوي الاستعراض، واستخدام هذه الشروح لتوليد الميزات الجديدة. في النهاية، أن نحدد بدقة يعاني من الضعف الادراكي المعتدل لتصل إلى 86.

1 مقدمة

مع اشتداد ظاهرة عالمية شيخوخة السكان، وحدوث الخرف في تزايد (2013 الأمير وآخرون،). مصطلح "الخرف" يشير إلى علم الأمراض غير نمطية والتدهور المعرفي، والذي قد يكون ناجما عن مجموعة متنوعة من الأسباب الكامنة وراء. الكشف المبكر عن الإصابة بالخرف مهم لعدة أسباب منها السماح للمرضى يتلقون العلاج في الوقت المناسب والعلاج، وتحسين نوعية الحياة اليومية (مثل الحفاظ على التغذية والصحة السليمة)، للحد من الإجراءات وحدها المخاطر (مثل قيادة السيارة)، والأفراد والأسر ومقدمي الرعاية لتوفير الوقت الكافي لإعداد (سليمان وميرفي، 2005؛ أشفورد وآخرون، 2006؛. Calza وآخرون، 2015.).

في هذه الدراسة، استخدمنا بيانات تتبع العين والتعلم الآلي لاستكشاف إمكانية الكشف المبكر عن علامات خفية من ضعف الادراك. السابق رقة عمل اضطراب يمكن أن يسبب الناس على تتبع التغيير حركات العين (Lueck وآخرون، 2000؛. Ferna القراءة ndez وآخرون، 2013؛. بيريرا وآخرون، 2014؛. بيوندي وآخرون، 2017. ). ومع ذلك، لم تشخيص المشاركين في الدراسة يعانون من الخرف، ولكن يعاني من "ضعف بسيط المعرفي"، الأمر الذي يعني أنها بدأت تظهر بوادر التدهور المعرفي، ويزيد من مخاطر الاصابة بالخرف. قارنا مزايا وعيوب المعلومات اختبار حركة العين تجمعوا في القراءة الصامتة والقراءة بصوت عال الدولتين، واستكشاف فكرة تتبع العين الميزات المحسنة من المعلومات اللغوية.

علينا أولا إدخال بعض المعلومات الأساسية عن التغيير المعرفي واللغة ومناقشة الأعمال السابقة على العين تتبع ومعالجة اللغة الطبيعية طرق للكشف عن التدهور المعرفي. ثم يصف لنا عمليات الإعداد التجريبية، واستخراج ميزة وتعلم الآلة. كنا القراءة الصامتة والقراءة وبصوت عال طريقتان لتوسيع التجربة ومناقشة المعنى العام وتفسير نتائجنا. وأخيرا، فإننا ندرك محدودية العمل الحالي وتقديم توصيات للمناطق مستقبل البحث.

2 الخلفية

ينقسم إلى عدة أنواع مختلفة من الخرف ومرض الزهايمر (AD) هو الأكثر شيوعا واحد. AD تظهر عادة الأعراض المصاحبة للتنفيذ وظيفة الادراك والذاكرة، ولكنها تشمل أيضا الحواجز اللغوية المحددة المرتبطة بمعالجة الدلالي. ويمكن رؤية الضعف الادراكي المعتدل (MCI) في جهة نظر سريرية كما الخرف قبل المرحلة، يحدث عادة في غضون سنوات قليلة قبل الخرف. أظهر الأشخاص الذين يعانون من أعراض MCI في العديد من المجالات المعرفية، حيث القدرة الشاملة المعرفية، والذاكرة العرضية، وسرعة الإدراك الحسي، وظيفة السلطة التنفيذية تتأثر الأهم. ومع ذلك، فإن المظاهر السريرية بين مجموعة التحكم من الأصحاء والمرضى الذين يعانون MCI هو تداخل كبير، مما يجعل التشخيص أصبح أكثر تعقيدا وغير متجانسة.

استعرض Taler وفيليبس (2008) في الأدب على الحواجز اللغوية في MCI ومرض الزهايمر، وجدت أن الحواجز اللغوية ينظر في AD موجود أيضا في MCI، على الرغم من أن أقل. والعقبة الرئيسية (مثل الاسم أو من الصعب أن يقترحوا فئات محددة الدلالي للكلمات من الصورة)، ولكن ليس هناك دليل واضح حول يقع الصفقة جملة مع المشكلة على مستوى اللغة.

الناس مع MCI وعادة ما تكون في فهم الجملة ضعف، ولكن هناك فروق فردية كبيرة.

وقد أظهرت الدراسات السابقة، والقياسات تحليل الوقت متغير (مثل وقت رد الفعل) وتحسين القدرة على التمييز بين MCI والضوابط الصحية، وسوف تحقق العوامل التي MCI تحويل تعزيز مساعدتها (يتم تحويل Taler وفيليبس إلى AD، 2008 ). لتحليل البيانات لغة مع تعلم آلة للكشف عن الضعف الادراكي المعتدل أثبت المزيد والمزيد من الفوائد. Roark وآخرون (2011) 37 قياس المرضى MCI و 37 الاصحاء وتعقيد المحتوى المعلوماتي قصة إعادة صياغة السرد. وهذه الميزات يمكن أن تستخدم لتصنيف AUC 0.73، أو عن طريق المعلومات نتيجة الكشف وعشرات السريرية التي تم الحصول عليها عن طريق الجمع بين 0.86. T'oth وآخرون (2015) باستخدام الميزات الصوتية (بما في ذلك معدل النطق، وسرعة، طول النطق، ومدة التوقف، وتردد توقف معدل)، 32 مريضا MCI للتمييز و 19 الضوابط المسنين الصحية، وأفضل دقة وكان 80.4.

وتعتبر دراسات أخرى المشكلة (توماس وآخرون للتمييز ترتبط ارتباطا وثيقا مرضى الخرف والسيطرة على المجموعة من خلال تحليل الآلي للإنتاج اللغة ولغة، 2005 ؛. Pakhomov وآخرون، 2010؛. Guinn وحبش، 2012؛ Meila netal 2014؛ Jarroldetal، 2014 ؛. فريزر وآخرون، 2016؛. رنتومي وآخرون، 2014؛. جيرارد وآخرون، آخرون، 2014؛. Prud'hommeaux مع Roark، 2015؛ Yancheva وآخرون، 2015) ..

في المقابل، فإن التحليل كشف عن التدهور المعرفي في معالجة اللغة والتفاهم هو الهدف هو أكثر نادرة، ربما بسبب صعوبة التلقائي لقياس. وتعتبر دراسة كلاسيكية من معالجة اللغة على الخرف جلسة (على سبيل المثال، روشون وآخرون 1994؛. Kempler وآخرون 1998؛ ويلاند وآخرون 2002). وقراءة (على سبيل المثال، باترسون وآخرون 1994؛. Storandt وآخرون 1995). جانبين، وهنا ونحن نركز على القراءة كما وضع الإدخال. في القراءة والفهم، أفضل طريقة لتقدير عملية القراءة للتعامل مع احتياجات تتبع العين البشرية. كان هناك الكثير من المؤلفات لوصف عملية القراءة العين تعقب، لذلك نحن لا نفعل التعميم كاملة، ولكن يعرض فقط بعض الكلمات الرئيسية والمفاهيم الأساسية.

في القراءة، وسوف تستمر العين إلى حملة لسلسلة من النص ونظرات وهلة. عندما بقية العيون على كلمة من السلوك يسمى البصر. هذه المرة هي معلومات يتم معالجة المدخلات، والوقت المخطط لحركات العين. وعادة ما يستمر السلوك نظرة حول 200-300ms، والقراءة بصوت عال المتوسط شاهدت لفترة أطول قليلا في القراءة الصامتة (راينر، 1998). في بين مشاهدة ومشاهدة، ودعا حركات العين السريعة saccades. ويمكن أن تشمل نظرة إلى الأمام من خلال النص (حركة العين إلى الأمام) أو حركة العين العكسية (العودة إلى الخيال أو الانحدار البسيط). بالغسل عادة 6-8 في الكلمات الإنجليزية (على الرغم من أنها تعتمد على اللغة؛ على سبيل المثال، Liversedge وآخرون (2016) وجدت أعظم قدرة بالغسل الفنلندية، وقدرة على الأقل محة الصينية)، من نحو 10 إلى 15 يتم فحصه في وقت لاحق. سواء قراءة قوة الشعب سيكون هناك بأثر رجعي (الانحدار) ظاهرة، ولكن قدرة قوية على قراءة الناس يبدو أن لديها القدرة على توجيه بدقة العين إلى صعوبة أو الارتباك نقطة النسبية، وسوف القراء الضعيفة تكون أكثر الانحدار تتبع (موراي وكينيدي، 1988).

إذا كانت كلمة يراقب، فإنه يراقب متى تتأثر إلى حد ما مستوى الكلمة وعوامل السياق. فرصة للكلمات محتوى (أو محتويات كلمة) الصرف العينين حوالي 85، في حين الكلمات الدالة (أو الكلمات وظيفة) هي فقط 35 (راينر، 1998). هناك بعض الأدلة على أن تأثير أنواع كلمة قد تكون أكثر غرامة الحبيبات، مثل باريت وعمل الآخرين (2016) إظهار الاحتمالات على أساس تتبع العين بطاقة المعلومات من الكلام. مشاهدة عدد ومدة تتأثر أيضا كلمة التردد (راني وراينر، 1995)، في سياق كلمة التنبؤ (Kliegl وآخرون، 2004)، والموقف من كلمة في الجملة (راينر وآخرون، 2000)، وقوة عاطفية المدى (سكوت وآخرون، 2012) وطول كلمة (راينر، 1998) الآثار.

في العديد من نصيب نفس الخصائص، بينما القراءة الصامتة والقراءة تعتبر بصوت عال في بعض النواحي قد تختلف. والفرق الرئيسي بين القراءة بصوت اثنين من الدماغ عن التمثيل الدلالي والوصول. عند قراءة بصمت، سواء فك معلومات التعيين متعامد مباشرة إلى المعنى الدلالي، أو ما إذا كان يتم تعيين الأبجدية صوت لويرتبط معنى الدلالي فقد كان الكثير من النقاش. باستخدام طريقة الحساب من الدراسات السابقة على أساس القراءة والضرر وSeidenberg (2004) درس الطريق المقترحين، ويقدم نموذجا المشترك، حيث يتم تنشيط مسار الخطاب والمسار المباشر في وقت واحد وبشكل مستمر على أساس تردد كلمة لفظي و وعوامل أخرى تشترك في عبء العمل. كما بحث ودراسة بعض الوقت منذ تفعيل المعلومات الدلالي أثناء القراءة. كان يعتقد سابقا، أثناء القراءة، لا يحتاج المعلومات المستوى الدلالي لتفعيلها، ولكن الحروف يمكن أن يقابل مباشرة مع الفونيمات، ثم التعبير عنها. ومع ذلك، فإن نموذج الحساب (Coltheart وآخرون، 2001) والبيانات الرنين المغناطيسي الوظيفي، مثل (المقابر وآخرون، 2010) أظهرت أن المعالجة الدلالي وقراءة بصوت عال، ولكن بدرجات متفاوتة.

وقد حددت الأعمال السابقة الخلافات بين جهاز التحكم ذات الصلة بالصحة المعرفية من اضطرابات حركة العين. Lueck وآخرون (2000) أن المرضى AD مع حركات العين غير النظامية، لفترات طويلة نظرة على قراءة المزيد من مراجعة محة. Fern'andez وآخرون (2013) وجدت أن زيادة عدد من الضوابط الثابتة والانحدار في المرضى ميلادي وصحية من تخطي أكثر من الكلمات. بيريرا وآخرون (2014) قدم الأدب استعراضها في MCI وAD ذات الصلة تتبع العين، واقترح هذه التقنيات يمكن التنبؤ من MCI لتحويل AD، ويرجع ذلك جزئيا إلى حركة العين الحساسة للتغيرات مبكرة في الذاكرة، وعملية البصرية وتنفيذ الجنس.

في وقت سابق من هذا العام، بيوندي وآخرون (2017) ورد في مقال نشر في أرخايف للتمييز المرضى تصنيف وضوابط صحية من خلال تدابير مكافحة الإغراق العين دقة تتبع حركة كان 88.3. وقد سجل 40 و 20 المرضى المسنين الأصحاء مع الحركات AD العين، في حين أنها قراءة الجمل 120. القدرة على التنبؤ ومعرفة جوانب من هذه الجمل المختلفة (مثل على سبيل المثال والجمل معروفة). يتم تسجيل كل جملة كما تجارب منفصلة. بعد استبعاد 10 من اختبار كقيمة غير طبيعية، و90 المتبقية من اختبار لعمق متفرق التشفير القطار الآلي، احتفظ 10 من بيانات الاختبار. بعض نفترض أن بيانات التدريب وبيانات الاختبار من نفس المشاركين.

في هذه الورقة، ونحن أول تصميم لتكرار ظهور بيوندي (2017)، وآخرون. التجارب، وإن كانت هناك بعض الاختلافات الهامة. ويجري بحثنا في السويدية بدلا من الإسبانية، في كل محاكمة، وطلب من المشاركين قراءة الفقرة بأكملها، بدلا من جمل منفصلة، والتي تؤثر على اختيار حساباتنا ميزة والمصنف. وبالإضافة إلى ذلك، ونحن نقدم اثنين من التكوين التجريبية مختلف هو (مقابل القراءة الصامتة بصوت عال)، وإدخال ميزات جديدة على مستوى الكلمة واللغة وحركة العين ويرتبط تتبع المعلومات. وعلاوة على ذلك، من جهة نظر سريرية، ولعل الفرق الرئيسي هو أن لدينا المشاركين في مراحل أكثر اعتدالا من التدهور المعرفي، والتي لم يتم تشخيصها مع AD. ولذلك، كان هدفنا هو تحقيق ما إذا كانت المرحلة المبكرة من هذه الطريقة واعدة يمكن استخدامها للكشف عن ضعف الادراك.

3 طريقة 3.1 المشاركون

تم تجنيد المشاركين في الدراسة من غوتنبرغ MCI، وهو دراسة طولية واسع النطاق على الضعف الادراكي المعتدل (والين وآخرون، 2016). غوتنبرغ الشاملة MCI بموافقة المحلية جنة أخلاقيات البحوث مجلس المراجعة (المرجع: L09199،1999، T479-11-11)؛ ووصفت الدراسة الحالية قرار الموافقة من قبل لجنة الأخلاق المحلية 2016 رقم 206-16.

تم تضمينها في المشاركين في الدراسة يجب أن تستوفي معايير معينة الإدماج والإقصاء: يجب أن يكون المشاركون الناطقين باللغة السويدية، يجب أن تكون قادرا على قراءة وفهم المعلومات عن المشروع، والقدرة على الموافقة. المشاركون لا يمكن أن يكون عسر القراءة له علاقة مع ضعف الادراك الحالي أو غيرها من صعوبات في القراءة شيئا. استثنينا أيضا عمق المعاناة من الاكتئاب، واصلت تعاطي المخدرات، لا يمكن تصحيح المرضى الفقراء مع النظارات أو العدسات اللاصقة والبصر ويتم تشخيص المصابين بأمراض عقلية خطيرة أخرى، وأمراض عصبية أو ذات الصلة المخ مثل مرض باركنسون، التصلب الجانبي الضموري، والسكتة الدماغية أو ورم في المخ المشاركين. أخذت ثلاث مجموعات من المشاركين في الدراسة: المرضى الذين يعانون من ضعف بسيط المعرفي (MCI)، ضعف الادراك شخصي (SCI) والاصحاء (HC). يخضع المشاركون سلسلة من الاختبارات لتقييم MRI، واختبارات الدم والبزل القطني من الفحص العصبية في الهيكل. التحليل والمقارنة هنا هي MCI مجموعة والسيطرة المجموعة. خمسة وستة مشاركين السيطرة المشاركين MCI استبعادها من هذا التحليل.

MCI (ن = 27) HC (ن = 30) عمر (سنة) 70.3 (5.8) 68.0 (7.5) التعليم (سنة) 14.2 (3.6) 13.3 (3.7) جنس 13/14 21/09 MMSE 28.2 (1.3) 29.6 (0.6) يتم إعطاء الجدول 1 انخفاض معتدل المعرفي (MCI) والاصحاء (HC) مشاركا والعمر والتعليم والبسيطة فحص الحالة العقلية النتيجة (MMSE) في الشكل التالي: ويعني (الانحراف المعياري). MMSE يختبر حالة خفيفة من العام، وهو أعلى مستوى يسجل 30.

وكان المشاركون تلخيصها في الجدول 1 لكل فئة عمرية ومستوى التعليم لا يوجد فرق كبير. لم سيطرة لها على فحص كبيرا الدولة العليا مصغرة العقلي (MMSE) درجة، يعني (ص < 0.0001). نلاحظ، مع ذلك، كان متوسط درجة MMSE لدينا المشاركين MCI "28.2 (من أصل 30)، والتي تعتبر" طبيعية "(Grut وآخرون، 1993). المشاركين في الدراسة مع AD نحن بيوندي وآخرون (2017) في المقارنة، فإن متوسط درجة MMSE 24.2. في الواقع، كان متوسط MMSE مشاركين مراقبة صحية في الدراسة 27.8، ومجموعتنا هي مشابهة جدا لMCI. وهذا يدل على الطبيعة الحساسة لعيوب في فئة MCI.

3.2 العين تجربة تتبع

أجريت العين تتبع التجارب في بيئة المختبر هادئة. نحن نستخدم EyeLink 1000 أمن الكمبيوتر المحمول يتصدر أحادي الرؤية تعقب والاستخدام وكان رئيس مسند رأس ومستقرة. الاستقرار الرأس يمكن أن يحسن من أداء تتبع العين. تم تعيين معدل أخذ العينات ل1000HZ.

قراءة المشاركين مقالتين، والإجابة على خمسة أسئلة حول النص بعد القراءة. النص الأول هو القراءة الصامتة، وتتم قراءة النص الثاني بصوت عال. كلا النصين هي من سرعة نص القراءة الدولية (IReST)، والتي هي 17 نوعا من النصوص في مختلف جمع اللغات. أنها تصل إلى 146 كلمة باللغة السويدية، وضعت لأداة التقييم (Trauzettel-Klosinski، الخ، 2012) المستخدمة لتقييم أو قراءة الإعاقة. نقترح مجموعة كاملة من الفقرات (بدلا من الأحكام الفردية) لمحاكاة مهام القراءة أكثر طبيعية، ومتطلبات الفقرات من نهاية دمج المعلومات والذكريات.

في النص، نحدد مجال الاهتمام (AOI)، وتتميز كل كلمة باعتباره الهيئة العربية للتصنيع منفصل. ثم فيما يتعلق مسبقا حركات العين حساب الهيئة العربية للتصنيع، على سبيل المثال، تخطي وبالغسل. دون النظر نظرة تحدث خارج الأوقات AOI في هذا التحليل.

الإجراء 9 نقاط المعايرة باستخدام معايرة تعقب العين لكل مشارك، والانجراف تصحيح الاختبارات بين 1 و 2. ومع ذلك، أظهر الفحص البصري للبيانات ميل إلى الانجراف نحو الانخفاض، ولا سيما في الاختبار الثاني. هذا هو مدى اثنين من الكتاب (K.C.F. وK.L.F.) وافق على تصحيحها يدويا.

3.3 ميزات

كمقياس لدينا، ونحن نعتبر ال 13 يتميز بيوندي (2017) وغيرهم بها، وتتلخص في الجدول 2. قبل حساب الانحراف ومدتها واتساع خصائص متوسط والقياسية للتحويل الرقمي (Wotschack، 2009). يتم إسقاط كل اختبار لأول مرة شاهدت وتحليلها من بداية الهزيع الثاني (Holmqvist وآخرون، 2011). كما بيوندي وآخرون (2017)، ونحن سوف ننظر إلى أربع فئات: القراءة الأولى لأول مرة مشاهدة والقراءة مرة أخرى لأول مرة أشاهد (بيوندي وآخرون (2017) وصفت هذه "فريدة من نوعها" ثابتة، ولكن قد يكون مصطلح ملتبس، حتى هنا يمكننا تجنب ذلك.)، ومشاهدة متعددة (متعدد التثبيت) وإعادة البصر (refixations). وترد هذه التعريفات في الجدول 2، ولكن من أجل الوضوح، ونحن نقدم أيضا جدول الحقيقة بسيطة، ويلخص الجدول 3 أربعة أنواع من الاهتمام.

مدة مدة النظرة النظرة (متوسط والانحراف المعياري): اختبار كل الكلمات تعني والانحراف المعياري المتوسط، لمدة ثابتة على كلمة واحدة. رمش رمش السعة (المتوسط والانحراف المعياري): اختبار عن نفسه والانحراف المعياري لحجم متوسط محة رمش. كمية النظرة إجمالي تثبيتات (متوسط والانحراف المعياري): العدد الكلي للبصر. القراءة الأولى الأولى الكلي تثبيت إجمالي تمر الأول تثبيتات الأولى (متوسط والانحراف المعياري): العدد الإجمالي للالتثبيت الأول يحدث في اختبار مرور الأول. وبعبارة أخرى، عند أول نظرة في كلمة معينة، لأول مرة يشاهد للمرة الأولى، وأية كلمة التي تحدث في وقت لاحق في النص لا يبحثون. قراءة مرة أخرى أول الكلي تثبيت إجمالي في وقت لاحق تمرير تثبيتات الأولى (متوسط والانحراف المعياري): يحدث عدد من التثبيت الأول خارج اختبار مرور الأول. وهذا هو، عندما يكون لأول مرة على الكلمة ساعة التي قدمها النظرة الأولى يحدث في وقت لاحق، ولكن الكلمات التي تحدث في وقت لاحق في النص تم يراقب. إجمالي شاهدت مرارا إجمالي متعددة تثبيتات (متوسط والانحراف المعياري): القراءة الأولى لعدد من الكلمات البصر، وليس بما في ذلك أول نظرة. وهذا هو، عند بدء تشغيل أول ساعة في كلمة ووتش عدة مرات، مما تسبب في علاه متعددة. النظر مرة أخرى في مجموع إجمالي إعادة تثبيتات (متوسط والانحراف المعياري): العدد الإجمالي نظرات على كلمة واحدة وراء القراءة الأولى، وليس بما في ذلك أول نظرة. القراءة الأولى لأول مرة أشاهد الوقت: أولا تمرير المدة الأولى تثبيت (متوسط والانحراف المعياري): الأول المتوسط تثبيت والانحراف المعياري المدة. قراءة مرة أخرى مدة التثبيت الأولى: في وقت لاحق تمرير مدة التثبيت الأولى (متوسط والانحراف المعياري): مرة أخرى، وقراءة أول مرة بدا المتوسط والانحراف المعياري. تتميز حركات العين في الجدول 2

ثم نستخدم هذه الكلمات في النص، وهذا هو، وتواترها من الكلمات وأنواع المعلومات لزيادة هذه المعايير يتميز. نحن أول استخدام Sparv (https://spraakbanken.gu.se/eng/research/infrastructure/sparv) أدوات الشرح (بورين وآخرون، 2016) من اثنين من نحوي النص الأساسي والتحليل الصرفي. على وجه التحديد، هو مكتوبة كل كلمة، وتميزت بدورها من كلمة (POS).

هل هناك متابعة من الكلمات تتصفح؟

لا نعم

لم يتم الوصول إلى هذه الكلمة

فريست تمرير التثبيت الأول

لأول مرة هذه المرة الأولى التي يشاهد

في وقت لاحق تمرير التثبيت الأول

تصفح مرة أخرى لأول مرة شاهدت

تم استعراض هذا كلمة

متعدد التثبيت

متعدد مراقبة

إعادة تثبيت

الوزن مراقبة

الجدول 3 أربعة أنواع نظرة أنواع

وفقا لدينا ملف اللغة السويدية Korp قسم اللغة "الحديث" (https://spraakbanken.gu.se/eng/korp-info)، وفقا لنسبة مئوية من قيمة التوزيع التكراري لكل يما كلمة في مليون كلمة (لكل مليون كلمة)، والذي يحتوي على 10.7 مليار كلمة الوقت علامة الكتابة (بورين وآخرون، 2012). هذه القيم هي تردد POS توضيح. ثم قسمنا إلى قيمة التردد العالية والمنخفضة، وقيمة عتبة 20 مرات في مليون كلمة. اختيار يدويا توزيع عتبة من خلال مراقبة اثنين نص كلمة تردد. سنقوم أيضا تسمية POS تنقسم إلى فئتين: الكلمات المحتوى والكلمات وظيفة. النظري الذي يعرف بأنه الأسماء، والأفعال، والصفات والظروف، وتعتبر كل بعبارة أخرى أن تكون كلمة وظيفة.

ثم نحدد مجموعة ميزة تعزيز الطابع بعد بيوندي +، مع الأخذ بعين الاعتبار مستوى تعليقات هذه الكلمات. على وجه التحديد، ونحن خلق كل ميزة المرجعية القائمة على البرامج الثابتة ميزة جديدة المقابلة. (يضم مجموعة ميزة الأصلي أبعد رمش، بحساب لا تعلق على أي كلمة معينة.) عندما الميزات الأصلية المتعلقة متوسط والانحراف المعياري، ونحن نحسب منخفضة: كلمات ذات تردد عال ونسبة من تلك القيم المحسوبة على الكلمات وظيفة حقيقية. وكمثال على ذلك، من أجل "متوسط مدة البصر،" حسبنا متوسط كلمات تردد منخفض إلى التحديق الوقت من الكلمات عالية التردد، والكلمات وظيفة والكلمات المحتوى من نسبة مدة البصر. عندما تكون ميزة الأصلية البيانات الأصلية، نحسب النسبة. وهكذا، ل"إجمالي وقت المشاهدة"، نحسب تحدث في انخفاض كلمة ترددات نظرة نسبة من الإجمالي، وإجمالي نسبة مشاهدة هذا يحدث على الكلمات المحتوى. وبهذه الطريقة، نحدد 22 ميزات جديدة لزيادة مجموعة بيوندي الأصلي.

ومن الواضح أننا نتوقع هذه الميزات الجديدة قد تكون ذات صلة ببعضها البعض، لأن الكلمات الدالة أيضا كلمات عالية التردد. ومع ذلك، في منهجيتنا، وتتميز العديد من الكلمات المحتوى أيضا عالية التردد، مثل BIL (بالإنكليزية: سيارة) وpotatis (بالإنكليزية: البطاطس)

3.4 إطار تصنيف

ونحن نعتبر ثلاثة خوارزميات تصنيف تنفيذها في WEKA النسخة 3.9.1 (قاعة آخرون، 2009.) في: بايز ساذج (NB)، آلة الدعم الموجه (SVM) والانحدار اللوجستي (LR). وبالنظر إلى صغر حجم مجموعة البيانات لدينا، والتخلي عن واستخدام المعلمات الأمثل المعلمة الافتراضية، وهي لLR، ونحن نستخدم المعلمات الانحدار من التلال 08/10، لSVM، ونحن نستخدم أول درجة نواة متعدد الحدود وتعقيد المعلمات 1.0. لاختيار الميزة، ونحن نستخدم التعبئة والتغليف طريقة NB المصنف. نحن نستخدم التحقق عبر لتقييم التحليل والتصنيف، حيث في كل التكرار، تشير البيانات بمثابة تقييم بيانات الاختبار، وبقية ما تبقى البيانات لاختيار ميزة والتدريب المصنف. نفيدكم متوسط دقة التصنيف. لمجموعة البيانات لدينا، أكثر من مؤشر الطبقة هي 52.6.

4 النتائج

4.1 تجربة واحدة

رأيناها لأول مرة بشكل منفصل لكل اختبار، كما نتوقع، في القراءة الصامتة (تجربة 1) والقراءة (اختبار 2) قد يكون مختلفا حركة العين مسار. كل المصنف ونتائج المحاكمة الأولى ويرد كل مجموعة ميزة في الجدول 4 (أ). باستخدام ميزة مجموعة معززة من شأنه أن يقوض دقة التصنيف في كل حالة على حدة، وبايز ساذج المصنف باستخدام مجموعة ميزة وبيوندي يمكن تحقيق أفضل دقة 75.4.

الجدول 4 المصنفات التجارب دقة منفصلة

عندما بايز المصنف باستخدام مجموعة الاختبار 2 (الجدول 4 (ب)) البيانات، وتعزيز مجموعة ميزة في كل الخيوط الحالات إلى دقة أقل من جديد، على أفضل النتائج من 66.7 وجود ميزة SVM نفذت بيوندي . في كل حالة، لاحظنا مقارنة مع اختبار 1، اختبار 2، ونفس الدقة تصنيف أو ما هو أسوأ. وهذا هو، عندما يقرأ المشاركون بصوت عال، ونحن أقل فائدة استخراج المعلومات التشخيصية من القراءة الصامتة. وهذا أمر منطقي، لأن القراءة بصوت عال مهمة أكثر تقييدا: القارئ يجب أن تستمر في المضي قدما بسرعة معقولة، لتجنب تدمير القصة السردية. هذا يحد من فرص لحرية الحركة من وجهة نظر حول النص. وبالإضافة إلى ذلك، في ولاية في القراءة والمجرب مرة واحدة المشاركين الوصول إلى نهاية النص طرحها لفهم المشكلة، ولكن في وضع القراءة الصامتة، واختيار لاعبين لمواجهة مشكلة في الخاصة به جاهزة قبل.

التجربة 4.2 مزيج

ونحن تحقق الآن ما إذا كان يمكن الجمع بين المعلومات من تجربتين لتحسين دقة التصنيف. ونحن نعتبر طريقتين مختلفتين لتجمع البيانات: (1) متصلة مع بعضها اختبار ناقلات ميزة، (2) حساب خصائص الاختبارين، إذا كانت مجرد نصفين المحاكمة. الاستفادة من الطريقة الأولى هي أن تحتفظ فرق كبير بين أي اثنين من النموذج التجريبي (على سبيل المثال، وهي ميزة موجودة فقط عملية ارتباط بصمت، وهذا إشارة سيتم الاحتفاظ بشكل جيد في البيانات). الاستفادة من الطريقة الثانية (التي سنطالب مزيج) لكل الميزة وتضاعف استخدام البيانات المحسوبة إلى حد كبير، فإنه قد يؤدي إلى تقديرات أكثر دقة.

وبالنظر إلى النتائج لكل تكوين في الجدول 5. في معظم الحالات، وتستخدم وحدها بيوندي مجموعة الميزات التي توفر أفضل دقة. ومع ذلك، كانت أعلى دقة 86.0، والتي وقعت في حالة استخدام التكوين الهجين وجود بيوندي + السذاجة بايز المصنف مجموعة من الميزات الشخصية. في كل حالة، خلط يمكن أن يتحقق من خلال البيانات دقة أعلى.

4.3 ملخص تصنيف

يبين الشكل 1 نتائج كل اختبار ومجموعة ميزة، وبلغ متوسط على مدى ثلاث المصنفات. عموما، التجربة 2، المصنف تدريب هو أسوأ من أثر التدريب المصنف في اختبار 1. مقارنة مع ناقلات ميزة الجمع بين اختبارين، اختبار منفصل باستخدام بيانات ثاني أعلى قدر من الدقة، ولكن دقة من اختبار 1 البيانات وحدها قليلا سوءا. عن طريق دمج اختبار البيانات اثنين، وحققنا أفضل النتائج. BIONDI مجموعة ميزة استخدام الحالات الثلاث الأولى أفضل من مجموعة ميزة محسنة، ولكن بيوندي + مجموعة ميزة شخصية أعلى قليلا النتائج الدقة في تكوين مجتمعة.

SVM

NB

LR

بيوندي

64.9

73.7

68.4

بيوندي + كلمة

63.2

73.7

66.7

سلسلة (A) التجريبية

SVM

NB

LR

بيوندي

84.2

82.5

78.9

بيوندي + كلمة

84.2

86.0

77.2

(B) اتحدوا الجدول 5 مختلف المصنفات دقة التجريبية

FIG 1 غير الفقيرة متوسط متوسط الدقة ويتم توفير خصائص كل تجربة، والمصنفات

ومع ذلك، ليس كل الاتجاهات لاحظ لها معنى كبير. وكشف تحليل تأثير كبير للاختبار (ع = 5،010-7)، ولكن لم يكن لديك في اتجاهين ANOVA يتميز دقة التصنيف. كان توكي اختبار ما بعد خاصة لتحديد دقة الاختبار المشترك متفوقة لاختبار 1 (ع = 6،810-4)، اختبار 2 (ع = 5،010-7) واختبار المرتبطة (ع = 1،210-5). ومع ذلك، لا يوجد فرق كبير بين التجارب 1 و 2، والذي هو بين التجارب خلط مع عدم وجود علاقة ذات دلالة إحصائية.

تحليل 4،4 ميزة

من أجل تحديد ملامح المساهمة في الفرق بين منطقة الحزمة، كافة الميزات لدينا ثنائي الطرف اختبار t عدم تجانس اثنين من الذيل heteroscedastic اختبار t، ويتم تكرار المقارنة تصحيح بون FERRONI. لهذا التحليل، يمكننا النظر في معطيات التجارب مجتمعة، لأن لديهم أفضل دقة. لا توجد إلا بين المجموعتين تصحيح الخصائص المميزة، ويتم إعطاء هذه في الجدول 6. وتمشيا مع النتيجة التصنيف، حيث لا تردد أو الخط كبير. العدد الإجمالي في السيطرة على المجموعة لأول مرة أشاهد القراءة الأولى لأول مرة (تمر أولا تثبيتات الأولى) كان أعلى بكثير، ولكن مجموعة MCI مرة أخرى قراءة التثبيت الأول أعلى (في وقت لاحق تمرير تثبيتات الأولى) عدد. هذا يدل على أن المجموعة الضابطة كان ميل أكبر لقراءة النص من البداية إلى النهاية، وهم أكثر عرضة لتخطي كلمة ثم يعود مراجعة المرضى MCI. FIG 2 مثال على مختلف هذه الأوضاع القراءة. على الرغم من أن هذا الرقم لا يظهر الا في البيانات من اثنين من المشاركين، ولكن من الجدير بالذكر أن والتجارب بصمت (الشكل 2 (أ) و 2 (ج)) وقراءة التجربة (FIG 2 (ب) و 2 (د)) لديها فرق واضح.

(A) مجموعة مراقبة من المشاركين في الدراسة، بصمت

(B) السيطرة على المشاركين في الدراسة مجموعة والقراءة

المشاركين في الدراسة (C) MCI، القراءة الصامتة

المشاركين في الدراسة (D) MCI، القراءة مثال 2 المعرفي حركة العين المشاركين صحي (على) والمشاركين MCI (القاع)، وكانوا يستمعون إلى النص (يمين) 2 النص قراءة (يسار) من كتم (من اليسار). FIG يمثل كل مربع الأزرق الهيئة العربية للتصنيع (أي كلمة النص)؛ الدوائر تمثل عروض الخط الثابت حركة العين. FIG. (A) يظهر مثال بسيط نسبيا لمسار من خلال النص، وFIG. (C) يظهر على التراجع وإعادة قراءة تحتوي على أكثر من ذلك.

وجدت Ferna ndez وآخرون (2013) أن إجمالي المرضى تثبيت AD (التعلقات) عدد، والنظرة القراءة (تمرير أولا التثبيتات) و (الثانية تمرير التثبيتات) الزيادات تثبيت القراءة الثانوي. ومع ذلك، لاحظوا أن البصر القراءة الثانية (الثانية تمرير التثبيتات) من القراءة الأولى يراقب (تثبيتات تمرير أولا) أكثر وضوحا. نتائجنا مع زيادة كبيرة في القراءة الثانية البصر (تثبيتات الثانية تمرير) هو نفسه، ولكن الزيادة لا تمتثل سجلت أول نظرة القراءة. أحد الأسباب المحتملة لهذا الاختلاف قد يكمن في "القراءة الأولى مشاهدة تثبيتات تمريرة الأولى" على النحو المحدد في Ferna ndez وآخرون (2013) أعطيت "القراءة الأولى" من معنى، بما في ذلك جميع نتطلع للخروج من كلمة بينما يتم تعريف الثانية هو الذي يعرف بأنه "نعيد قراءة"؛ وفي هذا الإطار، يمكننا أن نقرأ مرة أخرى أول مرة يتم تعريف أنظارنا كأول نظرة القراءة. ومع ذلك، فرنانديز ونتائج الأبحاث الحالية لدينا تشير إلى أن في السيطرة على المجموعة لم ير البيانات والعكس تخطي وضع البحث.

5 القيود

في هذه الدراسة، مثل العديد من الدراسات التي تنطوي على المعطيات السريرية، كما لدينا عينة صغيرة جدا. وبالإضافة إلى ذلك، هذين النصين ليست صعبة للغاية لقراءة، لا تحتوي على المرضى MCI محددة يصعب قراءة النص (على سبيل المثال، باترسون وآخرون، 1994، لخص النطق التردد المنخفض غير رسمي الكلمات). وبالإضافة إلى ذلك، لا بد من تعديل بعض البيانات أو، في بعض الحالات، لأن نوعية المعايرة يتم استبعاد تماما.

 6 الاستنتاجات والعمل المستقبلي

في هذا التحليل، وجدنا أن نتمكن من استخدام المعلومات لتتبع العين للتمييز المرضى MCI والمجموعة الضابطة الصحية، ودقة أكثر من 80، في أفضل الأحوال دقة تصل إلى 86. كما هو متوقع، وهذا (2017) يميز بين المجموعة الضابطة ودقة المريض AD المبلغ عنها هو أقل من بعض بيوندي وآخرون. ومع ذلك، مما يدل على أن تتبع العين يمكن أن تكون وسيلة واعدة لاكتشاف المراحل المبكرة من الركود.

كما وجدنا أن تتبع حركة العين، والمشاركين يوفر بصمت مزيد من المعلومات التشخيصية من القراءة. مقارنة مع أي اختبار وحده، والبيانات المجمعة من شرطين التجريبية تؤدي إلى زيادة كبيرة في دقة التصنيف. في مجموعة البيانات المدمجة، لاحظ لأول مرة بين القراءة الأولى لأول مرة مجموعة محددة من قبل عدد من تثبيتات (تمرير المستويين الأول تثبيتات الأولى) (أعلى في المجموعة الضابطة) وإعادة قراءة التثبيت الأول (المجموعة MCI عالية)، فمن المستحسن في النص هناك بعض الفوضى ومسار غير الخطية.

بينما يراقب فئات تردد والنحوية ملحوظ بالفعل تقديم أعلى مستوى من دقة التصنيف، ولكن هذا لا يكفي لتحسين كبير في دلالة إحصائية، وليس زيادتها ميزات إثبات الفرق بين MCI وحشد HC من الناس. ربما هؤلاء اللاعبين هم في أوائل الخريف علم الأمراض (وهذا النص هو بسيط جدا في اللغة) يؤدي لا نرى تقدما كبيرا. أو هذه المتغيرات لا التقاط المعلومات اللغة الأكثر ملاءمة. على وجه الخصوص، هذه الميزات هي صعبة للغاية، ولكن الترددات العالية / الكلمات ذات التردد المنخفض وظيفة الكلمات / تنفيذ حكمي أو غير المتميز. ينبغي أن توجه البحوث المستقبل لتصميم مجموعة أكثر تطورا من المعلومات اللغوية في نموذج تتبع العين، على وجه الخصوص، أن تأخذ في الاعتبار سياق صدى وليس في عملية واحدة حرفيا.

مصدر آخر للمعلومات لم يتطور بعد إشارة الصوت معالجة باعتدال. ومن المرجح أن توفر عملية القراءة أكثر اكتمالا من العمليات المعرفية حركات العين والصوت معا من المعلومات، مثل وقفة، والترشيح، وتردد أو كلمة أخطاء. وبالإضافة إلى ذلك، الميزات الأخرى المدرجة في بيوندي دراسات تتبع العين قد يثبت أنه أكثر حساسية للفي وقت مبكر الادراكي.

في العمل مستقبلا، ونحن نخطط لاستكشاف العلاقة بين حركات العين والاستيعاب القراءة. كل مشارك في هذه الدراسة أيضا الإجابة على السؤال مع قراءة مقاطع فهمهم ذات الصلة. تحليل العلاقات بين خصائص الحركة المختلفة للاستجابة العين ودقة قد تساعدنا على فهم أفضل لاستراتيجيات القراءة ضعف الصحة والمعرفية المستخدمة من قبل القراء.

وأخيرا، وسوف تشمل أعمال المستقبل الادراكي شخصي (SCI) في تحليل المجموعة التجريبية. مثل هؤلاء الناس درجة في اختبارات وظائف الأعصاب الطبيعية. لذلك، قبل ظهور الأعراض السريرية، فإنه أمر صحي لفصل منطقة مراقبة قد تساعد في توفير وسيلة موثوق بها من نظم الإنذار المبكر.

الرد الخلفية "وصلة" إلى الحصول على وثائق رابط التحميل! ! !

الرعاية التقليدية منصة O2O لها أن هزيمة غسيل الملابس الذكية تكون فرصتهم للوقوف ذلك؟

وتم عزي Baojun سيارة لبقدر ما هي مفاجأة سارة: "الحصان" شعار تغيرت أخيرا

"الوجه طويل" الإصدار 2.0 SUV ثلاث سيارات معا وسونغ برو الوقود / DM / EV التعرض سيارة حقيقية

بلومبرغ Zaibao "الصين رقاقة زرعت المخابرات" أدلة جديدة؟ كسر خبراء أنباء رفض الاستجابة

"منظمة العفو الدولية الفصول الدراسية في نهاية الأسبوع" العصبية محة شبكة (مواد قانون) آلة التعلم "حفرة" سوف تواجه

لينوفو Z5 برو 855 نسخة من سوبر المنشور الرئيسي: أول شاشة المحاسبة 12G + 512G العالم

سحر الأزرق E2، ويأتي مع "سرادق" الهاتف MEIZU ......

1398 يوان! لينوفو Z5s النشر: شياو 710 / أول أندرويد 9.0

اليوم صوت الأساسية | وقد تم أخيرا رفع السرية هواوي، والمنافسين الجلوس لا يزال أخيرا

وCS10 جديد وقائية لقطة حقيقية الفهد الداخلية تجديد استبدال العمودي للمقارنة

حتى النهاية لك! واي فاي أو طائرة وسيتم طرح رسميا حيز التنفيذ في نهاية السنة!

EMNLP 2017 | جامعة شتوتغارت: مساعد وظيفة: NL أداة الاستعلام عن API