DeepMind مفتوحة المصدر AlphaFold، استقل نموذج التنبؤ البروتين "الطبيعة"

وذكرت شبكة لى فنغ: تذكر أن الحرب AlphaFold الشهرة ذلك؟

2 نوفمبر 2018، في وقد 13th العالمي السنوي المنافسة بروتين بنية التنبؤ (CASP)، تلقى AlphaFold على أعلى الدرجات من 25 نوعا من التنبؤ بنية البروتين من 43 نوعا من البروتينات، لتحتل المرتبة الأولى في المتسابقين 98. لطريقة التنبؤ DeepMind، لعدم وجود أوراق الإفراج محددة، ويعتقد كثير من العلماء هو القدرة الحاسوبية المعلقة يجعل فاز AlphaFold البطولة.

15 يناير DeepMind على نموذج AlphaFold ورمز عبر منشور لاستعراض الأقران في "الطبيعة" مجلة أعلاه. وكان نموذج مفتوح المصدر ورمز.

الرمز: الشبكي: //github.com/deepmind/deepmind-research/tree/master/alphafold_casp13

نموذج: الشبكي: //www.biorxiv.org/content/10.1101/846279v1.full.pdf

إدخال DeepMind باستخدام طريقتين مختلفتين في الخصائص الفيزيائية للنموذج التنبؤ بنية البروتين وتوقع بناؤها. وتعتمد كلتا الطريقتين على عمق وتصميم الشبكات العصبية، بالإضافة إلى ذلك، التنبؤ نموذج التنبؤ الخصائص الرئيسية للتسلسل الجيني الكامل للبروتين، هذه الميزات وتشمل: أ: المسافة بين الأمينية أزواج الحمضية، ب: ربط هذه الأحماض الأمينية الزاوية بين السندات.

يتم التعبير عن نوعين من طرق عرض الصور AlphaFold دقة التنبؤ، تمثل بكسل الإنارة المسافة بين الأحماض الأمينية، وأكثر إشراقا لون بكسل، واثنين من المخلفات (المخلفات) من أقرب. السطر الأول هو الصورة الحقيقية من الصف الأوسط من الصور يظهر متوسط المسافة.

خطوات محددة لكل منها التنبؤ الشبكة العصبية من مخلفات البروتين التوزيع الاحتمالي، ثم يتم الجمع بين هذه الاحتمالات ككسر، فمن الممكن لتقدير دقة التنبؤ بنية البروتين. وبالإضافة إلى ذلك، الشبكة العصبية المدربة واحدة، لتقييم قربها من بنية البروتين وتوقع استنادا إلى التكوين الفعلي للمبلغ من جميع المسافات. ثم باستخدام نظام التسجيل (بنيت أيضا مع الشبكات العصبية) للعثور على توقعات الأمثل.

شبكة لى فنغ: كامل عملية التنبؤ بنية البروتين

الأسلوب الثاني هو التدرج درجة النسب الأمثل، وذلك لتحقيق الدقة أكثر دقة. وبشكل أكثر تحديدا، يتم تطبيق النسب متدرجة خلال التنبؤ هيكل كامل لسلسلة البروتين، بدلا من تكشفت بروتين "الحطام".

نموذج مقدمة

https://www.biorxiv.org/content/10.1101/846279v1.full.pdf

ووفقا لDeepMind الصحف العامة "تحسين التنبؤ بنية البروتين باستخدام توقع التوجهات بين بقايا". AlphaFold خليط من خوارزميات التعلم التقليدية والعمق معا: CNN + رشيد.

البناء اتجاه معين والمسافة بين العصبية بقايا التنبؤ الشبكة، تليها النمذجة تناظر رشيد بنية البروتين، وإصلاح الهيكلي. في حين أن أسلوب التصميم الأمثل لتكملة التنبؤ رشيد القيد وظيفة رشيد الطاقة، وبالتالي توليد نموذج أكثر دقة.

على الرغم من أن بيانات التدريب مجموعة من كل بروتين طبيعي، إلا أن نموذج تعيين دائما احتمال أكبر لتصميم بروتينات جديدة، والعثور على المفتاح لتحديد بقايا هيكل البروتين مطوية وإنشاء الكمية المستقلة "الجنس المثالي (المثالية)" قياس .

وبشكل أكثر تحديدا، ويتكون هذا النموذج من عنصرين أساسيين: عمق المتبقية شبكة عصبونية التفافية، أي متعددة تسلسل المحاذاة (متعددة تسلسل التحالفات) كمدخل؛ ومعلومات الانتاج للبروتينات هي بقايا نسبيا المسافة والاتجاه.

نموذج آخر هو إقامة رشيد السريع (سريع رشيد نموذج) لالمسافة والاتجاه للحد من المخلفات ملزمة على أساس شبكة الإخراج على تدريب مجموعات البيانات، قاعدة بيانات البروتين (PDB) DeepMind سلسلة استخدام البروتين الذي لديه 15051 المعلومات، والتي هي 30 من البيانات المسمى.

حول نماذج الاختبار، DeepMind باستخدام اثنين من المستقلين مجموعة الاختبار: أول واحد من CASP13، حجر كريم من التجربة الثانية. وعلاوة على ذلك، في CASP13 مجموعة البيانات، وتستخدم DeepMind بدلا من بروتين تسلسل كامل لتسلسل مجال محاكاة.

أسطورة: A: يمثل مجموعة لتحويل من بقايا واحدة مع بقايا أخرى من زاوية والمسافة. B: هندسة هيكل الشبكة العصبية بين بقايا التنبؤ MSA؛ C: عملية توقع نظرة عامة

بين بقايا التنبؤ هندسية، DeepMind مخلفات العمق باستخدام الشبكة العصبية. معظم أساليب التنبؤ مختلفة، DeepMind بالإضافة إلى المسافة بين السندات التنبؤ، والتوجه بين بقايا تقع ضمن نطاق توقعاتها. كما هو مبين أعلاه، فإن التوجه بين بقايا 1 و بقايا ممثلة ب 3 واثنين من زاوية طائرة ثنائي السطح. حيث يمثل زاوية دوران على طول محور وهمي (ربط ذرتين من المخلفات). رؤية زاوية طائرة ذرات C محددة من بقايا من بقايا 1 الاتجاه. وعلاوة على ذلك، مع د مختلفة و، والإحداثيات [ثيتا] غير المتناظرة، وهذا يتوقف على أمر من المخلفات. تماما 6 المعلمات د، ،

تحديد الوضع النسبي للذرات في العمود الفقري لاثنين من مخلفات، وتوقع ستة المعلمات أيضا أن تكون الشبكة العصبية.

يتم استخراج خصائص مدخلات الشبكة العصبية من MSA، وتنفيذ عملية ديناميكية. ميزات المدخلات ذات بعد واحد ما يلي: البروتين المشفرة الساخن الأمينية تسلسل الحامض، والموقف من مصفوفة محددة التردد (موقف معين تردد المصفوفة)، الكون يجند (الكون الموضعية). هذه الميزات ثم أحادي البعد البلاط الأفقي والرأسي، ثم مكدسة معا لإنتاج 2 42 = 84 الوحدات 2-الأبعاد خريطة الميزة. وعلاوة على ذلك، DeepMind الاقتران استخراج الاحصاءات الصادرة عن وزارة الشؤون الإجتماعية، عكس اقتران المعلومات المستمدة من الحد من إدخال مصفوفة تغاير MSA تكوينها لFIG. حساب اول موقع (موقع واحد) وموقعين (اثنان الفندق) يتم احتساب عدد تردد، على النحو التالي:

حيث، A و B تمثل الأمينية الخصائص الحمضية، [دلتا] هو دلتا كرونيكير، وم عدد المتبادل للتسلسل MSA، وتسلسل متر على الأقل 80 تسلسل التماثل. بين

ثم يتم حساب مصفوفة التغاير عينة باستخدام الصيغة التالية:

وبعد ذلك، في انهار (أي من وزن ثابت إضافي لن في حق قطري) بعد أخذ معكوس (كما يشار إلى مصفوفة الدقة):

تحويل القاعدة:

تحديث:

في عملية تدريب محددة، DeepMind تقييمها باستخدام عبر الكون، نتائج التقييم من خسارة تساوي مجموع الخسائر 4 لها نفس الوزن وفرع الشبكة. وعلاوة على ذلك، وذلك باستخدام آدم معدل التعلم محسن 1E-4، واحتمال 85 التسرب المحافظة عليها. وبشكل عشوائي في قطاعات واسعة سيتم عينة عشوائية من البروتين على مقياس لوغاريتمي متوسط طوله أكثر من 300 الأحماض الأمينية اتفاقات الخدمات الإدارية الإدخال. ثم توزيع المسافة، يتم تحويل قيمة احتمال بالمعادلة التالية إلى القيم النتيجة احتمال:

في المعادلة أعلاه هو ثابت (= 1.57)، دي هي المسافة من ط ال بن،

بي هو احتمال أن المسافة من ط ال بن، N هو العدد الإجمالي من بن لادن.

لتوزيع الاتجاه، دون الأخذ بعين الاعتبار تطبيع، بدوره احتمال صيغة النتيجة هي:

وأخيرا، تحويل جميع الدرجات التي كتبها رشيد إلى إمكانية على نحو سلس، والتقليل من الطاقة الكامنة باستخدام القيود. وخلاصة القول لدينا نموذج كامل يمكن تلخيصها على النحو التالي: ألقيت في سلسلة البروتين، وتوليد هيكل، على درجة من درجة لتحديد ما إذا اقتنعت، غير راض ثم إنشاء.

وصف رمز

وفقا لتقدم جيثب DeepMind في المقدمة، ويشمل هذا الرمز شبكة التنبؤ، والأوزان الثقيلة والنماذج ذات الصلة التي نشرت في "الطبيعة" مجموعة البيانات مجلة CASP13. وبالإضافة إلى ذلك، وصفا مفصلا لتحميل البيانات، وكيفية إدخال البيانات، وكيفية تشغيل نظام التشغيل كما يعطي توجيهات مفصلة. لى فنغ شبكة AI تقنية مراجعة جيثب العنوان التالي مرة أخرى، والقارئ المهتم للبدء بسرعة في محاولة ذلك!

https://github.com/deepmind/deepmind-research/tree/master/alphafold_casp13

الشبكات العصبية الاصطناعية بسيطة جدا، "العلم" كشفت عمل جديد التشعبات العصبية أيضا ضمنيا الحوسبة السلطة

الشبكة العصبية النظرية الافتراضية لا طائل من ذلك؟ تويتر، رديت مزدوجة النقاش ساحة المعركة، الناري

أول "مسابقة الذكاء الاصطناعي الوطني" كانت النتائج خارجا! 1000000 $ جائزة أعلى

الروبوت إعادة التأهيل للتعافي من الإيكولوجية، ومنطق ذكي العالمي فورييه

أعيدت 18 الأضاحي رماد فريق مكافحة الحرائق في جنوب نينغشيا، وعشرات الآلاف من الناس من "اتخاذ المنزل بطلا".

الزهور واحدا تلو الآخر لعلامة 2728 شهيدا، يانتاى خروف شؤون المحاربين القدامى إجلالا لشهداء

واحد ملصقات نقطة | اليوم، ياوتشنغ ثم نرحب انتصار 20 عامل طبي

رائحة المنطقة الساخنة | انخفضت الواردة الهواء البارد شاندونغ أدنى درجة الحرارة إلى 0 ! جينان الكانولا جميلة مفتوحة حقل زهرة

انفجر! حلقة حديقة صناعية تشنغيانغ حريق انفجار، تصاعد الدخان من موقع الحادث

تعازي! توفي ما لا يقل عن 59 عاملاً في المجال الطبي منذ الوباء ، يرجى تذكر هذه القائمة

الشرطة يهاى في مواقع مختلفة الصمت، لأشيد الأبطال

جينان 188 مليون الإنترنت الاجتياح، أقنعت المقبرة الرئيسية في المدينة على العودة إلى 2769 شخص