Para peneliti mencocokkan kekuatan lipat protein AlphaFold2 DeepMind dengan model yang lebih cepat dan tersedia secara gratis – TechCrunch

0
20


DeepMind mengejutkan dunia biologi akhir tahun lalu ketika model AI AlphaFold2-nya meramalkan struktur protein (masalah umum dan sangat sulit) dengan sangat akurat sehingga banyak yang menyatakan bahwa masalah yang telah berlangsung puluhan tahun itu “terpecahkan”. Sekarang para peneliti mengklaim telah melompati DeepMind dengan cara DeepMind melompati seluruh dunia, dengan RoseTTAFold, sebuah sistem yang melakukan hal yang hampir sama dengan biaya komputasi yang lebih kecil. (Oh, dan itu gratis untuk digunakan.)

AlphaFold2 telah menjadi pembicaraan di industri sejak November, ketika mengalahkan persaingan di CASP14, kompetisi virtual antara algoritma yang dibangun untuk memprediksi struktur fisik protein yang diberikan urutan asam amino yang menyusunnya. Model dari DeepMind begitu jauh di depan yang lain, sangat akurat dan andal, sehingga banyak orang di lapangan telah berbicara (setengah serius dan dengan humor yang baik) tentang pindah ke bidang baru.

Tetapi satu aspek yang tampaknya tidak memuaskan siapa pun adalah rencana DeepMind untuk sistem tersebut. Itu tidak dijelaskan secara lengkap dan terbuka, dan beberapa khawatir bahwa perusahaan (yang dimiliki oleh Alphabet/Google) berencana untuk sedikit banyak menyimpan saus rahasia untuk diri mereka sendiri — yang akan menjadi hak prerogatif mereka tetapi juga agak bertentangan dengan etos saling membantu. dalam dunia ilmiah.

Memperbarui: Secara mengejutkan, DeepMind menerbitkan metode yang lebih rinci di jurnal Nature hari ini. Kode tersedia di GitHub. Ini sangat mengurangi kekhawatiran yang disebutkan di atas, tetapi kemajuan yang dijelaskan di bawah ini masih sangat relevan. Saya juga telah menambahkan komentar dari tim itu di bagian bawah artikel.

Kekhawatiran itu tampaknya setidaknya sebagian diperdebatkan oleh penelitian dari para peneliti Universitas Washington yang dipimpin oleh David Baker dan Minkyung Baek, yang diterbitkan dalam edisi terbaru jurnal Science. Baker, Anda mungkin ingat, baru-baru ini memenangkan Hadiah Terobosan untuk pekerjaan timnya memerangi COVID-19 dengan protein yang direkayasa.

Model baru tim, RoseTTAFold, membuat prediksi pada tingkat akurasi yang sama menggunakan metode yang Baker, menanggapi pertanyaan melalui email, dengan jujur ​​mengakui terinspirasi oleh yang digunakan oleh AlphaFold2.

“Grup AlphaFold2 mempresentasikan beberapa konsep tingkat tinggi baru pada pertemuan CASP14. Berawal dari ide-ide ini, dan dengan banyak brainstorming kolektif dengan rekan-rekan di grup, Minkyung telah mampu membuat kemajuan luar biasa dalam waktu yang sangat singkat, ”katanya. (“Dia luar biasa!” tambahnya.)

Contoh struktur protein yang diprediksi dan kebenaran dasarnya. Skor di atas 90 dianggap sangat baik. Kredit Gambar: UW/Baek dkk

Kelompok Baker kurang lebih menempati posisi kedua di CASP14, bukan prestasi yang berarti, tetapi mendengar metode DeepMind yang dijelaskan bahkan secara umum menempatkan mereka pada jalur tabrakan. Mereka mengembangkan jaringan saraf “tiga jalur” yang secara bersamaan mempertimbangkan urutan asam amino (satu dimensi), jarak antara residu (dua dimensi) dan koordinat dalam ruang (tiga dimensi). Implementasinya berada di luar kompleks dan jauh di luar cakupan artikel ini, tetapi hasilnya adalah model yang mencapai tingkat akurasi yang hampir sama — tingkat, perlu diulang, yang benar-benar belum pernah terjadi sebelumnya kurang dari setahun yang lalu.

Terlebih lagi, RoseTTAFold menyelesaikan tingkat akurasi ini jauh lebih cepat — yaitu, menggunakan daya komputasi yang lebih sedikit. Seperti yang dikatakan kertas itu:

DeepMind melaporkan menggunakan beberapa GPU selama berhari-hari untuk membuat prediksi individual, sedangkan prediksi kami dibuat dalam satu lintasan melalui jaringan dengan cara yang sama yang akan digunakan untuk server…versi RoseTTAFold end-to-end membutuhkan ~10 menit aktif GPU RTX2080 untuk menghasilkan koordinat tulang punggung untuk protein dengan kurang dari 400 residu.

Dengar itu? Itu adalah suara ribuan ahli mikrobiologi yang menghela nafas lega dan membuang draft email yang meminta waktu superkomputer. Mungkin tidak mudah untuk menggunakan 2080 akhir-akhir ini, tetapi intinya adalah GPU desktop kelas atas mana pun dapat melakukan tugas ini dalam hitungan menit, alih-alih membutuhkan cluster kelas atas yang berjalan selama berhari-hari.

Persyaratan sederhana membuat RoseTTAFold cocok untuk hosting publik dan distribusi juga, sesuatu yang mungkin tidak pernah ada di kartu untuk AlphaFold2.

“Kami memiliki server publik tempat siapa pun dapat mengirimkan urutan protein dan strukturnya diprediksi,” kata Baker. “Ada lebih dari 4.500 pengiriman sejak kami memasang server beberapa minggu yang lalu. Kami juga telah membuat kode sumber tersedia secara bebas.”

Ini mungkin tampak sangat khusus, dan memang demikian, tetapi pelipatan protein secara historis telah menjadi salah satu masalah terberat dalam biologi dan masalah yang tak terhitung jumlahnya telah didedikasikan untuk komputasi kinerja tinggi. Anda mungkin ingat [email protected], aplikasi komputasi terdistribusi populer yang memungkinkan orang menyumbangkan siklus komputasi mereka untuk mencoba memprediksi struktur protein. Jenis masalah yang mungkin membutuhkan waktu seribu hari atau minggu untuk menyelesaikan komputer — pada dasarnya dengan solusi paksaan dan memeriksa kecocokannya — sekarang dapat diselesaikan dalam hitungan menit di satu desktop.

Struktur fisik protein sangat penting dalam biologi, karena proteinlah yang melakukan sebagian besar tugas dalam tubuh kita, dan protein yang harus dimodifikasi, ditekan, ditingkatkan, dan seterusnya untuk alasan terapeutik; pertama, bagaimanapun, mereka perlu dipahami, dan sampai November pemahaman itu tidak dapat dicapai dengan andal secara komputasi. Di CASP14 itu terbukti mungkin, dan sekarang telah tersedia secara luas.

Ini bukan, pada akhirnya, “solusi” untuk masalah pelipatan protein, meskipun sentimen telah diungkapkan. Sebagian besar protein yang diam dalam kondisi netral sekarang dapat diprediksi strukturnya, dan itu memiliki dampak besar di banyak domain, tetapi protein jarang ditemukan “diam dalam kondisi netral.” Mereka memutar dan meliuk untuk mengambil atau melepaskan molekul lain, untuk memblokir atau menyelinap melalui gerbang dan protein lain, dan umumnya untuk melakukan semua yang mereka lakukan. Interaksi ini jauh lebih banyak, kompleks dan sulit diprediksi, dan baik AlphaFold2 maupun RoseTTAFold tidak dapat melakukannya.

“Ada banyak bab menarik di depan… ceritanya baru saja dimulai,” kata Baker.

Mengenai makalah DeepMind, Baker memberikan komentar berikut dalam semangat persahabatan perguruan tinggi:

Saya telah membaca, dan berpikir ini adalah makalah indah yang menggambarkan karya fantastis.

Makalah DeepMind sebenarnya sangat melengkapi makalah kami, dan saya pikir itu tepat bahwa itu tidak keluar setelah kami, karena pekerjaan kami benar-benar didasarkan pada kemajuan mereka.

Saya pikir pembaca akan senang membaca kedua makalah tersebut — keduanya sangat jauh dari duplikasi. Seperti yang kami tunjukkan dalam makalah kami, metode mereka lebih akurat daripada kami, dan sekarang akan sangat menarik untuk melihat fitur apa dari pendekatan mereka yang bertanggung jawab atas perbedaan yang tersisa. Kami sudah menggunakan RoseTTAFold untuk desain protein dan prediksi struktur kompleks protein-protein yang lebih sistematis, dan kami bersemangat untuk meningkatkannya dengan cepat, bersama dengan pemodelan rantai tunggal tradisional, dengan memasukkan ide-ide dari makalah DeepMind.

Jika Anda ingin tahu tentang sains dan potensi dampaknya, pertimbangkan untuk membaca akun yang jauh lebih detail dan teknis ini metode dan kemungkinan langkah selanjutnya yang ditulis setelah kinerja CASP14 AlphaFold2.



Sumber

LEAVE A REPLY

Please enter your comment!
Please enter your name here