24.8 C
Athens
Παρασκευή, 29 Μαρτίου, 2024
ΑρχικήΚοινωνίαΥγείαΜία επανάσταση στον κόσμο της Βιοπληροφορικής: Το πρόγραμμα τεχνητής νοημοσύνης AlphaFold

Μία επανάσταση στον κόσμο της Βιοπληροφορικής: Το πρόγραμμα τεχνητής νοημοσύνης AlphaFold


Της Ελένης Κωστούλα,

Αυτό το καλοκαίρι, η Deep Mind έδωσε την πιο ισχυρή απάντηση, μέχρι τώρα, στο ερώτημα της δεκαετίας που αφορά την έρευνα για την τεχνητή νοημοσύνη: το AlphaFold, μια πλατφόρμα λογισμικού που θα φέρει επανάσταση στην κατανόησή μας για τη βιολογία.

Το 1972, στην ομιλία αποδοχής του για το Νόμπελ Χημείας, ο Christian Anfinsen έκανε μια ιστορική πρόβλεψη: κατ’ αρχάς θα πρέπει να είναι δυνατός ο προσδιορισμός του τρισδιάστατου σχήματος μιας πρωτεΐνης με βάση αποκλειστικά τη μονοδιάστατη σειρά μορίων που την αποτελούν. Η εύρεση λύσης σε αυτό το παζλ, γνωστό ως «πρόβλημα της αναδίπλωσης των πρωτεϊνών», αποτελεί μια μεγάλη πρόκληση στον τομέα της βιολογίας για μισό αιώνα και έχει παραπλανήσει γενιές επιστημόνων. Η τεχνητή νοημοσύνη έδωσε τη λύση σε αυτό το ζήτημα.

Οι πρωτεΐνες είναι το κέντρο της ζωής καθαυτής. Είναι τόσο σημαντικές, αφού είναι πολύ ευέλικτες και σε θέση να αναλάβουν μια τεράστια γκάμα διαφορετικών δομών και λειτουργιών, πολύ περισσότερες από άλλους τύπους βιομορίων (π.χ. λιπίδια ή υδατάνθρακες). Αυτή η απίστευτη ευελιξία είναι άμεση συνέπεια του τρόπου κατασκευής των πρωτεϊνών. Οι πρωτεΐνες δεν έχουν μονοδιάστατη διάταξη. Για να είναι λειτουργικές αναδιπλώνονται σε μία σύνθετη τρισδιάστατη  μορφή.

Σύμφωνα με το παράδοξο του Levinthal, οποιαδήποτε δεδομένη πρωτεΐνη μπορεί θεωρητικά να υιοθετήσει κάτι σαν 10^300 διαφορετικές διαμορφώσεις. Βάσει αυτού, θα χρειαζόταν περισσότερος χρόνος από τη συνολική ηλικία του σύμπαντος για να αναδιπλωθεί μια πρωτεΐνη σε κάθε διαμόρφωση που είναι διαθέσιμη, ακόμα κι αν επιχειρούσε εκατομμύρια διαμορφώσεις ανά δευτερόλεπτο. Ωστόσο, με κάποιο τρόπο, από όλες αυτές τις πιθανές διαμορφώσεις, κάθε πρωτεΐνη αναδιπλώνεται αυθόρμητα σε ένα συγκεκριμένο σχήμα και εκτελεί ανάλογα τον βιολογικό της σκοπό. Έτσι, το να γνωρίζουμε πώς αναδιπλώνονται οι πρωτεΐνες είναι εξαιρετικά δύσκολο όσο και απολύτως απαραίτητο για την κατανόηση των βιολογικών διεργασιών.

Πολύπλοκα τρισδιάστατα σχήματα αναδύονται από μια σειρά αμινοξέων.
Πηγή Εικόνας: deepmind.com

Για τον σκοπό αυτό η Deep Mind, μια βρετανική εταιρεία επιστημονικών ανακαλύψεων, η οποία έχει αποκτηθεί από την Google, ανέπτυξε ένα σύστημα τεχνητής νοημοσύνης (AI) με το όνομα AlphaFold. Η πιο πρόσφατη έκδοση του AlphaFold είναι μια νέα προσέγγιση μηχανικής μάθησης που ενσωματώνει φυσική και βιολογική γνώση σχετικά με τη δομή της πρωτεΐνης, αξιοποιώντας ευθυγραμμίσεις πολλαπλών ακολουθιών, στον σχεδιασμό του αλγορίθμου βαθιάς μάθησης. Το 2020, το AlphaFold αναγνωρίστηκε ως λύση στο πρόβλημα της αναδίπλωσης των πρωτεϊνών από τους διοργανωτές του σημείου αναφοράς CASP14, μιας διετούς πρόκλησης για τις ερευνητικές ομάδες να δοκιμάσουν την ακρίβεια των προβλέψεών τους σε σχέση με πραγματικά πειραματικά δεδομένα. Η άνευ προηγουμένου ακρίβεια και ταχύτητα του AlphaFold επέτρεψαν τη δημιουργία μιας εκτεταμένης βάσης δεδομένων που προβλέπει τη δομή των πρωτεϊνών και δίνει τη δυνατότητα στους επιστήμονες να χρησιμοποιήσουν την υπολογιστική πρόβλεψη δομής ως βασικό εργαλείο στην έρευνά τους. Το σύστημα AlphaFold χρησιμοποιεί ένα σύνολο βάσεων δεδομένων παρεχόμενο από το διεθνές ινστιτούτο EMBL-EBI του Ευρωπαϊκού Εργαστηρίου Μοριακής Βιολογίας.

Πριν από το AlphaFold, γνωρίζαμε τις τρισδιάστατες δομές σχεδόν μόνο για το 17% των περίπου 20.000 πρωτεϊνών στο ανθρώπινο σώμα. Αυτές οι πρωτεϊνικές δομές που έχουν ανακαλυφθεί, είχαν επεξεργαστεί με κόπο στο εργαστήριο κατά τη διάρκεια των δεκαετιών, μέσω κουραστικών πειραματικών μεθόδων, όπως η κρυσταλλογραφία ακτίνων Χ και ο πυρηνικός μαγνητικός συντονισμός, που απαιτούν εξοπλισμό πολλών εκατομμυρίων δολαρίων και μήνες ή και χρόνια δοκιμών και σφαλμάτων.

Ξαφνικά, χάρη στο AlphaFold, έχουμε πλέον τρισδιάστατες δομές για σχεδόν όλο (98,5%) το ανθρώπινο πρωτέωμα. Από αυτές, το 36% προβλέπεται με πολύ υψηλή ακρίβεια και ένα άλλο 22% προβλέπεται με υψηλή ακρίβεια. Σε επίπεδο ανά πρωτεΐνη, το 43,8% των πρωτεϊνών έχει μια σίγουρη πρόβλεψη για τουλάχιστον τα τρία τέταρτα της αλληλουχίας τους, ενώ 1.290 πρωτεΐνες περιέχουν μια σημαντική περιοχή

Το Alpha Fold πρόκειται για ένα σύστημα το οποίο εκπαιδεύτηκε μηχανικά βάσει των υπαρχόντων δεδομένων, τα οποία είναι δημοσιευμένα στο ευρύ κοινό. Τέτοια είναι το PDB, η Τράπεζα Δεδομένων Πρωτεϊνών, η οποία περιέχει τρισδιάστατες δομές και σχετικές αλληλουχίες πρωτεϊνών των δομών που έχουν προσδιοριστεί μέχρι στιγμής. Μία άλλη βάση δεδομένων που βοήθησε στην εκπαίδευση, είναι το UniProt, το οποίο περιέχει τις αλληλουχίες αμινοξέων για περισσότερες από διακόσιες εκατομμύρια πρωτεΐνες. Το μοντέλο της AlphaFold είναι κατασκευασμένο με μετασχηματιστές ανάλογους με αυτούς που χρησιμοποιούνται σε γνωστές γλώσσες προγραμματισμού και οι οποίοι έχουν σχεδιαστεί έτσι, ώστε να λειτουργούν με τρισδιάστατες δομές.

H μέθοδος επεξεργασίας των πληροφοριών του συστήματος με σκοπό την τελική παρουσίαση της διαμορφωμένης πρωτεΐνης.
Πηγή Εικόνας: deepmind.com

Το AlphaFold προβλέπει μία μορφή στερεοδιάταξης για κάθε πρωτεΐνη, ως εκ τούτου δεν μπορεί να προβλέψει πρωτεΐνες που έχουν δυναμική μορφή μέσα στον οργανισμό, όπως π.χ. εγγενώς διαταραγμένες πρωτεΐνες. Ενώ ακόμα, δεν δίνει ξεκάθαρες απαντήσεις για πολυπρωτεϊνικά συμπλέγματα, σχέσεις πρωτεϊνών με DNA και σχέσεις πρωτεϊνών με μικρά μόρια. Παρόλα αυτά, λύση σε αυτά τα ζητήματα μπορεί να δοθεί με τη συνεχή εκμάθηση του συστήματος της AlphaFold.

Επιλογικά, το AlphaFold είναι σε θέση να χειριστεί το φυσικό πλαίσιο που λείπει από τις γνώσεις που έχουμε για τη δομή μιας πρωτεΐνης και να παράγει ακριβή μοντέλα σε δύσκολες περιπτώσεις, όπως πρωτεΐνες που αναδιπλώνονται μόνο με την παρουσία μιας άγνωστης ομάδας αίμης. Το σύστημα έχει ήδη αποδείξει τη χρησιμότητά του στην πειραματική κοινότητα, τόσο για μοριακή αντικατάσταση όσο και για ερμηνεία χαρτών κρυογονικής ηλεκτρονικής μικροσκοπίας. Μελλοντικά, θα αποτελέσει απαραίτητο εργαλείο της σύγχρονης βιολογίας και σύμφωνα με το Ευρωπαϊκό Εργαστήριο Μοριακής Βιολογίας (EMBL) «θα προσφέρει νέες ιδέες και κατανόηση των θεμελιωδών διαδικασιών που σχετίζονται με την υγεία και τις ασθένειες, με εφαρμογές στη βιοτεχνολογία, την ιατρική, τη γεωργία, την επιστήμη των τροφίμων και τη βιομηχανική. Θα χρειαστούν πιθανώς μία ή δύο δεκαετίες μέχρι να εκτιμηθεί σωστά ο πλήρης αντίκτυπος αυτής της εξέλιξης».

Μπορείτε να βρείτε την βάση δεδομένων της AlphaFold στον ακολουθώντας τον σύνδεσμο εδώ.


ΕΝΔΕΙΚΤΙΚΕΣ ΠΗΓΕΣ
  • R. Toews (2021), AlphaFold Is The Most Important Achievement In AI—Ever, forbes.com. Διαθέσιμο εδώ
  • K. Tunyasuvunakool, J. Adler, D. Hassabis et al (2021), Highly accurate protein structure prediction for the human proteome, Nature volume 596, pages590–596. Διαθέσιμο εδώ
  • J. Jumper, R. Evans, D. Hassabis et al (2021), Highly accurate protein structure prediction with AlphaFold, Nature volume 596, pages583–589. Διαθέσιμο εδώ
  • How can AI and AlphaFold help?, alphafold.ebi.ac.uk. Διαθέσιμο εδώ

 

TA ΤΕΛΕΥΤΑΙΑ ΑΡΘΡΑ

Ελένη Κωστούλα
Ελένη Κωστούλα
Γεννήθηκε το 2001 και έχει μεγαλώσει στην Αθήνα. Είναι απόφοιτος του Κολλεγίου Αθηνών και προπτυχιακή φοιτήτρια της Ιατρικής Σχολής του Πανεπιστημίου Πατρών. Μιλάει αγγλικά και γαλλικά και αγαπά την ανάγνωση βιβλίων, την παρακολούθηση θεατρικών παραστάσεων, την μουσική και το χορό. Την απασχολούν θέματα υγείας και επιστήμης, αλλά είναι ευαισθητοποιημένη και σε ό,τι αφορά φλέγοντα κοινωνικοπολιτικά ζητήματα. Ασχολείται με τον εθελοντισμό και η ενασχόλησή της με την αρθρογραφία ξεκινά από τα μαθητικά κιόλας χρόνια.