Η Ιατρική Ακριβείας αποτελεί μία νέα προσέγγιση της ιατρικής που λαμβάνει υπόψη το γενετικό προφίλ του κάθε ασθενούς, με στόχο τη χορήγηση εξατομικευμένης θεραπείας, αλλά και την πρόληψη ασθενειών. Ο καρκίνος είναι μια ασθένεια του γονιδιώματος, κι έτσι η Ιατρική Ακριβείας έχει ιδιαίτερη εφαρμογή στην ογκολογία. Πιο συγκεκριμένα, ένας από τους βασικούς στόχους της Ιατρικής Ακριβείας στην ογκολογία είναι η διάγνωση των γενετικών ιδιαιτεροτήτων του όγκου κάθε ασθενούς και, κατά συνέπεια, η χορήγηση συγκεκριμένης θεραπείας που θα στοχεύει αυτές τις ιδιαιτερότητες. Παράλληλα, μια άλλη πτυχή της Ιατρικής Ακριβείας στην ογκολογία είναι η πρόληψη της νόσου, μέσω της μελέτης του κληρονομικού καρκίνου, η οποία επιτρέπει την έγκαιρη αναγνώριση των ατόμων που έχουν αυξημένο κίνδυνο να διαγνωστούν με καρκίνο και, τελικά, τη σωστή κλινική διαχείρισή τους.Τα τελευταία χρόνια, η τεχνολογία αλληλούχησης του DNA έχει εξελιχθεί ραγδαία χάρη στις τεχνολογικές βελτιώσεις και τις νέες μεθόδους αυτοματοποίησης. Η εισαγωγή της μεθόδου Αλληλούχησης Επόμενης Γενιάς έχει ως αποτέλεσμα την παραγωγή μεγάλου όγκου γενετικών δεδομένων, τα οποία επιτρέπουν την κατανόηση των βιολογικών μηχανισμών που διέπουν την ανθρώπινη νόσο. Όλες αυτές οι εξελίξεις, έχουν συνηγορήσει στην ενίσχυση και την εφαρμογή της Ιατρικής Ακριβείας, ωστόσο, εισάγουν νέες προκλήσεις σχετικά με την ανάλυση, την καταγραφή και τη διανομή αυτού του τεράστιου όγκου δεδομένων. Η επιστήμη της βιοπληροφορικής έχει συμβάλει δυναμικά στην αντιμετώπιση αυτών των προκλήσεων. Επιτρέποντας την ανάλυση ακατέργαστων δεδομένων μεγάλης κλίμακας, τα οποία είναι αδύνατο να αναλυθούν χειροκίνητα, την ενσωμάτωση ετερογενών βιολογικών δεδομένων και τη χρήση προηγμένων υπολογιστικών και στατιστικών μεθόδων για την κατανόησή τους, η βιοπληροφορική παρέχει τα εργαλεία για την ανίχνευση βιοδεικτών και υποψηφίων φαρμάκων. Επιπλέον, συμβάλει και στην αποθήκευση αυτού του τεράστιου όγκου δεδομένων, μέσω των βάσεων βιολογικών δεδομένων που έχουν δημιουργηθεί, οι οποίες όχι μόνο διευκολύνουν τη διαχείριση των δεδομένων, αλλά και το διαμοιρασμό τους σε ολόκληρη την επιστημονική κοινότητα.Σκοπός της παρούσας διδακτορικής διατριβής αποτελεί η μελέτη εφαρμογών βιοπληροφορικής με κλινική χρησιμότητα στη γενετική καρκίνου και την ιατρική ακριβείας. Σε αυτό το πλαίσιο, αναπτύχθηκαν η βάση δεδομένων CanVaS που αποτελεί την πρώτη βάση δεδομένων για τον κληρονομικό καρκίνο που αφορά τον ελληνικό πληθυσμό, η οποία καταγράφει το φάσμα της γενετικής ποικιλομορφίας των Ελλήνων ασθενών με καρκίνο, καθώς και τα φαινοτυπικά και κλινικά χαρακτηριστικά αυτών των ατόμων, και η ροή διοχέτευσης εντολών διεργασιών VarTrace, με σκοπό την ανάλυση της γενετικής πληροφορίας που έχει παραχθεί από Αλληλούχηση Επόμενης Γενιάς DNA όγκου. Τέλος, αξιολογήθηκε ένα εμπορικό λογισμικό για τον εμπλουτισμό παραλλαγών που ανιχνεύονται σε ένα πείραμα Αλληλούχησης Επόμενης Γενιάς, με κλινική εφαρμογή.Η έλευση της μεθόδου Αλληλούχηση Επόμενης Γενιάς, έχει καταστήσει αναγκαία την καταγραφή των γενετικών και γονιδιωματικών δεδομένων σε πληθυσμιακό επίπεδο, με απώτερο σκοπό την μεγαλύτερη ακρίβεια στην αποτύπωση της γενετικής ετερογένειας μεταξύ, αλλά και εντός των πληθυσμών, καθώς και την έγκυρη κατηγοριοποίηση των σπάνιων αλληλομόρφων. Η ανάπτυξη εθνικών βάσεων γενετικών δεδομένων συνεισφέρει ουσιαστικά στην κατανόηση των γενετικών ιδιαιτεροτήτων ενός πληθυσμού και κατά συνέπεια στην καλύτερη διαχείριση των ασθενών με καρκίνο. Η βάση CanVaS αποτελείται από τη συλλογή δεδομένων που προέρχονται από τις γενετικές αναλύσεις 7.363 Ελλήνων που έχουν διαγνωσθεί με διαφόρους τύπους καρκίνου ή/και σύνδρομα που συμπεριλαμβάνουν κακοήθειες και υγιών συγγενών τους, οι οποίοι έχουν αναλυθεί για την ύπαρξη γενετικών αλλαγών σε 1 έως 97 γονίδια, παθογόνοι παραλλαγές των οποίων έχουν σχετισθεί με προδιάθεση στον καρκίνο. Οι συγκεκριμένες αναλύσεις έχουν πραγματοποιηθεί στο Εργαστήριο Μοριακής Διαγνωστικής του ΕΚΕΦΕ «Δημόκριτος». Η συλλογή δεδομένων του CanVaS αποτελείται από περίπου 24.000 λειτουργικά χαρακτηρισμένες παραλλαγές. Για κάθε παραλλαγή, περιλαμβάνεται η συχνότητα αλληλομόρφου για τον ελληνικό πληθυσμό, η αξιολόγηση, ερμηνεία και κλινική επίπτωσή της βάσει των κανόνων του American College of Clinical Geneticists (ACMG), καθώς και τα φαινοτυπικά χαρακτηριστικά των ατόμων που τη φέρουν. Επιπλέον, παρέχονται πληροφορίες σχετικά με τη γεωγραφική κατανομή των παραλλαγών σε ολόκληρη τη χώρα, επιτρέποντας τη μελέτη των απομονωμένων ελληνικών πληθυσμών. Αξίζει να σημειωθεί ότι έχει δοθεί προτεραιότητα στην ενσωμάτωση και τη διασύνδεση των δεδομένων με τις εδραιωμένες ανοιχτά προσβάσιμες βάσεις δεδομένων. Η βάση CanVaS υποστηρίζεται από το λογισμικό ανοιχτού κώδικα Leiden Open Variation Database (LOVD), επιτρέποντας έτσι την εύκολη διασύνδεση με κεντρικές πηγές δεδομένων. Κατ’ αυτόν τον τρόπο, χρησιμεύει ως μέρος της λύσης στη διαιρεμένη διαθεσιμότητα των γενετικών δεδομένων σε διάφορες βάσεις δεδομένων. Η βάση δεδομένων CanVaS είναι διαθέσιμη στην ηλεκτρονική διεύθυνση: http://ithaka.rrp.demokritos.gr/CanVaS. Η ροή διοχέτευσης εντολών διεργασιών VarTrace αναπτύχθηκε με σκοπό την ακριβή ανίχνευση σωματικών παραλλαγών στο DNA καρκινικών κυττάρων. Η Αλληλούχηση Επόμενης Γενιάς του DNA όγκων χρησιμοποιείται ευρέως για την ανίχνευση βιοδεικτών που μπορούν να αποτελέσουν στόχο για εξατομικευμένη θεραπεία. Χαρακτηριστικό παράδειγμα αποτελεί η εκτίμηση της ανεπάρκειας του ομόλογου ανασυνδυασμού σε όγκους μέσω της ανίχνευσης παθογόνων παραλλαγών στα γονίδια BRCA1 και BRCA2. Οι ασθενείς με ανεπαρκείς όγκους μπορούν να επωφεληθούν από τη χορήγηση αναστολέων των πολυμερασών της πολυαδενοφωσφορικής ριβόζης (polyADP-ribose polymerase, PARP). Ωστόσο, η αλληλούχηση του DNA όγκων κρύβει πολλές προκλήσεις, καθώς το γονιδίωμα του όγκου χαρακτηρίζεται από ετερογένεια, ενώ οι μέθοδοι διατήρησης του ιστού αλλοιώνουν το γενετικό του υλικό. Ως αποτέλεσμα, η αλληλούχηση του DNA των όγκων συχνά οδηγεί στην ανίχνευση αυξημένου αριθμού ψευδώς θετικών παραλλαγών. Το εργαλείο VarTrace αντιμετωπίζει αυτούς τους περιορισμούς μέσω της χρήσης πολλαπλών αλγορίθμων κλήσης παραλλαγών και της εξειδικευμένης προσαρμογής των παραμέτρων του. Προκειμένου να αποδειχθεί η απόδοση και η χρησιμότητά του, το VarTrace εφαρμόστηκε σε δεδομένα που προέρχονται από την αλληλούχηση των γονιδίων BRCA1 και BRCA2 σε όγκους 75 ασθενών με επιθηλιακό καρκίνωμα των ωοθηκών, ενώ τα αποτελέσματα συγκρίθηκαν με δύο εμπορικά διαθέσιμες ροές διοχέτευσης εντολών διεργασιών. Το VarTrace αποτελεί μια αυτοματοποιημένη, πλήρως διαμορφώσιμη και παράλληλη ροή διοχέτευσης εντολών διεργασιών, γραμμένη σε R και Perl και είναι διαθέσιμο στην ηλεκτρονική διεύθυνση: https://gitlab.com/dkalfakakou/TumorPipeline. Τέλος, αξιολογήθηκε ο χαρακτηρισμός παραλλαγών ως προς την επίπτωσή τους, όπως πραγματοποιείται από ένα φιλικό προς το χρήστη κι εμπορικά διαθέσιμο λογισμικό, το Illumina® VariantStudio v3.0 (VS), το οποίο χρησιμοποιεί ένα συγκεκριμένο σύνολο μεταγράφων. Για λόγους σύγκρισης, χρησιμοποιήθηκε το Ensembl VEP, ένα εργαλείο γραμμής εντολών ανοιχτού κώδικα, καθώς παρέχει ευελιξία όσον αφορά την επιλογή των μεταγράφων. Για την αξιολόγηση, χρησιμοποιήθηκαν δεδομένα που προέκυψαν από τον προσδιορισμό της αλληλουχίας 857 δειγμάτων DNA γαμετικής σειράς ασθενών με καρκίνο με τη μέθοδο Αλληλούχησης Επόμενης Γενιάς. Η σύγκριση μεταξύ των δύο συνόλων μεταγράφων έδειξε αναντιστοιχία σε ποσοστό 82,82%. Επιπλέον, χρησιμοποιώντας το προεπιλεγμένο σύνολο μεταγράφων του VS, δεν χαρακτηρίστηκαν σωστά το 11,45% των ταυτοποιημένων παραλλαγών απώλειας λειτουργίας, γεγονός που στην περίπτωση που ο γονιδιακός έλεγχος έχει κλινική εφαρμογή, μπορεί να έχει άμεσο αντίκτυπο στην κλινική διαχείριση των ασθενών. Τα αποτελέσματά μας επισημαίνουν τη σημασία της προσεκτικής επιλογής λογισμικού και μεταγράφων και την ανάγκη για αξιόπιστη ανάλυση δεδομένων, με σκοπό τη μείωση του ποσοστού σφάλματος των γονιδιακών ελέγχων και κατ’ επέκταση, τη βελτίωση της φροντίδας των ασθενών.