Ο καρκίνος του μαστού είναι η πιο κοινή κακοήθεια στις γυναίκες σε όλο τον κόσμο και με το δεύτερο υψηλότερο ποσοστό θνησιμότητας. Σε ασθενείς με καρκίνο του μαστού, η κύρια αιτία θανάτου δεν είναι ο πρωτογενής όγκος, αλλά οι μεταστάσεις του σε απομακρυσμένα όργανα. Προκειμένου να δημιουργηθεί μια μετάσταση, τα καρκινικά κύτταρα εισέρχονται στην κυκλοφορία του αίματος, μεταφέρονται σε σημεία απομακρυσμένων οργάνων, όπου και πολλαπλασιάζονται (Κυκλοφορούντα Καρκινικά Κύτταρα, ΚΚΚ). Ο στόχος αυτής της εργασίας είναι η χρήση στατιστικών και υπολογιστικών τεχνικών για τον προσδιορισμό των διαφορών και οι ομοιοτήτων μεταξύ των δειγμάτων αίματος και ιστών ασθενών με καρκίνο και υγιών ατόμων με απώτερο σκοπό το μοριακό χαρακτηρισμό του μεταστατικού καρκίνου του μαστού και την παρουσία των ΚΚΚ. Μια μεγάλη συλλογή από δημόσια διαθέσιμα σύνολα δεδομένων γονιδιακής έκφρασης από μικροσυστοιχίες DNA έχει συγκεντρωθεί και τα δεδομένα αυτά έχουν προσεκτικά συγχωνευθεί προκειμένου να ξεπεραστούν τεχνικές και άλλες διαφοροποιήσεις. Ένας αριθμός στατιστικών συγκρίσεων μεταξύ των διαφόρων σημείων προέλευσης (αίμα ή ιστού) ή την κατάσταση ασθένειας (καρκινικοί ή υγιείς ασθενείς) των δειγμάτων μας οδήγησε σε ένα μικρό σύνολο 27 γονιδίων ("βιοδεικτών"). Οι βιολογικοί αυτοί δείκτες σχετίστηκαν προσεκτικά με πηγές της βιολογικής γνώσης, όπως τα βιολογικά δίκτυα, και υποβλήθηκαν σε νέες αλγοριθμικές διαδικασίες, έτσι ώστε να εντοπιστούν περαιτέρω γονίδια για την εποπτευόμενη (supervised) και μη επιβλεπόμενη (unsupervised) ταξινόμηση των ασθενών με καρκίνο του μαστού.