Οι ενότητες ελεύθερου κείμενου των ιατρικών διαγνώσεων περιέχουν πληθώρα δεδομένων για ασθενείς, ασθένειες και περίπλοκες διαγνωστικές διαδικασίες. Ωστόσο, η ανάλυση δεδομένων σε μορρφή ελεύθερου κείμενου δεν είναι εύκολη με τη χρήση ηλεκτρονικών υπολογιστών και εργαλείων προτυποποίησης βασισμένα σε ηλεκτρονικό υπολογιστή (computer-based models). Η πλειονότητα των τεχνικών ανάλυσης που βασίζονται σε επεξεργασία φυσικής γλώσσας (natural language processing NLP) δεν έχουν την ικανότητα να εξαγάγουν με ακρίβεια πολύπλοκες διαγνωστικές πληροφορίες και τις μεταξύ τους σχέσεις. Επίσης δεν παρέχουν επαρκή αναπαράσταση γνώσης (knowledge representation KR) για την υποστήριξη εφαρμογών εξόρυξης δεδομένων.Για την αντιμετώπιση αυτών των περιορισμών, ένα νέο πλαίσιο πληροφορικής (informatics) θεσπίζεται για την ανάλυση ιατρικών διαγνώσεων σε ελεύθερο κείμενο. Το πλαίσιο βασίζεται σε προτυποποιήσεις με βάση την τεχνητή νοημοσύνη (artificial intelligence AI). Οι προτυποποιήσεις αυτές ενσωματώνουν τεχνικές επεξεργασίας φυσικής γλώσσας για την εξαγωγή πληροφοριών (natural language processing information extraction NLP-IE), αναπαράσταση γνώσης που βασίζεται στην οντολογία, αλγόριθμο με βάση το σχήμα ν-σχέσων (n-ary relational schema) και προσεγγίσεις εξόρυξης δεδομένων που βασίζονται στην εντροπία της πληροφορίας (information entropy). Με τον τρόπο αυτό, ιατρικές διαγνώσεις μετατρέποντε σε τριπλέτες που σχηματίζουν γραφήματα γνώσης (knowledge graphs KGs) για περαιτέρω αναλύσεις με τη βοήθεια ηλεκτρονικών υπολογιστών. Ο σκοπός είναι να διευκολυνθεί η ανάλυση ιατρικών διαγνώσεων με τη χρήση ηλεκτρονικών υπολογιστών. Το πλαίσιο πληροφορικής (informatics) που διαπραγματεύεται αυτή η διατριβή έχει δυνατότητες να επηρεάσει ευρέως αναλύσεις στη διαγνωστική ιατρική και επίσης να επεκταθεί και σε άλλους τομείς της βιοϊατρικής.
[ACCESS RESTRICTED TO THE UNIVERSITY OF MISSOURI AT REQUEST OF AUTHOR.] Free-text sections of diagnostic reports contain a wealth of data on patients, diseases, and complex diagnostic processes. However, free-text data are a poor starting point for computer-based analytics. The majority of natural language processing (NLP) based approaches lack a capacity to accurately extract complex diagnostic entities and their relationships as well as to provide adequate knowledge representation (KR) for down-stream data mining applications. In order to overcome these limitations, a novel informatics framework is introduced for the analysis of free-text diagnostic reports. The framework is based on artificial intelligence (AI) modeling. Here, AI-based modeling integrates natural language processing information extraction techniques (NLP-IE), ontology-based knowledge representation, n-ary relations according to ontological patterns, and information entropy-based data mining approaches. Diagnostic reports are transformed to knowledge graphs (KGs) of relational triples for further analysis using computers. The goal is to facilitate analysis of diagnostic reports using computers. This informatics framework has potential to broadly impact diagnostic medicine and to be extended to other biomedical domains as well.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.