Παράρτημα Α. Περιγραφή Υποδείγματος Κεφαλαίου 2 Παράρτημα Β. Αποδείξεις Κεφαλαίου 5 ΒΙΒΛΙΟΓΡΑΦΙΑ vii ΚΑΤΑΛΟΓΟΣ ΠΙΝΑΚΩΝ 5.1 Διαστήματα Εμπιστοσύνης του Ακαθάριστου Εθνικού Προϊόντος με τη Μέθοδο της Ενότητας 5.3 5.2 Διαστήματα Εμταστοσύνης του Ακαθάριστου Εθνικού Προϊόντος απο Monte-Carlo Μέθοδο (επαναλήψεις =100) 118 6.1 Η κατάσταση του οικονομικού συστήματος στη χρονική στιγαή 30 κάτω απο k=0 και k=-0.69 ' 163 viii ΚΑΤΑΛΟΓΟΣ ΣΧΗΜΑΤΩΝ 2.1 Ο αιτιατός γράφος του υποδείγματος στο Παράρτημα Α 31 2.2 Η ιεραρχία πρώτου επιπέδου του αιτιατού γράφου του παραδείγματος 2.3 Η αιτιατή ιεραρχία μετά τα δυο στάδια της διαδικασίας 34 2.4 Το βαθύ υπόδειγμα του δυναμικού υποδείγματος του Παραρτήματος Α 36 3.1 Ο σταθμισμένος κατευθυνόμενος γράφος του (3.3)-(3.4) 46 3.2 Ενας σταθμισμένος κατευθυνόμενος κύκλος με n κόμβους 49 3.3 Το βαθύ υπόδειγμα του (3.17) 53 3.4 Τα βήματα της διαδικασίας διάγνωσης ενός οικονομικού υποδείγματος 57 3.5(a) Η ιεραρχία πρώτου επιπέδου του "βαθέως" υποδείγματος της εφαρμογής 58 3.5(β) Η ιεραρχία δευτέρου επιπέδου του "βαθέως" υποδείγματος της εφαρμογής 59 4.1 Η βασική δομή της διεργασίας μάθησης ελέγχου 79 4.2 Ο αλγόριθμος της Q-μάθησης ενός βήματος τη χρονική στιγμή t 97 6.1 Η αρχιτεκτονική της τυπιηής μάθησης με ενίσχυση 6.2 Η αρχιτεκτονική της υβριδικής μάθησης με ενίσχυση 6.3 Καμπύλες αδιαφορίας της u για δύο μεταβλητές-στόχους y 1 και y 2 137 6.4 Ομάδες καμπυλών q-αδιαφορίας για τις μεταβλητές στόχους y 1 και y 2 και μια συγκεκριμένη πολιτική δ 6.5 Ο αλγόριθμος της Πιθανολογικής Μεθόδου Αναζήτησης (PSM) 6.6 Η δομή πληροφοριών της οντότητας κατά τη διάρκεια αλλαγής κατάστασης σ* ένα χρονικό βήμα 6.7 Ο αλγόριθμος Ο-μάθησης 6.8 Σύγκλιση της Ο-μάθησης στη βέλτιστη πολιτική k=-0.69 6.9 Η τιμή της (6.30) για διαφορετικές πολιτικές (k) 6.10(a) Ανταμοιβή στην t περίοδο απο πολιτική -0.69 και με την αντικειμενική συνάρτηση της συμβατικής μεθόδου ελέγχου 6.10(β) Βελτίωση απόδοσης Ο-μάθησης για πολιτική -0.69 (ανταμοιβή) 6.11(a) Μέση ανταμοιβή στην t περίοδο απο πολιτική -0.69 και με την αντικειμενική συνάρτηση της συμβατικής μεθόδου ελέγχου 6.11(β) Βελτίωση απόδοσης Ο-μάθησης για πολιτική -0.69 (μέση ανταμοιβή) ix