Resumen -El modelo LOPE es un sistema inteligente autónomo con aprendizaje basado en formación y ponderación de teorías. En los últimos años, se han elaborado varias modificaciones al modelo que han mejorado el rendimiento de su aprendizaje y de su planificación. Sin embargo, hay ciertos aspectos que aún no han sido abordados y cuyo diseño e implementación se cree incrementaría la convergencia de aprendizaje del modelo. Ellos son: (a) el proceso de aprendizaje sólo se produce en la fase de observación, perdiendo la oportunidad de aprender a partir de la evaluación del resultado de los planes ejecutados, (b) el índice utilizado para medir la calidad de los planes antes de ser ejecutados es un parámetro fijo, dejando abierta la posibilidad de que se ejecute una alta cantidad de planes condenados al fracaso. Este proyecto se propone desarrollar modificaciones o extensiones al modelo con el fin de mejorar estos aspectos e incrementar la curva de aprendizaje del sistema.Palabras Clave -sistemas inteligentes autónomos, aprendizaje no supervisado, planificación, evaluación de la planificación, formación de teorías, ponderación de teorías.
I. JUSTIFICACIÓN DE LA PROPUESTAEl modelo LOPE [8] [9] es un sistema inteligente autónomo (SIA) con aprendizaje basado en formación y ponderación de teorías. Puede ser descrito como un robot de exploración que percibe el entorno a través del sistema sensor y registra teorías locales a partir de la situación previa, la acción ejecutada y la situación resultante. Dichas teorías son utilizadas para la construcción de planes que le permitirán alcanzar sus propios objetivos. En los últimos años, se han elaborado varias modificaciones al modelo con el fin de mejorar el rendimiento de su aprendizaje y de su planificación. En [10] se incorporó una arquitectura multiagente que permite el intercambio de teorías; en [15] se utilizó un sistema multiagente pero en este caso se definieron distintos perfiles de agentes, cada uno de los cuales con un determinado método de adquisición y transmisión de conocimiento; en [17] se propuso un mecanismo de ponderación de planes distinto; por último, en [24] se tomó como marco de trabajo el algoritmo de ponderación elaborado por López pero se propuso la aplicación de algoritmos genéticos para mejorar el rendimiento.A pesar de que en cada una de las soluciones propuestas, el rendimiento del sistema mejoró, hay ciertos aspectos del modelo que aún no han sido abordados y cuyo diseño e implementación es el objetivo de este proyecto de investigación. En primer lugar, es importante destacar que tanto en el modelo LOPE original como en las variantes mencionadas, el proceso de aprendizaje sólo se produce dentro de la fase de observación. En esta etapa, de acuerdo al resultado de lo percibido por el sistema sensor, el sistema refuerza teorías o pondera y crea teorías mutantes. Ahora bien, en el caso que exista un plan en ejecución y que uno de sus pasos no haya logrado la situación esperada, el sistema sólo se limita a abortar el plan y a devolver el control al planif...