ES EN DE
UPO
Erasmus+ KA3 - Experimentacion de Politicas Europeas
EU

Simulacion de Reinforcement Learning

Entrena y optimiza itinerarios de aprendizaje personalizados utilizando clones virtuales de estudiantes y algoritmos de Reinforcement Learning.

Estado de la Simulacion
Desarrollo

Vista Previa Tecnica

Vision General de la Arquitectura RL
Estado (S)

Variables del perfil del estudiante

Accion (A)

Seleccion de actividad de aprendizaje

Recompensa (R)

Senal de resultado de aprendizaje

Componentes del Espacio de Estados
Variables demograficas (V1-V4)
Factores emocionales (V5-V6)
Factores cognitivos (V7-V12)
Rendimiento actual (V16-V20)
Consola de Simulacion

> Inicializando entorno RL de InfiniteLearner...

> Cargando perfiles de estudiantes desde la base de datos...

> Estudiantes cargados: 3 clones virtuales

> Espacio de actividades: 48 actividades de aprendizaje

> Niveles de dificultad: [Basico, Elemental, Intermedio, Avanzado]

>

> Iniciando episodio de entrenamiento 1/1000...

> Agente: PPO (Proximal Policy Optimization)

> Tasa de aprendizaje: 0.0003

>

> Episodio 1: Recompensa = 0.45 | Pasos = 12

> Episodio 50: Recompensa = 0.68 | Pasos = 10

> Episodio 100: Recompensa = 0.82 | Pasos = 8

> Episodio 500: Recompensa = 0.91 | Pasos = 7

> Entrenamiento en progreso... _

Stack Tecnologico
Python
PyTorch
Gymnasium
Stable-Baselines3
PostgreSQL
Flask API
Clones Virtuales de Estudiantes
MG
Maria (Clon)

Perfil de alto rendimiento

PR
Pablo (Clon)

Perfil de rendimiento medio

AM
Ana (Clon)

Perfil que necesita apoyo

Metricas de Entrenamiento
Recompensa Media 0.91
Perdida de Politica 0.023
Episodios Completados 512/1000

Explora el Codigo Fuente

El modulo de simulacion RL es de codigo abierto y esta disponible con fines de investigacion

Ver en GitHub