Simulacion de Reinforcement Learning

Entrena y optimiza itinerarios de aprendizaje personalizados utilizando clones virtuales de estudiantes y algoritmos de Reinforcement Learning.

Estado de la Simulacion

Desarrollo

Vista Previa Tecnica

Vision General de la Arquitectura RL

Estado (S)

Variables del perfil del estudiante

Accion (A)

Seleccion de actividad de aprendizaje

Recompensa (R)

Senal de resultado de aprendizaje

Componentes del Espacio de Estados

Variables demograficas (V1-V4)

Factores emocionales (V5-V6)

Factores cognitivos (V7-V12)

Rendimiento actual (V16-V20)

Consola de Simulacion

> Inicializando entorno RL de InfiniteLearner...

> Cargando perfiles de estudiantes desde la base de datos...

> Estudiantes cargados: 3 clones virtuales

> Espacio de actividades: 48 actividades de aprendizaje

> Niveles de dificultad: [Basico, Elemental, Intermedio, Avanzado]

> Iniciando episodio de entrenamiento 1/1000...

> Agente: PPO (Proximal Policy Optimization)

> Tasa de aprendizaje: 0.0003

> Episodio 1: Recompensa = 0.45 | Pasos = 12

> Episodio 50: Recompensa = 0.68 | Pasos = 10

> Episodio 100: Recompensa = 0.82 | Pasos = 8

> Episodio 500: Recompensa = 0.91 | Pasos = 7

> Entrenamiento en progreso... _

Stack Tecnologico

Python

PyTorch

Gymnasium

Stable-Baselines3

PostgreSQL

Flask API

Clones Virtuales de Estudiantes

Maria (Clon)

Perfil de alto rendimiento

Pablo (Clon)

Perfil de rendimiento medio

Ana (Clon)

Perfil que necesita apoyo

Metricas de Entrenamiento

Recompensa Media 0.91

Perdida de Politica 0.023

Episodios Completados 512/1000

Explora el Codigo Fuente

El modulo de simulacion RL es de codigo abierto y esta disponible con fines de investigacion

Ver en GitHub