¿Podría ChatGPT superar tus tareas? Investigadores de la Universidad de Illinois lo pusieron a prueba al inscribir la versión gratuita de ChatGPT en un curso completo de ingeniería de pregrado. La IA manejó matemáticas básicas con facilidad, pero falló cuando los problemas se volvieron más complejos, lo que reveló importantes deficiencias en el aprendizaje de estudiantes y máquinas.
En la Universidad de Illinois en Urbana-Champaign, investigadores del Departamento de Ingeniería Aeroespacial asignaron a ChatGPT las mismas tareas que a los estudiantes de un curso semestral de sistemas de control. En problemas matemáticos estructurados, ChatGPT obtuvo una calificación de sobresaliente. Sin embargo, al enfrentarse a tareas abiertas que requerían un razonamiento más profundo, la IA apenas logró una calificación de sobresaliente.
Al final, ChatGPT obtuvo una calificación de B en el curso: aprobó, pero no fue perfecto. El promedio de la clase para estudiantes reales fue ligeramente superior, con casi un 85 %. Según el investigador principal y estudiante de doctorado, Gokul Puthumanaillam, la baja capacidad de razonamiento de la IA fue su mayor obstáculo.
I'm told ChatGPT has been upgraded to be able to solve math problems and that is it the future of math tutoring. But my hit rate is ~0 so far... and I wasn't even trying trick questions.
— François Chollet (@fchollet) February 1, 2023
Not dissing the system at all -- just a PSA. pic.twitter.com/ZiqN0Tlo7V
El estudio muestra que, si bien los estudiantes podrían usar ChatGPT para desenvolverse, esto no significa que realmente estén aprendiendo. La IA puede ser rápida, pero rápida no siempre significa correcta. Además, depender completamente de ChatGPT podría conducir a un aprendizaje superficial, donde los estudiantes aprueban pero retienen poco.
ChatGPT puede generar respuestas en segundos, pero no todas son fiables. En varios casos, ofreció explicaciones extrañas o completamente incorrectas, incluso con todos los materiales del curso.
Incluso se utilizaron términos como oscilaciones cuasiperiódicas, una jerga que nunca se enseñó en clase.
Cuando se corrigió ChatGPT y se le volvió a plantear una pregunta similar, a veces mejoró, lo que indica una capacidad de aprendizaje limitada . Sin embargo, su rendimiento general se mantuvo estancado , sin una mejora significativa con el tiempo.
Melkior Ornik, profesor de ingeniería aeroespacial y asesor de Puthumanaillam, afirma que el estudio es una llamada de atención para los educadores. "Al igual que las calculadoras en las clases de matemáticas, ChatGPT es una herramienta que llegó para quedarse", señaló.
Pero en lugar de luchar contra ello, Ornik planea rediseñar sus cursos para incluir más problemas abiertos y proyectos prácticos que desafíen a los estudiantes más allá de lo que la IA puede replicar. El objetivo es impulsar a los estudiantes a un pensamiento más profundo, no solo a respuestas rápidas.
El equipo de investigación señaló que este estudio utilizó la versión gratuita de ChatGPT, la misma que probablemente usarían la mayoría de los estudiantes. Si bien el modelo podría tener un rendimiento ligeramente superior, la principal conclusión es la siguiente: la IA es excelente para resolver problemas rutinarios, pero carece del razonamiento necesario para tareas complejas y críticas.
University of Illinois Grainger College of Engineering. "Using ChatGPT, students might a course, but with a cost." ScienceDaily. ScienceDaily, 22 April 2025. <www.sciencedaily.com/releases/2025/04/250422132018.htm>.