Durante décadas, la ciencia explicó el aprendizaje humano con una lógica sencilla y casi mecánica: repetir lo que funciona, evitar lo que sale mal. Un esquema heredado de los experimentos con animales, adoptado por la psicología moderna y convertido incluso en la base de muchos sistemas de inteligencia artificial. Bajo esa mirada, la motivación se reduce a una ecuación de premio y castigo.

Pero la experiencia cotidiana rara vez encaja del todo en ese modelo. Las personas insisten en conductas que no siempre dan buenos resultados, repiten errores conocidos y, aun así, logran adquirir habilidades complejas sin necesidad de refuerzos constantes. Esa contradicción fue el punto de partida de un nuevo trabajo científico que propone una lectura más humana —y menos automática— de cómo aprendemos realmente.

El estudio replantea una idea muy arraigada: que la clave del aprendizaje está en la recompensa. En su lugar, pone el foco en dos protagonistas silenciosos que suelen pasar desapercibidos, pero que influyen de manera decisiva en nuestras decisiones diarias y en la forma en que incorporamos nuevas conductas.

Explorando el cerebro: una historia sobre la razón humana
iStock.

Cuando el modelo clásico ya no alcanza

El llamado “aprendizaje por refuerzo” sostiene que el cerebro compara expectativas con resultados y ajusta la conducta en función de esa diferencia. Si el resultado es mejor de lo esperado, la acción se refuerza; si no, se descarta. Este mecanismo, asociado a señales químicas como la dopamina, ha sido durante años el marco dominante para explicar cómo aprendemos.

Sin embargo, al analizar con más detalle el comportamiento humano, ese esquema empieza a mostrar fisuras. En tareas simples, las personas aprenden rápido, pero cuando la complejidad aumenta, la lógica de premio y castigo no siempre predice lo que ocurre. En muchos casos, la gente sigue eligiendo lo mismo aunque sepa que no es la mejor opción.

La investigación, liderada por Anne G. E. Collins desde una universidad estadounidense de referencia, propone que el cerebro no depende de un único sistema para aprender. Por el contrario, utiliza varios mecanismos en paralelo. Algunos son conscientes y deliberados; otros, automáticos y difíciles de desactivar. Esa combinación explica por qué no siempre actuamos de forma “racional”.

Un ejemplo cotidiano ayuda a entenderlo: recordar qué llave abre qué puerta puede ser trivial con dos opciones, pero se vuelve confuso cuando el número aumenta. En ese punto, el cerebro deja de apoyarse en la memoria consciente y recurre a atajos, incluso si no son perfectos.

El cerebro reinventa los recuerdos cada vez: por qué nunca vivimos dos veces la misma experiencia
FreePïk

Memoria de trabajo y hábitos: los verdaderos protagonistas

Al revisar datos de experimentos previos, el equipo observó que la memoria de trabajo cumple un rol central cuando la información es manejable. Permite retener detalles, probar opciones y corregir errores con rapidez. Pero este recurso es limitado: cuando se satura, entra en escena otro sistema mucho más persistente.

Los hábitos funcionan como rutas ya marcadas. No requieren atención constante y se activan casi de forma automática. El problema es que no siempre distinguen entre una buena decisión y una equivocada. Por eso, ante un error, muchas personas tienden a repetir la misma acción, no porque crean que es correcta, sino porque es familiar.

El análisis mostró que, frente a equivocaciones, los participantes solían insistir por costumbre más que por evaluación consciente. El comportamiento observado encajaba mejor con un modelo basado en hábitos apoyados por la memoria de trabajo que con el aprendizaje por refuerzo tradicional.

Lejos de ser un defecto, esta interacción parece ser una estrategia eficiente del cerebro. La memoria dirige la atención al inicio del aprendizaje y los hábitos se encargan de automatizar la conducta una vez que se repite lo suficiente, incluso si el proceso no es perfecto.

Lo que este hallazgo cambia en educación y tecnología

Las conclusiones del estudio van más allá del laboratorio. Si el aprendizaje no depende únicamente de recompensas, entonces muchos métodos educativos y modelos de inteligencia artificial podrían estar simplificando en exceso el comportamiento humano.

La memoria de trabajo, aunque frágil, cumple una función clave: sostener la atención el tiempo suficiente para que los hábitos se formen. Así se aprenden habilidades complejas que luego parecen “naturales”, como conducir o escribir sin mirar el teclado. Una vez consolidado el hábito, el esfuerzo consciente disminuye.

Entender este equilibrio puede ayudar a diseñar mejores estrategias de enseñanza, más realistas y menos basadas en estímulos externos. También abre la puerta a sistemas tecnológicos que imiten mejor la forma en que las personas aprenden en la vida real, con errores, repeticiones y atajos incluidos.

Más que descartar el aprendizaje por refuerzo, la investigación sugiere integrarlo en un marco más amplio. Uno donde la memoria, la atención y los hábitos expliquen por qué aprender no es solo una cuestión de premios, sino de cómo el cerebro organiza la experiencia cotidiana.

🔬 ¿Te fascina la ciencia? Suscribite a nuestro canal de YouTube para contenido científico que te va a volar la cabeza.

▶ Suscribirme

Deja tu comentario

Trending

Descubre más desde Oasis Nerd

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo