Lo que las mentes detrás de la IA temen que ya no podamos controlar

Con cada nuevo avance, la inteligencia artificial demuestra un mayor nivel de autonomía y complejidad. Sin embargo, ese progreso también plantea preguntas inquietantes: ¿realmente entendemos cómo toman decisiones estos sistemas? ¿Podremos seguir el hilo de su razonamiento en el futuro cercano? Algunas de las mentes más influyentes del sector ya tienen su respuesta… y no es alentadora.

Una advertencia urgente desde las entrañas de la tecnología

Más de 40 científicos de empresas como Google DeepMind, OpenAI, Meta, Amazon y Anthropic han dado a conocer su preocupación: podríamos estar cerca de perder la capacidad de comprender cómo razonan las inteligencias artificiales más avanzadas. El documento, publicado en el repositorio científico arXiv, propone intensificar la investigación sobre métodos de monitoreo que nos permitan seguir el proceso mental de estos modelos antes de que emitan una respuesta.

Lo que proponen es simple en su planteo, pero ambicioso en ejecución: observar las llamadas cadenas de pensamiento (CdP) que los modelos generan internamente. Este rastro de razonamiento, escrito en lenguaje natural, ofrecería una ventana para anticipar decisiones dañinas o desviaciones del comportamiento esperado. La clave está en analizar los pasos intermedios, no solo la conclusión final.

Aunque reconocen que este método no garantiza una vigilancia perfecta —ya que algunos modelos podrían ocultar intenciones poco éticas—, coinciden en que es una herramienta valiosa para prevenir riesgos antes de que los sistemas se vuelvan demasiado autónomos o difíciles de interpretar.

La inteligencia artificial ya automatiza el 25% de las tareas laborales: ¿quiénes están en mayor riesgo? — FreePik

Cómo piensan las máquinas (y por qué deberíamos prestarle atención)

Las cadenas de pensamiento son una técnica que permite a modelos de lenguaje como ChatGPT “pensar en voz alta” antes de responder. En lugar de ofrecer una solución inmediata, desglosan el problema en pasos lógicos, justificando cada conclusión. Este mecanismo no solo aporta transparencia, sino que también permite detectar errores, sesgos o posibles intenciones maliciosas en tiempo real.

Por ejemplo, si se pregunta cuántas manzanas tiene alguien tras comprar más, una IA con CdP respondería detallando cada etapa del cálculo, en lugar de limitarse a decir “cinco”. Este nivel de detalle puede ser usado por herramientas de supervisión para identificar procesos sospechosos o inconsistencias que en otro contexto pasarían desapercibidas.

Los científicos destacan dos razones clave para vigilar estas cadenas:

Cuando razonar es obligatorio: Algunas tareas complejas requieren que el modelo exponga su razonamiento para completarlas. Esto crea una oportunidad para detectar comportamientos peligrosos que necesitan pensamiento estructurado.
Cuando razonan incluso sin necesidad: Muchos modelos tienden a “pensar en voz alta” de manera espontánea. Aunque no siempre es fiable, este patrón puede usarse como un punto de acceso para analizar el comportamiento interno del sistema.

¿Es la inteligencia artificial incontrolable? Las advertencias de Geoffrey Hinton, el “padrino” de la IA — Pexels – iStock.

Un esfuerzo colectivo con nombres de peso

La preocupación no proviene de voces marginales. Entre los firmantes del informe se encuentran nombres destacados en el desarrollo y la investigación de IA: Joe Benton de Anthropic, Mark Chen de OpenAI, Allan Dafoe y Anca Dragan de Google DeepMind, entre otros. Todos ellos coinciden en que estamos frente a una oportunidad única de mejorar la seguridad de estas herramientas antes de que su complejidad las vuelva opacas e incontrolables.

La propuesta concreta es desarrollar monitores automatizados de cadenas de pensamiento: sistemas capaces de leer y analizar las secuencias internas de razonamiento de la IA, señalando interacciones sospechosas, bloqueando respuestas dañinas o derivando las más ambiguas a revisión humana.

En conjunto con otros métodos de seguridad ya existentes, esta técnica podría marcar la diferencia entre una IA controlada y una que actúe según lógicas imposibles de descifrar para los humanos. El tiempo, sin embargo, corre en contra. Mientras el desarrollo avanza a un ritmo imparable, entender cómo piensan las máquinas podría ser nuestro último recurso para no perderlas de vista.

🖥️ ¿Te apasiona la tecnología? En nuestro canal de YouTube analizamos gadgets, novedades tech y mucho más.

▶ Suscribirme

Carolina Couselo

Carolina Couselo cubre cine, series y anime en Oasis Nerd. Cinéfila apasionada, sus reseñas se destacan por una mirada crítica que va más allá de los títulos obvios — siempre en busca de esa película o serie que todavía no encontró su audiencia. Si hay un underdog en las pantallas, Carolina probablemente ya lo vio.

Voyagers of Nera recibe su mayor actualización gratuita y confirma su esperado salto a PS5 y Xbox

Mousebusters llega a consolas y convierte una invasión de fantasmas en una divertida aventura de píxel

Hundred Nights: DIFU presenta un original simulador de gestión donde deberás reconstruir el inframundo oriental

Trending

Voyagers of Nera recibe su mayor actualización gratuita y confirma su esperado salto a PS5 y Xbox

Mousebusters llega a consolas y convierte una invasión de fantasmas en una divertida aventura de píxel

Hundred Nights: DIFU presenta un original simulador de gestión donde deberás reconstruir el inframundo oriental

La hija del pantano mezcla supervivencia, misterio y un pasado imposible de olvidar