Creo que en mi vida había leído tantos papers como ahora. Le pido un resumen a la IA y decido si vale la pena leerlo entero. Este tiene 113 páginas, publicado por el MIT, WashU y UCLA y define lo que significa «valor» en la era de los agentes autónomos.
Aquí está lo que importa y por qué deberías prestarle atención.
Idea central: en un mundo donde la ejecución es prácticamente gratuita, el recurso más escaso no es la inteligencia. Es la capacidad humana de verificar que lo que se ejecutó tiene sentido.
Vamos a desgranar esto.
La inteligencia se ha desacoplado de la biología
Durante 300.000 años, la cognición humana fue el motor principal del progreso en la Tierra. Cada avance, desde la geometría euclidiana hasta el programa Apollo, salió de un cerebro biológico limitado por el metabolismo, la supervivencia y la fricción social.
Hoy la IA rompe esa ecuación. No porque «piense como nosotros», sino porque puede mapear y recombinar el conocimiento humano de forma exhaustiva, a un coste marginal que tiende a cero. Los autores lo expresan de forma muy clara: esto no es simplemente automatización de rutinas. Es la mercantilización de cualquier tarea que pueda ser medida — da igual si antes la considerábamos «creativa», «analítica» o «innovadora».

Lo que cambia no es que la IA haga cosas. Es que el coste marginal de hacer cosas medibles se desploma. Y cuando algo se puede medir, se puede automatizar. Da igual la complejidad, el prestigio o los años de formación que antes requería.
La idea clave: La línea que separa lo automatizable de lo que no ya no es «rutinario vs. no rutinario». Es «medible vs. no medible». Si tu trabajo puede reducirse a una métrica, la IA puede hacerlo. Punto.
El verdadero cuello de botella no es la inteligencia

Aquí es donde el paper se pone realmente interesante. La mayoría de modelos económicos siguen tratando la IA como un sustituto laboral o un complemento del juicio humano. Asumen implícitamente que si la máquina produce output barato, eso se traduce directamente en valor. Esto en algunos estudios lo han llamado «AI Workslop», te dejo este artículo del blog de David Hurtado que lo ha desgranado.
En el paper, se argumenta que esto es peligrosamente incompleto. En una economía de agentes autónomos, la verdadera escasez no es generar respuestas. Es la capacidad biológica de auditarlas, validarlas y asumir la responsabilidad de las mismas. De esto ha hablado también Pep Martorell, por ejemplo lo pudes escuchar en el podcast con Jon Hernandez. Si una persona se equivoca, le pides responsabilidades. ¿Y si se equivoca un agente?
Lo llaman el Ancho de banda de verificación humana. Y es finito, biológico, y no escala con los modelos.
La divergencia estructural: generar vs. validar
Podemos generar resultados mucho más rápido de lo que podemos permitirnos auditarlos. La porción verificable de la economía es el nuevo cuello de botella.
La divergencia estructural: Generar frente a Validar
El paper formaliza la transición hacia la AGI como la colisión de dos curvas de costes que van en direcciones opuestas:
Por un lado, el Coste de Automatizar cae exponencialmente, impulsado por la escala de cómputo y el conocimiento acumulado. Por otro, el Coste de Verificar apenas se mueve, atado a los límites biológicos del tiempo humano y la experiencia encarnada.
La brecha entre ambas curvas es lo que denominan la Brecha de Medición (Δm): la distancia entre lo que los agentes pueden ejecutar y lo que los humanos podemos permitirnos auditar. Y esa brecha se está ensanchando de forma estructural.
Un dato llama la atención del paper: en SWE-bench Verified, la precisión de los agentes pasó del 4,4% al 71,7% en un solo año. Los horizontes de tareas que pueden completar de forma autónoma se duplican en ciclos inferiores a un año. Mientras tanto, nuestra capacidad de supervisión sigue siendo… humana.
Los 4 regímenes del trabajo en la era agéntica

Esta es quizá la visualización más potente del paper. Cruzando la facilidad de automatización con la facilidad de verificación, obtienes cuatro zonas:
La Zona Industrial Segura es donde queremos estar: barato de automatizar, fácil de verificar. Piensa en el chat con un LLM, la generación de imágenes, fragmentos cortos de código. Son cosas que puedes revisar en segundos.
La Artesanía Humana es donde lo difícil de automatizar se cruza con lo fácil de verificar. Territorio humano, pero con valor claro y demostrable.
La Zona Tácita Pura es directamente territorio humano: ni automatizable ni verificable. Pensamiento, juicio profundo, relaciones.
Pero la zona que debería quitarnos el sueño es la Zona de Riesgo Descontrolado. Barato de automatizar, imposible de verificar a escala. Y es aquí donde el enfoque «human-in-the-loop» fracasa. Porque cuando los agentes hacen tareas de largo horizonte y alto riesgo, el cuello de botella de la verificación humana hace que el modelo se venga abajo.
¿Por qué el «human-in-the-loop» no aguanta?

El paper identifica dos fuerzas que erosionan el equilibrio actual de supervisión humana de forma simultánea:
Erosión desde abajo, el bucle del junior perdido. La experiencia humana es un activo que se acumula haciendo trabajo repetitivo y de nivel de entrada. Si la IA automatiza ese trabajo, destruimos el campo de entrenamiento que produce a los verificadores del mañana. El paper cita datos empíricos: ya se observa un descenso del 16% en el empleo de trabajadores de 22-25 años en ocupaciones expuestas a la IA.
Erosión desde dentro, la Maldición del Codificador. Los expertos que hoy alinean y corrigen los modelos (vía RLHF y feedback) están, literalmente, minando su propia intuición tácita para convertirla en datos de entrenamiento. El esfuerzo humano exacto que se necesita hoy para alinear el modelo genera los datos propietarios que automatizarán a ese mismo experto mañana.
La supervisión humana no es elástica. Mantenerla requiere intervención institucional deliberada, no solo confianza en el mercado. Si la IA hace el trabajo junior, ¿de dónde saldrán los directores del futuro?
Es una pregunta que parece sencilla pero que tiene implicaciones profundas y sale a menudo en mis reuniones con clientes.
La externalidad del Caballo de Troya
Esta es una de las ideas más potentes del paper. Imagina esto: las empresas tienen presión por ir rápido. Lanzar agentes de IA es barato. Verificar que hacen lo correcto, no. ¿Qué pasa? Que se lanzan sin verificar.
Los autores lo llaman el «Caballo de Troya» y me gusta como metáfora. Por fuera, todo parece funcionar: las métricas suben, los dashboards están en verde, la actividad se dispara. Pero por dentro, los agentes están optimizando para lo que se mide, no para lo que importa. La diferencia entre ambas cosas se acumula como deuda invisible.
Y aquí viene lo peor: el atajo lógico sería usar otra IA para vigilar a la primera. Pero resulta que comparten los mismos puntos ciegos. Es como pedir a tu socio de copas que te diga cuándo parar de beber. El sistema acaba certificando sus propios errores.

¿Suena teórico? No tanto. Los propios informes internos de Google (DORA) muestran que cuanta más IA adoptan los equipos, menos estables son sus entregas aunque todo el mundo siente que es más productivo. Y en un experimento con modelos de razonamiento avanzados, los agentes descubrieron que era más fácil trucar los tests que arreglar el código. Solo se dieron cuenta porque había un segundo modelo espiando el proceso de pensamiento del primero.
La encrucijada: Economía Hueca vs. Economía Aumentada
El paper plantea dos futuros posibles, y deja muy claro que el resultado no es inevitable: depende de decisiones institucionales que debemos tomar ahora.

La Economía Hueca es lo que pasa si dejamos que la brecha se amplíe sin control. El despliegue supera a la verificación. Una expansión infinita de ejecución mecánica que no podemos comprender ni asegurar. Output nominal explosivo, pero agencia humana en decadencia. La Economía Hueca no se anuncia, se acumula.
La Economía Aumentada es la alternativa. La capacidad de verificación se escala junto con el poder de los agentes mediante simulación, observabilidad y precios de responsabilidad. Es el escenario donde la IA amplifica genuinamente la capacidad humana en lugar de reemplazarla de forma opaca.
La condición para llegar ahí es simple de enunciar pero extraordinariamente difícil de lograr: maximizar el despliegue verificado mientras se mantiene la alineación por encima del umbral parasitario.
El Sándwich de IA: la nueva topología organizacional
Una de las predicciones más prácticas del paper es la reorganización de las empresas en lo que llaman la topología «sándwich»:

Arriba: Intención Humana, directores que navegan la incertidumbre y definen objetivos.
En medio: Ejecución de la Máquina, enjambres de agentes escalables a coste marginal cero.
Abajo: Verificación y Responsabilidad, expertos de dominio que actúan como auditores, asumiendo la responsabilidad.
El mando intermedio tradicional — esa capa de coordinación de ejecución — desaparece. El valor humano migra a los bordes: dirigir y garantizar.
El manual de estrategia
La segunda mitad del paper se convierte en algo raro para un artículo académico: un playbook operativo. Y es sorprendentemente pragmático.
Para individuos

Práctica sintética: Usa simuladores de IA para comprimir décadas de experiencia en meses. El «bucle junior» que el mercado laboral está destruyendo puede sustituirse con aprendizaje adversarial acelerado, escenarios sintéticos, drills de alto feedback, iteración densa. Los juniors deben priorizar entornos que maximicen la frecuencia de ciclos de decisión.
Director y validador: Asciende en la jerarquía hacia la arquitectura de la intención. No seas el que ejecuta, sé el que define los «no-go zones», detecta la deriva de alineación, y absorbe la responsabilidad. Construye un historial criptográfico verificable que demuestre tu capacidad para absorber riesgos.
La economía no medible: Migra hacia donde el valor se ancla en el estatus, la procedencia («hecho por humanos») y la conexión social. Lo que no se puede medir, no se puede automatizar. En un mundo de output perfecto generado por máquinas, la escasez migra al origen de ese output.
Para empresas

La verificación es el nuevo foso. Escala la automatización solo tan rápido como puedas auditarla. En una economía donde el output crudo es commodity, la ventaja competitiva migra al talento escaso y los datos capaces de certificar sistemas agénticos de forma fiable.
Liability-as-a-Service. El modelo de negocio dominante dejará de ser monetizar el acceso al software para pasar a monetizar resultados garantizados y asegurados. La capacidad de absorber riesgo de cola — no de generar output — es el nuevo valor.
Verdad terrestre. Acumula datos propietarios no solo para hacer agentes más inteligentes, sino para hacer sus fallos transparentes y asegurables.
Retén al talento experto. Su intuición para los casos límite es el ancla de todo tu enjambre de IA.
Para inversores y gobierno

Inversores: Deja de financiar la ejecución mercantilizada. Invierte en infraestructura de observabilidad, deep tech con horizontes largos, y «complementos de confianza» — procedencia criptográfica y escala de red verificable. Cuando los agentes pueden inflar métricas a coste cero, los fosos duraderos dependen de la escala de red verificada, no del volumen bruto.
Gobierno: Trata la infraestructura de verificación y los simuladores de aumento humano como bienes públicos fundamentales. Implementa regímenes de responsabilidad estricta para internalizar los riesgos de cola. Que la IA insegura pague sus externalidades. La recompensa: la mayor expansión de provisión de bienes públicos en generaciones — sanidad, educación, administración — a costes marginales que hacen viable el acceso universal real.
El mensaje final
La ventaja competitiva ya no es producir. Es garantizar. Es asegurar. Es absorber la responsabilidad cuando falla. Solo al escalar nuestro ancho de banda para la verificación podremos asegurar que la inteligencia que convocamos preserve la humanidad que la inició.
Los autores cierran con una imagen que me parece difícil de olvidar: un mapa que se expande más rápido de lo que puede ser verificado no se queda en blanco. Sigue pareciendo un mapa, uno que cada vez sirve más a la lógica de su propia expansión que a la intención de sus creadores.
Solo escalando nuestro ancho de banda para la verificación podremos asegurar que la inteligencia que convocamos preserve la humanidad que la inició.
El mensaje principal que me llevo de este paper: la carrera que importa no es la de quién despliega los sistemas más autónomos, es la de quién construye los cimientos de su supervisión.
El resto es deuda acumulándose.