Medir el valor de la IA en la empresa: por qué es difícil… y cómo hacerlo sin autoengañarnos

En la newsletter de la batería baja defendí que la IA no te hace «más rápido», te devuelve espacio mental para volver a encender lo que llevaba meses apagado. La idea gustó. Pero en varias conversaciones me encontré con la misma pregunta: vale, ¿y cómo lo demuestras? Porque cuando alguien te pide justificar la inversión en IA, «recuperar batería» no es un KPI. Aquí explico qué sí lo es.

La trampa de la productividad individual

Incluso antes de la IA, medir cuánto «produce» una persona era un reto. Si dos personas hacen la misma tarea. Una utiliza Excel, domina las tablas dinámicas y las macros, mientras la otra no y lo hace a mano… ¿cuánta productividad «gana» cada una?

Es una variable difícil de aislar, difícil de comparar y casi imposible de convertir en una cifra única.

El reto de la atribución con inteligencia artificial

Cuando introducimos herramientas como Copilot, todo el mundo puede usarlo para resumir documentos o responder correos. Y la mejora en ese escenario existe. Pero es muy difícil de medir la mejora. Y casi imposible saber si la mejora viene de la herramienta en sí, de la experiencia previa de la persona, del contexto específico o de la complejidad de la tarea.

Si no puedes separar el efecto de la herramienta del efecto de la persona, no puedes medir el impacto de la IA.

La buena noticia es que sí podemos medir de forma práctica si cambiamos la pregunta. En lugar de intentar calcular «cuánto mejora una persona», el truco es identificar qué unidad mínima de trabajo es razonable medir.


Cambia la pregunta fundamental

De esta manera, no medimos la productividad de una persona. Medimos cómo cambia un proceso cuando se apoya en IA.

La unidad mínima de trabajo

Para medir de forma práctica, necesitamos identificar un proceso o «cluster» autocontenido. Tiene que cumplir tres condiciones: tener un principio y un fin claramente delimitados, ser lo bastante relevante para impactar al negocio, y ser lo bastante acotado para permitir una comparación estricta de «antes vs después».

Fronteras claras: Debe tener un principio y un fin claramente delimitados. Si no sabes exactamente dónde empieza y dónde acaba la tarea, es imposible cronometrarla o evaluar su cambio.

Relevancia de negocio: Debe tener el peso suficiente para que su mejora importe. Optimizar un proceso marginal no moverá la aguja de los KPIs principales (como ventas, ahorro de costes o satisfacción).

Entorno aislado: Debe ser lo bastante acotado para permitir una comparación estricta de «antes vs. después». Esto garantiza que la mejora que observamos es gracias a la IA y no por «ruido» u otros factores externos.

Dos familias de unidades medibles

En la práctica, esas unidades suelen caer en dos familias. Por un lado están los procesos estructurados (workflows): tienen pasos claros, entradas y salidas definidas, y se prestan directamente a KPIs operativos. Por otro lado están los patrones transversales (patterns): rutinas repetidas en múltiples roles, como preparar reuniones, sintetizar información o elaborar status reports. Estos comienzan midiéndose por ahorro de tiempo y evolucionan hacia métricas de calidad.

Cuando alguien te dice «hemos mejorado la productividad con IA», la primera pregunta debería ser: ¿de qué proceso estamos hablando?


El ahorro de tiempo es una métrica legítima

Lo más común, al inicio, es que los KPIs que aparecen sean de ahorro de tiempo: menos horas invertidas, menos ciclos de revisión, menos esperas. La gran mayoría de las métricas de impacto comienzan capturando esta reducción de fricción. Y eso no es «poco». Cuando se mide correctamente, el ahorro de tiempo es un indicador robusto de adopción.

Evidencia empírica a escala: caso Repsol

Repsol comunicó resultados de un piloto con un ahorro de más de dos horas a la semana por persona en el contexto de la implementación de Copilot. El estudio fue documentado en un paper público de MIT Technology Review con diseño experimental pre/post. La muestra total fue de 550 personas: 300 en el grupo experimental y 250 en el grupo de control.

Validación organizativa: caso Ferrovial

Ferrovial, en una fase piloto inicial publicada por Microsoft España, midió un ahorro medio de 90 minutos a la semana por empleado con más de 300 empleados involucrados. Las cifras fueron lo bastante contundentes como para justificar la decisión estratégica de escalar la IA a toda la organización.

Estos datos no prometen que todas las empresas conseguirán lo mismo. Pero sí demuestran algo: cuando mides en unidades comparables, el valor se vuelve visible.


El siguiente nivel: conectar con el negocio

Una vez identificada la unidad de trabajo y validado el ahorro de tiempo, la IA deja de medirse por velocidad y pasa a evaluarse por impacto comercial, reducción de errores, consistencia y la capacidad de ejecutar tareas que antes no cabían en la agenda. El recorrido va de «hacerlo más rápido» a «hacerlo mejor».

Mapeo de procesos a KPIs funcionales

La pregunta clave aquí es: ¿qué KPI del negocio se mueve cuando este proceso específico mejora? En ventas, puede ser el número de oportunidades trabajadas, el ratio de cierre o el ciclo medio de venta. En operaciones, el tiempo de ciclo, el backlog, el tiempo de respuesta o el cumplimiento de SLA. En finanzas, la fecha de cierre mensual, los errores en conciliación o las incidencias por factura. En customer service, el tiempo medio de resolución, el número de escalados o el NPS. En legal y compliance, el número de iteraciones por contrato, el tiempo de revisión o el retrabajo.

A menudo no se requiere precisión quirúrgica: basta con estimaciones razonables comparando periodos o grupos de control.

De esta manera, la IA ya no se mide solo por «hacerlo más rápido» si no por hacerlo mejor, o por hacer posible lo que antes no cabía en la agenda.


Cómo instrumentarlo a escala

Obviamente, hay que medirlo a nivel organizativo. La buena noticia es que si tu herramienta es Copilot, tienes estas dos piezas que se complementan.

A) Señales de uso

Primero, necesitas entender la adopción organizacional: saber qué se está utilizando y cómo.

  • A nivel de plataforma, Viva Insights ofrece capacidades de medición y reporting integradas.
  • A nivel de métricas, puedes obtener informes operacionales que muestran cambios en el tiempo dedicado a reuniones, correos o chats (por ejemplo, a través del «Impact tab»).
  • Y a nivel cualitativo, puedes incorporar encuestas para capturar el sentimiento del usuario y complementar los datos de uso con percepción real.

B) Señales de negocio

Y para medir verdaderamente, tenemos que correlacionar el uso de la herramienta con los resultados que le importan a la empresa. No basta con medir si a la gente «le gusta». Si lo usan, es que les gusta, porque esto no es obligatorio. Si no les gustara, no lo usarían..

Un mecanismo para hacerlo es el Copilot business impact report. El proceso consiste en definir las métricas de resultado (por ejemplo, «deals cerrados al mes» para ventas) y cargarlas en Viva Insights. El análisis correlaciona matemáticamente los comportamientos de uso con la evolución de los KPIs cargados.

Si quieres medir «en serio», no basta con «me gusta / no me gusta». Necesitas correlacionar uso con outcome.


Un ejemplo aterrizado

Pensemos en el cierre mensual de finanzas. La unidad de trabajo es clara: conciliación, validación y cierre de facturas. La métrica base es sencilla: ¿qué día exacto cerramos el mes? ¿Cuántas incidencias aparecen? La comparativa se hace entre un periodo con apoyo de IA y un periodo sin IA (o grupo piloto frente a control). Y el resultado habitual es un cierre más rápido, una reducción de errores y mayor previsibilidad.

Este tipo de ejemplo es potente porque cambia la conversación. La afirmación no es «Finanzas es más productivo», si no «cerramos el mes antes y con cero errores». Eso sí lo entiende un comité de dirección.

Y aprovecho para recuperar esta demo donde te enseño cómo puedes usar «Editar con Copilot» (antes llamado «Modo Agente») en Excel para que te ayude en el proceso de conciliación.

Editar con Copilot (antes modo Agente) en Excel


La nueva mentalidad

La pregunta correcta no es «¿cuánto mejora la productividad?». La pregunta correcta es: ¿cuál es la unidad mínima de trabajo que podemos medir, y qué KPI de negocio está asociado a ella?

Cuando defines el proceso y eliges el KPI correcto, la medición de la IA deja de ser abstracta. Se convierte en un sistema accionable para comparar, ajustar y escalar.

Fuentes usadas:

Repsol — Nota de prensa sobre extensión de IA generativa con Copilot

MIT Technology Review — Paper sobre impacto de IA generativa en compañía energética global

Microsoft News — Ferrovial refuerza su apuesta por la IA con Microsoft Copilot

Microsoft Learn — Copilot measurement and reporting

Microsoft Learn — Copilot business impact report

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio