Antes del código, el criterio: qué medir en la semana uno, Forja

Notas · Criterio, cronograma y costo de proyectos de IA · Cronograma realista

Forja · Mesa de números · 21 de mayo de 2026 · Ler em portugues › · Read in English ›

En dos semanas de Diagnóstico, Forja hace una cosa que parece simple y resulta dura: define el criterio de éxito. La IA viene después.

La mayoría de los proyectos de IA en retail empieza por el lado equivocado. Eligen la tecnología primero: modelo, plataforma, proveedor.

Después arman el squad. Recién después preguntan qué esperar.

Esa secuencia es de donde viene la mayoría de los fracasos: solo el 28% de los proyectos de IA entrega el ROI esperado, según Gartner (2026). El número se vuelve titular fácil. Esconde lo que importa: del 28% que entrega, la mayoría definió el criterio ANTES del código.

¿Qué es un criterio de éxito, exactamente?

Tres cosas, todas medibles, todas decididas en conversación antes del go-live:

El indicador que cuenta como éxito. No “satisfacción del cliente”. Algo como “rotura en góndola para la categoría perecederos, medida el viernes en la mañana y el lunes en la tarde”.
La franja esperada. No “mejorar”. Algo como “quedarse entre 1,2% y 2,0%. Por debajo de 1,2% es sospechoso; por encima de 2,0% es problema”.
El gatillo de revisión. No “monitorear continuamente”. Algo como “si el número sale de la franja por tres semanas consecutivas, parar el rollout y reevaluar”.

Cada uno responde a una pregunta diferente.

El indicador dice qué estamos mirando. La franja dice qué es normal. El gatillo dice cuándo alguien tiene que parar todo y preguntar por qué.

Si una de esas tres piezas está ausente, el proyecto no tiene criterio. Tiene aspiración.

Acá está lo que pasa cuando te saltas este paso.

La operación sube. Los números mejoran, o parecen mejorar, o ni eso. El equipo interno mira el dashboard y nadie sabe decir si está bien.

El proveedor dice que sí. El CFO pregunta si vale la renovación. No tienes cómo responder porque nadie definió qué sería “valer”.

En seis a nueve meses, el proyecto no muere. Solo deja de ser citado.

Se vuelve ese ítem en la lista de iniciativas que nadie defiende y nadie ataca. En algún momento, alguien lo saca del plan y nadie nota.

Ese es el resultado más común. No es “falló”. Es “se evaporó”.

Piensa por un segundo si tu operación actual tiene algún proyecto en ese estado.

Cómo definir el criterio, en la práctica

La conversación empieza por el problema, no por la solución. “Queremos reducir rotura en góndola” es un comienzo. “Queremos usar IA” no lo es.

Después, tres preguntas, en este orden:

¿Qué número cuenta? ¿Quién en la operación puede leer ese número hoy sin pedírselo a TI? Si nadie puede, ese es el primer trabajo, y tiene que hacerse antes de la primera línea de modelo.
¿Cuál es la franja actual? No la deseada. La actual, con la operación corriendo como corre hoy. Sin esa baseline, cualquier “mejora” es discurso.
¿Qué franja justifica la inversión? Si la baseline es 4,2% y la meta es 1,8%, el proyecto tiene criterio. Si la meta es “menor”, el proyecto tiene deseo.

La franja importa más que el número objetivo. Un proyecto que tiene que entregar exactamente 1,8% es frágil. Un proyecto que tiene que entregar entre 1,5% y 2,5% tiene espacio operativo real.

El gatillo de revisión tiene que estar en el documento. Por escrito, con la fecha en que sucede la revisión si la franja se viola.

Sin esa parte, el criterio no es criterio: es cartel decorativo en la pared.

La parte que nadie quiere hacer

Honestamente, definir criterio es trabajo ingrato.

La conversación se pone difícil porque exige que áreas diferentes acuerden sobre qué cuenta. Operaciones quiere hablar de flujo. CX quiere hablar de NPS.

Finanzas quiere hablar de margen. TI quiere hablar de uptime. Todo eso es legítimo, y nada de eso es “el” criterio.

El liderazgo que se salta esa pelea delega a operaciones para correr el proyecto. Operaciones adopta el número más fácil de medir. Suele ser el equivocado.

No hay atajo acá. Dos semanas es el tiempo que suele tomar destrabar esa conversación entre las áreas. Más que eso, la paciencia de la empresa se agota; menos que eso, la conversación no fue suficientemente difícil.

Lo que este post no está prometiendo

Definir criterio no garantiza que el proyecto vaya a salir bien. Solo garantiza que, si no sale, vas a saberlo, y a tiempo.

Esa diferencia es todo.

Sin criterio, los proyectos malos siguen corriendo porque nadie puede afirmar que están mal. Con criterio, los proyectos malos se interrumpen antes de que el costo se duplique.

El ROI del criterio no está en el proyecto que hace salir bien. Está en los proyectos malos que permite cortar temprano.

Sé honesto contigo mismo. Mira los proyectos de IA de tu operación. Toma uno.

¿Puedes decir, en una frase, cuál es el número, la franja, y el gatillo de revisión? Si sí, el proyecto tiene criterio. Si no, tiene aspiración.

La diferencia entre los dos es una conversación que nadie quiere tener. Operaciones versus finanzas versus CX versus TI sobre qué va a defender cada uno.

Difícil porque cada área defiende el número que ya mide. Casi imposible sin alguien en la sala que haya conducido esta conversación antes.

Mándame los tres indicadores candidatos que tu proyecto va a medir. En una hora te devuelvo un diagnóstico: cuáles predicen éxito, cuáles predicen fracaso silencioso, cuál es el gatillo de revisión que cada uno necesita.

Si la forma del proyecto se confirma, el Diagnóstico de dos semanas termina con un documento de una página que va a la pared del squad: tres indicadores, tres franjas, tres gatillos. El equipo interno se sostiene en él por el resto de la Implementação.