Todo proyecto de IA es descomponible en unidades de inferencia
Así como el FPA mide funcionalidad en puntos de función, FIN-AI mide trabajo cognitivo en tokens estimables por tarea. Si una tarea no puede descomponerse, no puede estimarse.
Función de Inferencia Normalizada para IA
Los proyectos de IA generativa carecen de un método estándar para estimar su consumo de tokens antes de ejecutarlos. Así como el software clásico resolvió esto con Puntos de Función y COCOMO, FIN-AI propone un marco de estimación temprana de tokens y costo, basado en unidades de inferencia tipificadas, constantes calibrables y multiplicadores de contexto, iteración y riesgo.
Estos seis principios constituyen la base filosófica y operativa del método. Toda implementación que se declare conforme a FIN-AI debe respetarlos.
Así como el FPA mide funcionalidad en puntos de función, FIN-AI mide trabajo cognitivo en tokens estimables por tarea. Si una tarea no puede descomponerse, no puede estimarse.
El costo de un proyecto LLM no se mide en horas-hombre ni en SLOC, sino en tokens de entrada, tokens de salida y bucles de iteración.
System prompts, RAG, memoria persistente y definiciones de herramientas inflan cada llamada. Deben modelarse como multiplicador de entrada, nunca ignorarse.
Un agente con bucle observar-orientar-decidir-actuar y llamadas a herramientas consume órdenes de magnitud más tokens. El factor agéntico es de primera clase, con constantes base propias.
FIN-AI entrega siempre tres escenarios —optimista, esperado y pesimista— al estilo PERT. Comunicar un número único es una mala práctica.
Las constantes base son hipótesis iniciales. Deben ajustarse con datos observados de consumo —gateways de API, logs de facturación— comparando estimado contra real por tipo de tarea.
| Término | Definición |
|---|---|
| Unidad de inferencia | Tarea atómica del proyecto que requiere una o más llamadas a un LLM para completarse. |
| Token | Unidad mínima de procesamiento del modelo (aprox. 0,75 palabras). Se distingue entre tokens de entrada (prompt) y de salida (completion). |
Tokens base Tin / Tout | Estimación de tokens de entrada y salida de una tarea individual según tipo y complejidad, antes de aplicar multiplicadores. |
| F_iter | Multiplicador de iteraciones: ciclos promedio hasta un resultado aceptable. Rango típico: 1,0 – 5,0. |
| F_ctx | Overhead de contexto: system prompt, RAG, memoria y esquemas de herramientas. Aplica solo a entrada. Rango: 1,0 – 3,0. |
| F_riesgo | Multiplicador de reintentos, errores y regeneraciones. Rango: 1,0 – 1,5. |
| P_in / P_out | Precio por millón de tokens de entrada y salida del modelo seleccionado, en USD. |
Del inventario de tareas a la calibración con telemetría real. Cada paso es trazable y versionable.
Descomponer el proyecto en tareas atómicas y clasificar cada una en uno de los cuatro tipos canónicos:
Cada tarea recibe una complejidad (baja, media, alta) que indexa sus tokens base según la tabla de constantes v1.0 (Tin / Tout):
| Tipo | Baja | Media | Alta |
|---|---|---|---|
| A Análisis | 2.000 / 500 | 8.000 / 1.000 | 30.000 / 3.000 |
| G Generación | 500 / 1.000 | 2.000 / 4.000 | 5.000 / 12.000 |
| T Transformación | 1.000 / 1.000 | 4.000 / 4.000 | 15.000 / 15.000 |
| X Agéntica | 10.000 / 3.000 | 40.000 / 10.000 | 150.000 / 40.000 |
Tres multiplicadores a nivel de proyecto, justificando el valor en el registro de estimación:
El total de tokens y el costo, donde N_i es la cantidad de tareas del tipo y complejidad i:
F_ctx aplica únicamente a la entrada: el overhead de contexto se inyecta en el prompt, no en la respuesta del modelo.
Al cerrar el proyecto se compara el consumo real (telemetría del gateway o facturación) contra el estimado, por tipo de tarea. Desviaciones sistemáticas > 25% obligan a recalibrar las constantes base. Revisión trimestral, versionando cada actualización y documentando el dataset.
Implementación viva del algoritmo de la sección 4, con recálculo reactivo: cada cambio dispara el cálculo completo. Sin botón de calcular, sin backend, sin estados intermedios inconsistentes.
El diferencial de FIN-AI frente a una estimación intuitiva radica en su ciclo de calibración continua.