FIN-AI · Función de Inferencia Normalizada para IA

FIN·AI

Función de Inferencia Normalizada para IA

Los proyectos de IA generativa carecen de un método estándar para estimar su consumo de tokens antes de ejecutarlos. Así como el software clásico resolvió esto con Puntos de Función y COCOMO, FIN-AI propone un marco de estimación temprana de tokens y costo, basado en unidades de inferencia tipificadas, constantes calibrables y multiplicadores de contexto, iteración y riesgo.

Autor · Sebastián Vargas Yáñez TTPSEC SpA — Ciberseguridad OT/ICS Clasificación · Público

Todo proyecto de IA es descomponible en unidades de inferencia

Así como el FPA mide funcionalidad en puntos de función, FIN-AI mide trabajo cognitivo en tokens estimables por tarea. Si una tarea no puede descomponerse, no puede estimarse.

El token es la unidad económica, no la línea de código

El costo de un proyecto LLM no se mide en horas-hombre ni en SLOC, sino en tokens de entrada, tokens de salida y bucles de iteración.

El contexto es overhead, no contenido

System prompts, RAG, memoria persistente y definiciones de herramientas inflan cada llamada. Deben modelarse como multiplicador de entrada, nunca ignorarse.

Lo agéntico se estima distinto

Un agente con bucle observar-orientar-decidir-actuar y llamadas a herramientas consume órdenes de magnitud más tokens. El factor agéntico es de primera clase, con constantes base propias.

Toda estimación es un rango, nunca un número

FIN-AI entrega siempre tres escenarios —optimista, esperado y pesimista— al estilo PERT. Comunicar un número único es una mala práctica.

El modelo se calibra con telemetría real

Las constantes base son hipótesis iniciales. Deben ajustarse con datos observados de consumo —gateways de API, logs de facturación— comparando estimado contra real por tipo de tarea.

Término	Definición
Unidad de inferencia	Tarea atómica del proyecto que requiere una o más llamadas a un LLM para completarse.
Token	Unidad mínima de procesamiento del modelo (aprox. 0,75 palabras). Se distingue entre tokens de entrada (prompt) y de salida (completion).
Tokens base `Tin / Tout`	Estimación de tokens de entrada y salida de una tarea individual según tipo y complejidad, antes de aplicar multiplicadores.
F_iter	Multiplicador de iteraciones: ciclos promedio hasta un resultado aceptable. Rango típico: 1,0 – 5,0.
F_ctx	Overhead de contexto: system prompt, RAG, memoria y esquemas de herramientas. Aplica solo a entrada. Rango: 1,0 – 3,0.
F_riesgo	Multiplicador de reintentos, errores y regeneraciones. Rango: 1,0 – 1,5.
P_in / P_out	Precio por millón de tokens de entrada y salida del modelo seleccionado, en USD.

Término

Definición

Unidad de inferencia

Tarea atómica del proyecto que requiere una o más llamadas a un LLM para completarse.

Token

Unidad mínima de procesamiento del modelo (aprox. 0,75 palabras). Se distingue entre tokens de entrada (prompt) y de salida (completion).

Tokens base Tin / Tout

Estimación de tokens de entrada y salida de una tarea individual según tipo y complejidad, antes de aplicar multiplicadores.

F_iter

Multiplicador de iteraciones: ciclos promedio hasta un resultado aceptable. Rango típico: 1,0 – 5,0.

F_ctx

Overhead de contexto: system prompt, RAG, memoria y esquemas de herramientas. Aplica solo a entrada. Rango: 1,0 – 3,0.

F_riesgo

Multiplicador de reintentos, errores y regeneraciones. Rango: 1,0 – 1,5.

P_in / P_out

Precio por millón de tokens de entrada y salida del modelo seleccionado, en USD.

Tipo	Baja	Media	Alta
A Análisis	2.000 / 500	8.000 / 1.000	30.000 / 3.000
G Generación	500 / 1.000	2.000 / 4.000	5.000 / 12.000
T Transformación	1.000 / 1.000	4.000 / 4.000	15.000 / 15.000
X Agéntica	10.000 / 3.000	40.000 / 10.000	150.000 / 40.000

Tipo

Baja

Media

Alta

A Análisis

2.000 / 500

8.000 / 1.000

30.000 / 3.000

G Generación

500 / 1.000

2.000 / 4.000

5.000 / 12.000

T Transformación

1.000 / 1.000

4.000 / 4.000

15.000 / 15.000

X Agéntica

10.000 / 3.000

40.000 / 10.000

150.000 / 40.000

FIN·AI

Seis principios.
Una sola unidad económica.

Todo proyecto de IA es descomponible en unidades de inferencia

El token es la unidad económica, no la línea de código

El contexto es overhead, no contenido

Lo agéntico se estima distinto

Toda estimación es un rango, nunca un número

El modelo se calibra con telemetría real

El vocabulario del método

Cinco pasos, de la tarea al costo

Inventario de tareas

Complejidad y constantes base

Multiplicadores globales

Cálculo

Calibración y cierre

La calculadora FIN-AI

El valor está en el ciclo

◆ Mejora continua

▲ Limitaciones v1.0

Seis principios.Una sola unidad económica.

Todo proyecto de IA es descomponible en unidades de inferencia

El token es la unidad económica, no la línea de código

El contexto es overhead, no contenido

Lo agéntico se estima distinto

Toda estimación es un rango, nunca un número

El modelo se calibra con telemetría real

El vocabulario del método

Cinco pasos, de la tarea al costo

Inventario de tareas

Complejidad y constantes base

Multiplicadores globales

Cálculo

Calibración y cierre

La calculadora FIN-AI

El valor está en el ciclo

◆ Mejora continua

▲ Limitaciones v1.0

Seis principios.
Una sola unidad económica.