Ley de Hick: Carga cognitiva en Agentes de IA

BLUF: La Ley de Hick aplicada a Agentes de IA demuestra que la precisión en la selección de herramientas disminuye a medida que aumenta el número de opciones en el prompt. Para mantener un alto rendimiento, debemos pasar de “God Agents” con docenas de herramientas a arquitecturas de Orquestación Multi-Agente o Dynamic Tool Retrieval.

Si estás diseñando flujos agenticos, seguro sentiste la tentación de darle a tu LLM todas las herramientas posibles: “leé archivos, consultá la base de datos, realizá orquestación de microservicios, dispará análisis predictivos de logs…”.

El problema es que los modelos, al igual que los humanos, sufren de Carga Cognitiva. Cuantas más opciones (herramientas) tiene que evaluar el modelo para un solo paso, mayor es la probabilidad de que elija la incorrecta o alucine parámetros. Esto se explica matemáticamente mediante la Ley de Hick: $RT = a + b \log_2(n)$, donde el tiempo de reacción y el esfuerzo mental crecen con el número de opciones ($n$).

El fenómeno del “Tool Sprawl”#

En mi experiencia construyendo este portfolio y automatizando mis flujos de trabajo, noté que después de las 10-15 herramientas, la tasa de éxito del agente cae en picada. El modelo sufre una variante del fenómeno “Lost in the Middle”: si bien el paper original (Liu et al. 2023) se enfoca en retrieval de contexto largo, investigaciones de 2025 sobre “Attention Dilution” confirman que el efecto se traslada al tool selection. Cuando inyectás 20-30 schemas en el prompt, las descripciones del medio se “pierden” y la atención se diluye, aumentando las alucinaciones.

Benchmarks de Capacidad (n Recomendado)#

No todos los modelos ni arquitecturas toleran la misma carga. Aquí mis estimaciones realistas basadas en pruebas de estrés:

Arquitectura	Capacidad Total	Tools por Llamada	Nota Técnica
Single Agent Vanilla	5-8 tools	Todas	Límite seguro para evitar degradación.
JIT-Tooling (RAG)	15-40 tools	3-8 tools	Inyección Just-in-Time vía RAG semántico.
Multi-Agente Jerárquico	50-200+ tools	3-5 tools	Orquestación mediante “Router Agents”.

La Robustez del Modelo Importa#

No todos los LLMs sufren igual la Ley de Hick. Modelos con un native tool calling de última generación como Claude 4.6 Sonnet o GPT-5.4 toleran ventanas de $n=25-40$ con una precisión quirúrgica, algo impensable hace dos años con GPT-4o o Llama-3.1, que empezaban a alucinar mucho antes. Aun así, el principio se mantiene: a menor $n$, menor latencia y mayor determinismo.

Estrategias de Mitigación#

Para mantener a tus agentes afilados, tenés que reducir el valor de $n$ en cada interacción:

Estrategia	Acción Técnica	Impacto en Carga
Delegación Multi-Agente	Dividir un “Agente Dios” en sub-agentes especializados (ej: Coder, Researcher).	Alta Reducción: Cada agente solo ve las 3-5 herramientas de su nicho.
JIT-Tooling (RAG)	Usar un RAG de herramientas para inyectar solo las más probables basadas en el contexto actual.	Máxima Eficiencia: El prompt se mantiene limpio y enfocado.
Abstracción de APIs	Unificar múltiples endpoints granulares en un solo “Swiss Army Knife” con parámetros flexibles.	Simplificación: El modelo toma una decisión de alto nivel en lugar de 20 pequeñas.

Conclusión Senior: Menos es Más#

Al igual que en el SEO y la Citabilidad (GEO), la densidad y la relevancia ganan sobre el volumen. No inundes a tu agente con herramientas “por si acaso”. Diseñá arquitecturas donde la IA siempre tenga el camino más simple hacia la solución.

Referencias#

…g CO₂