Ley de Hick: Carga cognitiva en Agentes de IA
BLUF: La Ley de Hick aplicada a Agentes de IA demuestra que la precisión en la selección de herramientas disminuye a medida que aumenta el número de opciones en el prompt. Para mantener un alto rendimiento, debemos pasar de "God Agents" con docenas de herramientas a arquitecturas de Orquestación Multi-Agente o Dynamic Tool Retrieval.
Si estás diseñando flujos agenticos, seguro sentiste la tentación de darle a tu LLM todas las herramientas posibles: "leé archivos, consultá la base de datos, realizá orquestación de microservicios, dispará análisis predictivos de logs...".
El problema es que los modelos, al igual que los humanos, sufren de Carga Cognitiva. Cuantas más opciones (herramientas) tiene que evaluar el modelo para un solo paso, mayor es la probabilidad de que elija la incorrecta o alucine parámetros. Esto se explica matemáticamente mediante la Ley de Hick: $RT = a + b \log_2(n)$, donde el tiempo de reacción y el esfuerzo mental crecen con el número de opciones ($n$).
El fenómeno del "Tool Sprawl"
En mi experiencia construyendo este portfolio y automatizando mis flujos de trabajo, noté que después de las 10-15 herramientas, la tasa de éxito del agente cae en picada. El modelo sufre una variante del fenómeno "Lost in the Middle": si bien el paper original (Liu et al. 2023) se enfoca en retrieval de contexto largo, investigaciones de 2025 sobre "Attention Dilution" confirman que el efecto se traslada al tool selection. Cuando inyectás 20-30 schemas en el prompt, las descripciones del medio se "pierden" y la atención se diluye, aumentando las alucinaciones.
Benchmarks de Capacidad (n Recomendado)
No todos los modelos ni arquitecturas toleran la misma carga. Aquí mis estimaciones realistas basadas en pruebas de estrés:
| Arquitectura | Capacidad Total | Tools por Llamada | Nota Técnica | | :-------------------------- | :-------------- | :---------------- | :---------------------------------------- | | Single Agent Vanilla | 5-8 tools | Todas | Límite seguro para evitar degradación. | | JIT-Tooling (RAG) | 15-40 tools | 3-8 tools | Inyección Just-in-Time vía RAG semántico. | | Multi-Agente Jerárquico | 50-200+ tools | 3-5 tools | Orquestación mediante "Router Agents". |
La Robustez del Modelo Importa
No todos los LLMs sufren igual la Ley de Hick. Modelos con un native tool calling de última generación como Claude 4.6 Sonnet o GPT-5.4 toleran ventanas de $n=25-40$ con una precisión quirúrgica, algo impensable hace dos años con GPT-4o o Llama-3.1, que empezaban a alucinar mucho antes. Aun así, el principio se mantiene: a menor $n$, menor latencia y mayor determinismo.
Estrategias de Mitigación
Para mantener a tus agentes afilados, tenés que reducir el valor de $n$ en cada interacción:
| Estrategia | Acción Técnica | Impacto en Carga | | :-------------------------- | :---------------------------------------------------------------------------------------------- | :------------------------------------------------------------------------------------- | | Delegación Multi-Agente | Dividir un "Agente Dios" en sub-agentes especializados (ej: Coder, Researcher). | Alta Reducción: Cada agente solo ve las 3-5 herramientas de su nicho. | | JIT-Tooling (RAG) | Usar un RAG de herramientas para inyectar solo las más probables basadas en el contexto actual. | Máxima Eficiencia: El prompt se mantiene limpio y enfocado. | | Abstracción de APIs | Unificar múltiples endpoints granulares en un solo "Swiss Army Knife" con parámetros flexibles. | Simplificación: El modelo toma una decisión de alto nivel en lugar de 20 pequeñas. |
Conclusión Senior: Menos es Más
Al igual que en el SEO y la Citabilidad (GEO), la densidad y la relevancia ganan sobre el volumen. No inundes a tu agente con herramientas "por si acaso". Diseñá arquitecturas donde la IA siempre tenga el camino más simple hacia la solución.