Agentes que aprendencada vez

Cardumen convierte cada sesión en memoria, skills y verificación reutilizable.

El próximo agente arranca con más contexto, explora menos repo y gasta menos tokens. Ese es el valor real: Claude, Codex, Cursor, OpenCode, Copilot y modelos locales se vuelven más precisos porque el aprendizaje queda en tu infraestructura, no perdido en un chat.

Benchmark privado, piloto guiado y ruta CLI Core cuando el equipo ya está listo para activar.

N+1cada sesión deja memoria-43%tokens en tarea medida5 agentesuna verdad operativa
incremental memoryskills by Gitgraph contextcardumen verifytoken savingsmodel downshiftClaude CodeCodex CLICursorOpenCodeCopilotQwen3-CoderKimi K2.6MiniMax M3incremental memoryskills by Gitgraph contextcardumen verifytoken savingsmodel downshiftClaude CodeCodex CLICursorOpenCodeCopilotQwen3-CoderKimi K2.6MiniMax M3
El problema

Tus agentes son buenos, pero siguen amnésicos.

El mercado ya tiene agentes capaces. La fricción ahora está en el medio: contexto repetido, aprendizaje perdido, tokens quemados y verificación inconsistente entre herramientas.

01 / AMNESIA
contexto manual

Cada agente vuelve a pedir la misma historia

Arquitectura, comandos, errores conocidos y decisiones del repo se repiten en cada sesión. Ese contexto manual termina costando tokens y foco.

impactoN sesiones -> 0 memoria
02 / FRAGMENTACION
chats aislados

El aprendizaje queda encerrado en chats

Lo que Claude entendió no lo sabe Codex. Lo que Cursor resolvió no llega a OpenCode. El equipo opera con memorias partidas.

impacto5 agentes -> 5 verdades
03 / COSTO
tokens quemados

Pagas modelo caro para compensar contexto pobre

Sin memoria operativa, hasta un frontier model explora a ciegas. Con memoria incremental puedes bajar tokens y usar modelos menos potentes con más eficiencia.

impactoexploración antes de código
04 / ESCALA
criterio no reusable

El criterio senior no se convierte en sistema

Un dev resuelve un patrón, pero la próxima tarea vuelve a depender del prompt. Cardumen convierte ese aprendizaje en memoria, skill y verificación reutilizable.

impactosenior knowledge -> folklore
Flywheel incremental

Cada vuelta deja memoria. La siguiente cuesta menos.

El valor no aparece por magia. Cardumen fuerza un loop: cargar contexto real, ejecutar con criterio, verificar con evidencia y guardar lo aprendido como memoria o skill versionada.

C.R.E.A. compounding loopmemory / skills / verify
01. Carga memoria viva

AGENTS.md, project-map, graph, memoria compilada y reglas del servicio antes de responder.

02. Ejecuta con criterio

El router activa skills de arquitectura, debugging, UI, seguridad o QA según la tarea real.

03. Verifica antes de cerrar

Build, hooks, QA y evidencia evitan que la memoria guarde aprendizaje falso.

04. Guarda lo reusable

Lo durable se convierte en memoria o skill. El agente N+1 arranca más adelante.

Menos prompt manual, más contexto útil.

El equipo deja de explicar la misma arquitectura en cada chat. El repo entrega la verdad operativa al agente antes del primer token caro.

Los modelos baratos ganan palanca.

Si el contexto está curado y verificado, no necesitas siempre el modelo más caro para tareas donde el conocimiento del repo pesa más que el razonamiento bruto.

Valor real

No es recordar. Es acumular capacidad operativa.

La memoria incremental vuelve a los agentes más potentes con el uso: menos reexploración, menos tokens, más contexto útil y más margen para usar modelos baratos o privados con la misma disciplina.

N+1cada sesión deja memoria

El agente siguiente arranca más adelante

Cardumen captura decisiones, comandos, errores y patrones como memoria o skill. El conocimiento deja de morir en el chat.

-43%tokens en tarea medida

Baja costo sin bajar ambición

Con memoria compilada y grafo del repo, el agente explora menos antes de tocar código. Eso abre espacio para modelos más baratos o locales.

5 agentesuna verdad operativa

Coordina herramientas sin lock-in

Claude, Codex, Cursor, OpenCode y Copilot leen el mismo contrato. Lo que aprende uno queda disponible para el resto del cardumen.

Traducción B2B

La arquitectura traducida a decisión de compra.

Memoria incrementalAgentes que mejoran por uso

Cada tarea deja contexto reusable para la siguiente.

Skills versionadasCriterio senior repetible

Los patrones correctos viajan por Git, no por folklore.

Graph + memory indexMenos tokens de exploración

El agente encuentra el subgrafo correcto antes de leer medio repo.

Verify gateConfianza para delegar

El aprendizaje queda atado a evidencia, build y QA real.

Local-firstModelos más baratos con más contexto

Puedes usar frontier, open-weight o local sin perder la capa operativa.

Mecanismo

Una capa operativa entre tu repo y cualquier agente.

La fuente de verdad es el repo: instrucciones, memoria, skills, grafo y verify gates. Por eso puedes coordinar herramientas distintas y mover trabajo entre frontier, open-weight o local sin reinventar el contexto.

cardumen-cli @ local
agent: codex | claude-code | cursor | opencode
# Cargando AGENTS.md, memory-index, graph y skills
[OK] reglas del repo sincronizadas
[OK] contexto durable disponible
[OK] menos prompt manual, menos tokens quemados
Benchmark · evidencia medida

La propuesta se valida contra tu repo, no contra una demo perfecta.

Medimos una tarea real con y sin Cardumen: tokens, pasos de exploración, tiempo y calidad. Si el aprendizaje incremental no mejora tu flujo, se ve en el reporte.

Modelos locales

Recupera el costo: deja de re-explorar.

−43%tokens por tarea
313kSin Cardumen179kCon Cardumen
  • 16 → 8 pasos de exploración
  • $0 por token · corre privado

qwen3.5-9b · 1 corrida · repo memoria-rico. En reloj fue más lento (con más contexto razona más): el ahorro es de tokens y pasos.

Modelos de frontera

Compra velocidad y predecibilidad, no descuento.

más consistente
Sin Cardumen · 55–116sCon Cardumen · 47–59s40s120s
  • −30% tiempo · −24% output
  • 100% correctas · costo ≈ igual

Claude · 6 corridas · misma tarea/repo. A ciegas una consulta se dispara hasta 116s; con Cardumen cae siempre en ~54s.

Honestidad n pequeño y condicional: mide la memoria adaptativa sobre una tarea de navegación, no generaliza aún a todo repo o tarea. El resto del arsenal —gates, skills, reviews, verificación— aporta calidad y disciplina, real en el código pero todavía sin número. Donde hay cifra, va con su condición.

Prueba real, sin humo

La memoria incremental se mide en repos vivos.

No vendemos logos inventados. Cardumen se valida donde el contexto pesa: monorepos con reglas, memoria, QA, privacidad y varios agentes tocando el mismo código.

Para quién es Cardumen

Para equipos que no pueden permitirse fugas de contexto — ni de datos.

Cardumen está pensado para quienes necesitan criterio senior repetible y privacidad real: el conocimiento operativo viaja por el repo, no por un chat; la inferencia puede correr 100% local.

Confidencialidad

Corporativos bajo NDA

Equipos con políticas de confidencialidad y datos sensibles. La inferencia corre local: tu código y tus datos no salen del perímetro y Cardumen nunca exfiltra el repo.

Escala

Software factories

Fábricas que entregan múltiples clientes con stacks distintos. Memoria, skills y verificación versionadas por repo: criterio senior repetible y onboarding rápido en cada proyecto.

Multi-agente

Equipos con modelos locales

Ya usás Claude, Codex, Cursor o modelos open-weight y necesitás un contrato operativo común, sin lock-in de vendor ni cuotas que frenen el modelo por días.

Calculadora de impacto

¿Cuánto te cuestan la desincronización y las cuotas de IA?

Menos campos, más lectura ejecutiva: tamaño del equipo, stack actual e industria. La cifra es estimada y sirve para decidir si vale una conversación de validación.

Tu equipo
Resultado estimado
Reducción anual de cuotas y retrabajo
$59,520 USD
Tiempo recuperado al año
$71,688 USD
Ahorro anual con Cardumen
$131,208 USD
Equivalente aproximado
1.09 FTE

Supuesto: 103 horas recuperadas al mes a $58/hr. Úsalo como rango de conversación, no como promesa contractual.

Entrada GTM

La primera conversación debería ser un benchmark en tu repo.

No hace falta creer el pitch. Trae una tarea real, medimos el antes y después, y de ahí sale la ruta: piloto, CLI Core, Cloud o Enterprise.

Qué incluye el benchmark

Setup temporal, una tarea representativa, comparación con y sin memoria incremental, y reporte con impacto en tokens, pasos y calidad.

01 / Repo onboarding privado02 / Tarea A/B real03 / Memory + skills04 / Reporte de decisión
Decisión comercial

Después del benchmark, eliges la ruta con menos fricción.

CLI Core si ya pagas agentes y necesitas coordinación. Cloud si no quieres administrar inferencia. Enterprise si el repo exige NDA, on-prem o capacidad dedicada.

Sin GPU localCloudPara equipos que quieren Cardumen listo con inferencia gestionada.Desde $49/usuario/mes
  • Todo lo de CLI Core
  • Inferencia gestionada por tramo
  • Model routing y uso razonable incluido
  • No requiere comprar ni administrar hardware
Starter, Pro o Max según consumo. Activación por invitación.
NDA fuerte / on-premEnterprisePara software factories, corporativos y equipos con datos sensibles.$1,250/mes hasta 5 usuarios
  • Factory On-Prem con pod privado
  • Setup remoto u onsite y soporte dedicado
  • Usuarios 6 a 10: +$150/user/mes
  • Ruta local para developers con hardware potente
Pod full de 10 usuarios: $2,000/mes. Requiere contrato y custodia.
Opciones avanzadas

BYOK y Local existen, pero no son la primera decisión.

Cloud BYOK$10/user/mes

Opción avanzada si traes tu API key y quieres controlar tu factura de tokens.

Local$10/user/mes

La inferencia corre en la máquina del developer. Sin cobro por token por parte de Cardumen.

Factory Pod Full$2,000/mes

Pod dedicado para 10 usuarios con capacidad privada razonable.

Ruta recomendada
01CLI Core$15

Coordina los agentes que ya pagas.

02Cloud o Local$10+

Elige inferencia gestionada o privada según política y hardware.

03Enterprise$1,250

Escala a pod privado cuando hay NDA, compliance o capacidad dedicada.

Ruta recomendada: valida impacto con benchmark, coordina primero con CLI Core y decide dónde corre la inferencia cuando el ahorro o la privacidad lo justifiquen.

Precios en USD. Factory requiere seguro/custodia del equipo; Cloud BYOK usa la facturación del proveedor del cliente.

Del benchmark al rollout

Si el número da, el piloto se diseña alrededor de tu flujo real.

Entramos a un codebase con deuda, reglas raras y flujos vivos. La capa se arma para capturar aprendizaje real, no para verse bien en una presentación.

01

Benchmark privado en tu repo

Comparamos una tarea real con y sin Cardumen para medir tokens, pasos de exploración, tiempo y calidad del resultado.

02

Piloto de memoria incremental

Activamos AGENTS.md, memoria, skills y verify gates para que cada sesión deje aprendizaje reutilizable.

03

Ruta de modelos y costo

Identificamos dónde puedes bajar tokens, mover tareas a modelos más baratos o correr inferencia local sin perder disciplina.

04

Rollout empresarial

Hardening local-first, política anti-secretos, skill packs por stack y soporte para equipos bajo NDA o software factories.

Ver evidencia