Tu agente IA está en producción. ¿Pero sabes realmente si funciona?
La mayoría de herramientas te muestran qué pasó. Sentygent te dice si realmente funcionó. Un agente sentinel independiente puntúa cada conversación automáticamente en hasta 6 dimensiones — sin config, sin datasets, sin revisión manual.
import { SentygentClient, instrumentAnthropic } from '@sentygent/sdk';
const sentygent = new SentygentClient({
apiKey: process.env.SENTYGENT_API_KEY,
service: 'my-agent',
});
const anthropic = instrumentAnthropic(new Anthropic(), sentygent);
// Wrap calls in a trace — evaluated automatically
await sentygent.trace(`chat-${Date.now()}`, async (span) => {
span.captureLifecycle('message_received', { content: userMessage });
const response = await anthropic.messages.create({
model: 'claude-sonnet-4-20250514',
messages: [{ role: 'user', content: userMessage }],
});
span.captureLifecycle('message_sent', { content: response.content[0].text });
}); Tienes observabilidad. No tienes calidad.
de los equipos con agentes IA en producción tienen observabilidad
— ven las trazas
evalúan la calidad de las respuestas
— solo la mitad sabe si su agente responde bien
Tu equipo ve cada llamada LLM — latencia, tokens, coste. Pero vuelas a ciegas en lo único que importa: "¿Realmente está ayudando a los usuarios?"
Los problemas de calidad son la barrera #1 en producción — reportados por el 32% de los equipos. Se descubren cuando los usuarios se quejan, no proactivamente.
La brecha de calidad en producción
Evaluación de calidad en tiempo real entre respuesta y queja.
De cero a monitoreo de calidad en 5 minutos
$ npm install @sentygent/sdk Un paquete. Sin nada más que aprender.
import { SentygentClient, instrumentAnthropic } from '@sentygent/sdk';
const sentygent = new SentygentClient({ apiKey: process.env.SENTYGENT_API_KEY, service: 'my-agent' });
const anthropic = instrumentAnthropic(new Anthropic(), sentygent);
// Your existing code unchanged ✓ Envuelve tu cliente existente. Tu código no cambia.
Abre tu dashboard. Cada conversación tiene un score de calidad en hasta 6 dimensiones. Detecta problemas antes que tus usuarios. Despliega sin miedo.
El Agente Sentinel
Un LLM-as-judge independiente que evalúa cada conversación
Sin configuración
Sin datasets, sin rúbricas, sin setup manual. Funciona de serie para cualquier IA conversacional.
Totalmente async
La evaluación ocurre de forma asíncrona. Sin impacto en la latencia de tu agente. Tus usuarios nunca esperan al sentinel.
Auto-alerta de seguridad
Si la puntuación de seguridad cae por debajo de 30, recibes una alerta inmediatamente. Sin configurar reglas.
Visibilidad completa de trazas con contexto de calidad
Ve cada paso de cada conversación con quality scores adjuntos. No solo qué pasó — sino lo bueno que fue.
Todo lo que necesitas para monitorizar la calidad IA en producción
No solo trazas. No solo métricas. Evaluación real de calidad que te dice si tu agente está haciendo su trabajo.
Quality Scoring Automático
Cada conversación evaluada en hasta 6 dimensiones. Sin config, sin datasets.
Trace Tree View
Arbol jerarquico de trazas: relaciones padre-hijo entre llamadas LLM, tools, RAG y errores. Subtrees colapsables para pipelines multi-agente.
Trazado Multi-agente
Orquestador + sub-agentes con desglose de costes por agente. Visibilidad completa de la jerarquía.
Alertas de Calidad
Webhook cuando la calidad media cae por debajo del umbral en ventana de tiempo configurable.
Auto-alerta de Seguridad
Alerta instantánea cuando safety < 30. Sin reglas. Automático, siempre activo.
Transparencia de Costes
Coste por agente, por conversación, por paso. Sabe exactamente cuánto gastas.
Tags Dimensionales
Filtra y busca conversaciones por cualquier tag: courseId, intent, versión del modelo, paso. Combina con rango de score para debugging de precisión.
Eventos RAG/Retrieval
Tipo de evento nativo para pasos de busqueda con chunks recuperados, scores de relevancia individuales y tracking de fuentes. Depura exactamente que recupero tu pipeline RAG.
Compatible con todos los principales proveedores LLM
Auto-instrumentación para clientes soportados. Helpers tipados para todo lo demás.
| Provider | Auto-instrumentación | Helpers tipados |
|---|---|---|
| Anthropic | ✓ | — |
| Amazon Bedrock | ✓ | — |
| OpenAI | — | ✓ |
| Cohere | — | ✓ |
| Mistral | — | ✓ |
| Groq | — | ✓ |
| Ollama | — | ✓ |
Construido para calidad en producción. No solo trazado.
Las herramientas existentes te dicen qué pasó. Sentygent te dice si fue bueno.
| Capacidad | Langfuse | LangSmith | Helicone | Braintrust | Sentygent Tú |
|---|---|---|---|---|---|
| Quality scoring automático | Manual setup | Manual setup | ✗ | Requires config | ✓ Zero-config |
| Alertas de degradación de calidad | ✗ | ✗ | ✗ | ✗ | ✓ |
| Auto-alerta de seguridad | ✗ | ✗ | ✗ | ✗ | ✓ |
| Desglose de costes multi-agente | ✗ | Partial | ✗ | ✗ | ✓ |
| RAG como evento nativo | ✗ | ✗ | ✗ | ✗ | ✓ |
| Tiempo de integración | 15-30 min | 15-30 min | 2 min (proxy) | 30-60 min | 5 min |
| Precio inicial | Free | Free | Free | Free | Free |
Basado en documentación pública a Q1 2025. Algunas funcionalidades pueden variar.
Integración en 5 líneas. En serio.
Sin refactorizar. Sin nuevas abstracciones. Solo wrap y monitoriza.
import Anthropic from '@anthropic-ai/sdk';
import { SentygentClient, instrumentAnthropic } from '@sentygent/sdk';
const sentygent = new SentygentClient({
apiKey: process.env.SENTYGENT_API_KEY,
service: 'my-chatbot',
});
const anthropic = instrumentAnthropic(new Anthropic(), sentygent);
await sentygent.trace(`chat-${Date.now()}`, async (span) => {
span.captureLifecycle('message_received', { content: userMessage });
const response = await anthropic.messages.create({
model: 'claude-sonnet-4-20250514',
max_tokens: 1024,
messages: [{ role: 'user', content: userMessage }],
});
span.captureLifecycle('message_sent', { content: response.content[0].text });
});
// Quality evaluation happens automatically in background Empieza gratis. Escala cuando lo necesites.
Todos los planes incluyen quality scoring automático. Sin costes ocultos.
Gratis
- 5.000 eventos/día
- Quality scoring automático
- Evaluación en hasta 6 dimensiones
- Trace timeline
- Seguimiento de costes
- 7 días de retención
Pro
- 50.000 eventos/día
- Todo en Gratis
- Criterios de evaluación custom
- Alertas de calidad y webhooks
- Trazado multi-agente
- Tags dimensionales
- 30 días de retención
- Soporte prioritario por email
Business
- Todo en Pro
- Límites personalizados
- Soporte prioritario (SLA)
- SSO y compliance
Todos los planes incluyen quality scoring automático. Sin costes ocultos. Cancela cuando quieras.
“¿Cuántas respuestas malas están recibiendo tus usuarios ahora mismo — sin que lo sepas?”
Empieza a monitorizar tus agentes en 5 minutos, gratis para siempre
Detecta cuándo tu agente falla antes de que tus usuarios se quejen. Gratis hasta 5.000 eventos/día.