Beta cerrada — plazas limitadas

Tu agente IA está en producción. ¿Pero sabes realmente si funciona?

La mayoría de herramientas te muestran qué pasó. Sentygent te dice si realmente funcionó. Un agente sentinel independiente puntúa cada conversación automáticamente en hasta 6 dimensiones — sin config, sin datasets, sin revisión manual.

Solicitar Acceso Ver cómo funciona ↓

⚡ Integración en 5 líneas

🔍 Hasta 6 dimensiones de calidad

💳 Sin tarjeta de crédito

Senty, the Sentygent sentinel agent mascot

agent.ts

monitorizado por Senty

import { SentygentClient, instrumentAnthropic } from '@sentygent/sdk';

const sentygent = new SentygentClient({
  apiKey: process.env.SENTYGENT_API_KEY,
  service: 'my-agent',
});
const anthropic = instrumentAnthropic(new Anthropic(), sentygent);

// Wrap calls in a trace — evaluated automatically
await sentygent.trace(`chat-${Date.now()}`, async (span) => {
  span.captureLifecycle('message_received', { content: userMessage });
  const response = await anthropic.messages.create({
    model: 'claude-sonnet-4-20250514',
    messages: [{ role: 'user', content: userMessage }],
  });
  span.captureLifecycle('message_sent', { content: response.content[0].text });
});

Tienes observabilidad. No tienes calidad.

89%

de los equipos con agentes IA en producción tienen observabilidad

— ven las trazas

52%

evalúan la calidad de las respuestas

— solo la mitad sabe si su agente responde bien

Tu equipo ve cada llamada LLM — latencia, tokens, coste. Pero vuelas a ciegas en lo único que importa: "¿Realmente está ayudando a los usuarios?"

Los problemas de calidad son la barrera #1 en producción — reportados por el 32% de los equipos. Se descubren cuando los usuarios se quejan, no proactivamente.

La brecha de calidad en producción

Usuario pregunta

Agente responde

Usuario se queja

Te enteras

Esta brecha. Sentygent la llena.

Evaluación de calidad en tiempo real entre respuesta y queja.

De cero a monitoreo de calidad en 5 minutos

Paso 01 Instalar

terminal

$ npm install @sentygent/sdk

Un paquete. Sin nada más que aprender.

Paso 02 Instrumentar — 5 líneas

agent.ts

import { SentygentClient, instrumentAnthropic } from '@sentygent/sdk';
const sentygent = new SentygentClient({ apiKey: process.env.SENTYGENT_API_KEY, service: 'my-agent' });
const anthropic = instrumentAnthropic(new Anthropic(), sentygent);
// Your existing code unchanged ✓

Envuelve tu cliente existente. Tu código no cambia.

Paso 03 Monitorizar

Abre tu dashboard. Cada conversación tiene un score de calidad en hasta 6 dimensiones. Detecta problemas antes que tus usuarios. Despliega sin miedo.

RelevanciaUtilidadCompletitudCoherenciaSeguridad

El Agente Sentinel

Un LLM-as-judge independiente que evalúa cada conversación

Tu Agente IA

Mensaje del usuario

[Your Agent LLM]

Respuesta

Enviado a la API de Sentygent (async, sin impacto en latencia)

Agente Sentinel (LLM-as-judge)

Evalúa en hasta 6 dimensiones:

Relevancia — ¿responde realmente la pregunta?

Utilidad — ¿da al usuario algo concreto?

Completitud — ¿faltan detalles importantes?

Coherencia — ¿se sigue fácilmente la lógica?

Seguridad — ¿sin riesgo legal o reputacional?

Quality Score 8.7/10

Sin configuración

Sin datasets, sin rúbricas, sin setup manual. Funciona de serie para cualquier IA conversacional.

Totalmente async

La evaluación ocurre de forma asíncrona. Sin impacto en la latencia de tu agente. Tus usuarios nunca esperan al sentinel.

Auto-alerta de seguridad

Si la puntuación de seguridad cae por debajo de 30, recibes una alerta inmediatamente. Sin configurar reglas.

Visibilidad completa de trazas con contexto de calidad

Ve cada paso de cada conversación con quality scores adjuntos. No solo qué pasó — sino lo bueno que fue.

sentygent

En vivo conv_a8f2

Quality Score

8.7 / 10 ↑ 0.3 desde la última hora

Conversation ID: conv_a8f2

General 87%

Relevancia

9.2

Utilidad

8.1

Completitud

8.8

Coherencia

9.0

Seguridad

10.0

Trace Timeline

23 pasos

USER "How do I configure rate limiting in..." 0ms

LLM claude-opus-4-6 ↓ 1.2k tokens $0.018 142ms

TOOL search_docs("rate limiting") 98ms

RAG 3 chunks retrieved relevance: 0.94 45ms

LLM claude-opus-4-6 ↓ 892 tokens $0.012 118ms

ASSISTANT Response generated 0ms

Coste total: $0.031 Latencia total: 403ms Llamadas LLM: 6

Todo lo que necesitas para monitorizar la calidad IA en producción

No solo trazas. No solo métricas. Evaluación real de calidad que te dice si tu agente está haciendo su trabajo.

Quality Scoring Automático

Cada conversación evaluada en hasta 6 dimensiones. Sin config, sin datasets.

Trace Tree View

Arbol jerarquico de trazas: relaciones padre-hijo entre llamadas LLM, tools, RAG y errores. Subtrees colapsables para pipelines multi-agente.

Trazado Multi-agente

Orquestador + sub-agentes con desglose de costes por agente. Visibilidad completa de la jerarquía.

Alertas de Calidad

Webhook cuando la calidad media cae por debajo del umbral en ventana de tiempo configurable.

Auto-alerta de Seguridad

Alerta instantánea cuando safety < 30. Sin reglas. Automático, siempre activo.

Transparencia de Costes

Coste por agente, por conversación, por paso. Sabe exactamente cuánto gastas.

Tags Dimensionales

Filtra y busca conversaciones por cualquier tag: courseId, intent, versión del modelo, paso. Combina con rango de score para debugging de precisión.

Eventos RAG/Retrieval

Tipo de evento nativo para pasos de busqueda con chunks recuperados, scores de relevancia individuales y tracking de fuentes. Depura exactamente que recupero tu pipeline RAG.

Compatible con todos los principales proveedores LLM

Auto-instrumentación para clientes soportados. Helpers tipados para todo lo demás.

Anthropic

Amazon Bedrock

OpenAI

Cohere

Mistral

Groq

Ollama

Provider	Auto-instrumentación Wrap del cliente, sin cambios de código	Helpers tipados Event tracking tipado
Anthropic	✓	—
Amazon Bedrock	✓	—
OpenAI	—	✓
Cohere	—	✓
Mistral	—	✓
Groq	—	✓
Ollama	—	✓

Auto-instrumentación: wrap de tu cliente, sin cambios en la lógica existente

Helpers tipados: event tracking tipado para cualquier provider con soporte TypeScript completo

Construido para calidad en producción. No solo trazado.

Las herramientas existentes te dicen qué pasó. Sentygent te dice si fue bueno.

Capacidad	Langfuse	LangSmith	Helicone	Braintrust	Sentygent Tú
Quality scoring automático	Manual setup	Manual setup	✗	Requires config	✓ Zero-config
Alertas de degradación de calidad	✗	✗	✗	✗	✓
Auto-alerta de seguridad	✗	✗	✗	✗	✓
Desglose de costes multi-agente	✗	Partial	✗	✗	✓
RAG como evento nativo	✗	✗	✗	✗	✓
Tiempo de integración	15-30 min	15-30 min	2 min (proxy)	30-60 min	5 min
Precio inicial	Free	Free	Free	Free	Free

Basado en documentación pública a Q1 2025. Algunas funcionalidades pueden variar.

Integración en 5 líneas. En serio.

Sin refactorizar. Sin nuevas abstracciones. Solo wrap y monitoriza.

agent.ts

import Anthropic from '@anthropic-ai/sdk';
import { SentygentClient, instrumentAnthropic } from '@sentygent/sdk';

const sentygent = new SentygentClient({
  apiKey: process.env.SENTYGENT_API_KEY,
  service: 'my-chatbot',
});
const anthropic = instrumentAnthropic(new Anthropic(), sentygent);

await sentygent.trace(`chat-${Date.now()}`, async (span) => {
  span.captureLifecycle('message_received', { content: userMessage });
  const response = await anthropic.messages.create({
    model: 'claude-sonnet-4-20250514',
    max_tokens: 1024,
    messages: [{ role: 'user', content: userMessage }],
  });
  span.captureLifecycle('message_sent', { content: response.content[0].text });
});
// Quality evaluation happens automatically in background

agent.ts

import { BedrockRuntimeClient, ConverseCommand } from '@aws-sdk/client-bedrock-runtime';
import { SentygentClient, instrumentBedrock } from '@sentygent/sdk';

const sentygent = new SentygentClient({
  apiKey: process.env.SENTYGENT_API_KEY,
  service: 'my-bedrock-agent',
});
const bedrock = instrumentBedrock(
  new BedrockRuntimeClient({ region: 'eu-west-1' }), sentygent);

await sentygent.request(`session-${Date.now()}`, async (span) => {
  span.captureLifecycle('message_received', { content: userQuestion });
  const response = await bedrock.send(new ConverseCommand({
    modelId: 'anthropic.claude-3-5-sonnet-20241022-v2:0',
    messages: [{ role: 'user', content: [{ text: userQuestion }] }],
  }));
  span.captureLifecycle('message_sent', { content: response.output?.message?.content?.[0]?.text });
});

agent.ts

import OpenAI from 'openai';
import { SentygentClient } from '@sentygent/sdk';

const sentygent = new SentygentClient({
  apiKey: process.env.SENTYGENT_API_KEY,
  service: 'my-openai-agent',
});
const openai = new OpenAI();

// OpenAI: use span.captureLLM() — no auto-instrumentation
await sentygent.trace(`chat-${Date.now()}`, async (span) => {
  await span.captureLLM({
    provider: 'openai',
    model: 'gpt-4o',
    execute: () => openai.chat.completions.create({
      model: 'gpt-4o',
      messages: [{ role: 'user', content: userMessage }],
    }),
    extractUsage: (r) => r.usage,
  });
});

agent.ts

import { generateText, streamText } from 'ai';
import { openai } from '@ai-sdk/openai';
import { SentygentClient, instrumentVercelAI } from '@sentygent/sdk';

const sentygent = new SentygentClient({
  apiKey: process.env.SENTYGENT_API_KEY,
  service: 'my-nextjs-app',
});
const ai = instrumentVercelAI({ generateText, streamText }, sentygent);

await sentygent.trace(`chat-${Date.now()}`, async (span) => {
  const result = await ai.generateText({
    model: openai('gpt-4o-mini'),
    prompt: userMessage,
  });
});
// Quality evaluation happens automatically in background

agent.ts

import { SentygentClient } from '@sentygent/sdk';

const sentygent = new SentygentClient({ apiKey: process.env.SENTYGENT_API_KEY, service: 'orchestrator' });

await sentygent.trace(`multi-agent-${Date.now()}`, async (span) => {
  // Research sub-agent — separate slug in dashboard
  const researchSpan = span.child('research', { agent: 'research-agent' });
  const research = await researchSpan.captureLLM({
    provider: 'anthropic', model: 'claude-sonnet-4-20250514',
    execute: () => callLLM('Summarize AI safety research findings'),
    extractUsage: (r) => r.usage,
  });

  // Writer sub-agent — per-agent cost in dashboard
  const writerSpan = span.child('write', { agent: 'writer-agent' });
  await writerSpan.captureLLM({
    provider: 'anthropic', model: 'claude-sonnet-4-20250514',
    execute: () => callLLM('Write polished summary from research notes'),
    extractUsage: (r) => r.usage,
  });
});
await sentygent.shutdown();

Empieza gratis. Escala cuando lo necesites.

Todos los planes incluyen quality scoring automático. Sin costes ocultos.

Gratis

€0 /mes

Solicitar Acceso

5.000 eventos/día
Quality scoring automático
Evaluación en hasta 6 dimensiones
Trace timeline
Seguimiento de costes
7 días de retención

Más Popular

Pro

€49 /mes

Solicitar Acceso Pro

50.000 eventos/día
Todo en Gratis
Criterios de evaluación custom
Alertas de calidad y webhooks
Trazado multi-agente
Tags dimensionales
30 días de retención
Soporte prioritario por email

Próximamente

Business

¿Necesitas más? Escríbenos y diseñamos un plan a medida.

Contactar Ventas

Todo en Pro
Límites personalizados
Soporte prioritario (SLA)
SSO y compliance

Todos los planes incluyen quality scoring automático. Sin costes ocultos. Cancela cuando quieras.

“¿Cuántas respuestas malas están recibiendo tus usuarios ahora mismo — sin que lo sepas?”

Empieza a monitorizar tus agentes en 5 minutos, gratis para siempre

Detecta cuándo tu agente falla antes de que tus usuarios se quejen. Gratis hasta 5.000 eventos/día.

Solicitar Acceso Leer los docs →

Acceso por invitación

Integración en 5 minutos

Quality scoring sin config