evals topics

phoenix

7.8k

Stars

644

Forks

7.8k

Watchers

AI Observability & Evaluation

Arize-ai

ai-roi

llmops

ml-observability

mlops

Python SDK for AI agent monitoring, LLM cost tracking, benchmarking, and more. Integrates with most LLMs and agent frameworks including CrewAI, Agno, OpenAI Agents SDK, Langchain, Autogen, AG2, and Ca...

AgentOps-AI

agent

agentops

ai

evals

langfuse

19.2k

Stars

1.9k

Forks

19.2k

Watchers

🪢 Open source LLM engineering platform: LLM Observability, metrics, evals, prompt management, playground, datasets. Integrates with OpenTelemetry, Langchain, OpenAI SDK, LiteLLM, and more. 🍊YC W23

langfuse

analytics

evals

generative-ai

gpt