evaluations topic

List evaluations repositories

adversarial-explainable-ai

281

Stars

42

Forks

Watchers

💡 Adversarial attacks on explanations and how to defend them

adversarial-attacks

adversarial-defense

adversarial-examples

adversarial-machine-learning

evaluations

15

Stars

1

Forks

Watchers

This library implements various metrics (including Kaggle Competition, Medicine) for evaluating ML, DL, AI models, and algorithms. 📐📊📈📉📏

kaggle-competition

42-Evaluations

37

Stars

0

Forks

Watchers

42 School Projects Evaluation Marking Criteria

evaluation-framework

Crunch

62

Stars

7

Forks

Watchers

The fastest java expression compiler/evaluator

evaluating-mathematical-expressions

log10

94

Stars

8

Forks

Watchers

Python client library for improving your LLM app accuracy

artificial-intelligence

autonomous-agents

leaf-playground

23

Stars

0

Forks

Watchers

A framework to build scenario simulation projects where human and LLM based agents can participant in, with a user-friendly web UI to visualize simulation, support automatically evaluation on agent ac...

LLM-Evaluation-s-Always-Fatiguing

agent-based-simulation

langtrace

435

Stars

34

Forks

Watchers

Langtrace 🔍 is an open-source, Open Telemetry based end-to-end observability tool for LLM applications, providing real-time tracing, evaluations and metrics for popular LLMs, LLM frameworks, vectorD...

evalkit

17

Stars

0

Forks

Watchers

The TypeScript LLM Evaluation Library

evaluation-metrics