triton-inference-server topics

Advanced inference pipeline using NVIDIA Triton Inference Server for CRAFT Text detection (Pytorch), included converter from Pytorch -> ONNX -> TensorRT, Inference pipelines (TensorRT, Triton server -...

k9ele7en

inference

inference-engine

inference-server

nvidia-docker

torchpipe

141

Stars

12

Forks

Watchers

Serving Inside Pytorch

torchpipe

deployment

inference

pipeline-parallelism

pytorch

yolov8-triton

28

Stars

8

Forks

Watchers

Provides an ensemble model to deploy a YoloV8 ONNX model to Triton

omarabid59

deployment

triton-inference-server

triton-server

ultralytics

GenerativeAIExamples

2.2k

Stars

428

Forks

36

Watchers

Generative AI reference workflows optimized for accelerated infrastructure and microservice architecture.

NVIDIA

gpu-acceleration

large-language-models

llm

llm-inference

recsys_pipeline

33

Stars

7

Forks

Watchers

Build Recommender System with PyTorch + Redis + Elasticsearch + Feast + Triton + Flask. Vector Recall, DeepFM Ranking and Web Application.

akiragy

elasticsearch

feast

flask

inverted-index

tritony

42

Stars

1

Forks

Watchers

Tiny configuration for Triton Inference Server

rtzr

inference

mlops

triton-inference-server

tritonclient

Diff-VC

28

Stars

5

Forks

Watchers

Diffusion Model for Voice Conversion

trinhtuanvubk

diffusion-models

gradio

triton-inference-server

voice-conversion

openai_trtllm

152

Stars

25

Forks

Watchers

OpenAI compatible API for TensorRT LLM triton backend

npuichigo

langchain

llm

openai-api

tensorrt-llm

tensorrt-triton-magface

15

Stars

3

Forks

Watchers

Magface Triton Inferece Server Using Tensorrt

tonhathuy

face-recognition

magface

onnx

tensorrt-engine