text-embeddings-inference issues

Support for jinaai/jina-embeddings-v2-base-code

### Model description jina-embeddings-v2-base-code is an multilingual embedding model speaks English and 30 widely used programming languages. Same as other jina-embeddings-v2 series, it supports 8192 sequence length. jina-embeddings-v2-base-code is based...

m-truscott

Error: Could not start backend: Runtime compute cap 70 is not compatible with compile time compute cap 80

2

### System Info While starting using docker as below I get error ``` docker run --gpus all -p 8912:80 -v $volume:/data --pull always ghcr.io/huggingface/text-embeddings-inference:1.2 --model-id $model ``` I can run...

abratnap

The "payload limit" parameter seems to have no effect?

### System Info Thanks a lot for contributing such a great embedding framework. However, I've encountered a problem in using it and would like to ask for help! I set...

12210122

multilingual-e5-large exported by recent sentence-transformers version cannot be loaded

2

### System Info Tested TEI versions: - v1.2.0 (official Docker) - v1.2.3 (official Docker) - [cc1c510](https://github.com/huggingface/text-embeddings-inference/commit/cc1c510e8d8af8447c01e6b14c417473cf2dfda9) (current main, built on Ubuntu 23.10, cargo 1.75.0) As it already fails during model...

scriptator

reverland

Add optional CORS allow any option value in http server cli

This PR adds option value '*' to --cors-allow-origin cli option to allow browser-based apps to use the embedding server directly. This is useful for local deployments of the embeddings inference...

kir-gadjello

text-embeddings-inference
text-embeddings-inference copied to clipboard

Metadata

Support for jinaai/jina-embeddings-v2-base-code

Error: Could not start backend: Runtime compute cap 70 is not compatible with compile time compute cap 80

The "payload limit" parameter seems to have no effect?

multilingual-e5-large exported by recent sentence-transformers version cannot be loaded

Upgrade tokenizers to 0.19.1 to deal with breaking change in tokenizers

Model Request: long context gte models

Update `HUGGING_FACE_HUB_TOKEN` to `HF_API_TOKEN` in README

Support for e5-mistral-7b-instruct

Support gte-Qwen1.5-7B-instruct

Add optional CORS allow any option value in http server cli

← Metadata

Owner

Metadata

text-embeddings-inference text-embeddings-inference copied to clipboard

Metadata

← Metadata

Owner

Metadata

text-embeddings-inference
text-embeddings-inference copied to clipboard