Alibaba-NLP
/

gte-base-en-v1.5

@@ -2713,6 +2713,14 @@ const similarities = document_embeddings.map(x => 100 * dot(source_embeddings, x
 console.log(similarities); // [34.504930869007296, 64.03973265120138, 19.520042686034362]
 ```
 ## Training Details
 ### Training Data

 console.log(similarities); // [34.504930869007296, 64.03973265120138, 19.520042686034362]
 ```
+Use with infinity:
+[Infinity](https://github.com/michaelfeil/infinity) is a MIT licensed server for OpenAI-compatible deployment.
+```
+docker run --gpus all -v $PWD/data:/app/.cache -p "7997":"7997" \
+michaelf34/infinity:0.0.68 \
+v2 --model-id Alibaba-NLP/gte-base-en-v1.5 --revision "4c742dc2b781e4ab062a4a77f4f7cbad4bdee970" --dtype bfloat16 --batch-size 32 --device cuda --engine torch --port 7997
+```
 ## Training Details
 ### Training Data