Update README.md
Browse files
README.md
CHANGED
@@ -25,11 +25,11 @@ base_model: cointegrated/LaBSE-en-ru
|
|
25 |
На STS и близких задачах (PI, NLI, SA, TI) для русского языка конкурирует по качеству с моделью [intfloat/multilingual-e5-large](https://huggingface.co/intfloat/multilingual-e5-large) (но потребляет на 77% меньше памяти и быстрее на 80%).
|
26 |
|
27 |
## Лучшая модель для использования в составе RAG LLMs при инференсе на GPU:
|
28 |
-
-
|
29 |
-
-
|
30 |
-
- высокая скорость работы на GPU (
|
31 |
-
-
|
32 |
-
- совместимость с [SentenceTransformer](https://github.com/UKPLab/sentence-transformers)
|
33 |
|
34 |
## Использование модели с библиотекой `transformers`:
|
35 |
|
@@ -65,7 +65,7 @@ print(util.dot_score(embeddings, embeddings))
|
|
65 |
```
|
66 |
|
67 |
## Метрики
|
68 |
-
Оценки модели на бенчмарке [encodechka](https://github.com/avidale/encodechka):
|
69 |
|
70 |
| Модель | STS | PI | NLI | SA | TI |
|
71 |
|:---------------------------------|:---------:|:---------:|:---------:|:---------:|:---------:|
|
@@ -84,7 +84,7 @@ print(util.dot_score(embeddings, embeddings))
|
|
84 |
- Sentiment analysis (**SA**);
|
85 |
- Toxicity identification (**TI**).
|
86 |
|
87 |
-
## Быстродействие и размеры
|
88 |
|
89 |
На бенчмарке [encodechka](https://github.com/avidale/encodechka):
|
90 |
|
@@ -99,7 +99,7 @@ print(util.dot_score(embeddings, embeddings))
|
|
99 |
|
100 |
|
101 |
|
102 |
-
При использовании батчей с `sentence_transformers`:
|
103 |
|
104 |
```python
|
105 |
from sentence_transformers import SentenceTransformer
|
|
|
25 |
На STS и близких задачах (PI, NLI, SA, TI) для русского языка конкурирует по качеству с моделью [intfloat/multilingual-e5-large](https://huggingface.co/intfloat/multilingual-e5-large) (но потребляет на 77% меньше памяти и быстрее на 80%).
|
26 |
|
27 |
## Лучшая модель для использования в составе RAG LLMs при инференсе на GPU:
|
28 |
+
- отличный метрики на задачах STS, PI, NLI обеспечивают высокое качество при нечетких запросах;
|
29 |
+
- средние показатели на задачах SA, TI снижают влияние авторского стиля и личного отношения автора на ембединг;
|
30 |
+
- высокая скорость работы на GPU (> 1k предложений в секунду) позволяет легко расширять базу текстовых документов;
|
31 |
+
- пониженная размерность эмбединга (768) ускоряет дальнейшую работу алгоритмов knn при поиске соответствий;
|
32 |
+
- совместимость с [SentenceTransformer](https://github.com/UKPLab/sentence-transformers) позволяет проверить модель на своих данных с минимальным объемом кода.
|
33 |
|
34 |
## Использование модели с библиотекой `transformers`:
|
35 |
|
|
|
65 |
```
|
66 |
|
67 |
## Метрики
|
68 |
+
Оценки модели на бенчмарке [encodechka](https://github.com/avidale/encodechka):
|
69 |
|
70 |
| Модель | STS | PI | NLI | SA | TI |
|
71 |
|:---------------------------------|:---------:|:---------:|:---------:|:---------:|:---------:|
|
|
|
84 |
- Sentiment analysis (**SA**);
|
85 |
- Toxicity identification (**TI**).
|
86 |
|
87 |
+
## Быстродействие и размеры
|
88 |
|
89 |
На бенчмарке [encodechka](https://github.com/avidale/encodechka):
|
90 |
|
|
|
99 |
|
100 |
|
101 |
|
102 |
+
При использовании батчей с `sentence_transformers`:
|
103 |
|
104 |
```python
|
105 |
from sentence_transformers import SentenceTransformer
|