sergeyzh commited on
Commit
bc005fe
1 Parent(s): a45adfb

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +8 -8
README.md CHANGED
@@ -25,11 +25,11 @@ base_model: cointegrated/LaBSE-en-ru
25
  На STS и близких задачах (PI, NLI, SA, TI) для русского языка конкурирует по качеству с моделью [intfloat/multilingual-e5-large](https://huggingface.co/intfloat/multilingual-e5-large) (но потребляет на 77% меньше памяти и быстрее на 80%).
26
 
27
  ## Лучшая модель для использования в составе RAG LLMs при инференсе на GPU:
28
- - [отличный метрики на задачах STS, PI, NLI](/#metrics) обеспечивают высокое качество при нечетких запросах;
29
- - [средние показатели на задачах SA, TI](/#metrics) снижают влияние авторского стиля и личного отношения автора на ембединг;
30
- - высокая скорость работы на GPU ([> 1k предложений в секунду](/#benchmark)) позволяет легко расширять базу текстовых документов;
31
- - [пониженная размерность эмбединга (768)](/#benchmark_size) ускоряет дальнейшую работу алгоритмов knn при поиске соответствий;
32
- - совместимость с [SentenceTransformer](https://github.com/UKPLab/sentence-transformers) упрощает использование с минимальным объемом кода.
33
 
34
  ## Использование модели с библиотекой `transformers`:
35
 
@@ -65,7 +65,7 @@ print(util.dot_score(embeddings, embeddings))
65
  ```
66
 
67
  ## Метрики
68
- Оценки модели на бенчмарке [encodechka](https://github.com/avidale/encodechka): <a id=metrics"></a>
69
 
70
  | Модель | STS | PI | NLI | SA | TI |
71
  |:---------------------------------|:---------:|:---------:|:---------:|:---------:|:---------:|
@@ -84,7 +84,7 @@ print(util.dot_score(embeddings, embeddings))
84
  - Sentiment analysis (**SA**);
85
  - Toxicity identification (**TI**).
86
 
87
- ## Быстродействие и размеры <a id=benchmark_size"></a>
88
 
89
  На бенчмарке [encodechka](https://github.com/avidale/encodechka):
90
 
@@ -99,7 +99,7 @@ print(util.dot_score(embeddings, embeddings))
99
 
100
 
101
 
102
- При использовании батчей с `sentence_transformers`: <a id=benchmark"></a>
103
 
104
  ```python
105
  from sentence_transformers import SentenceTransformer
 
25
  На STS и близких задачах (PI, NLI, SA, TI) для русского языка конкурирует по качеству с моделью [intfloat/multilingual-e5-large](https://huggingface.co/intfloat/multilingual-e5-large) (но потребляет на 77% меньше памяти и быстрее на 80%).
26
 
27
  ## Лучшая модель для использования в составе RAG LLMs при инференсе на GPU:
28
+ - отличный метрики на задачах STS, PI, NLI обеспечивают высокое качество при нечетких запросах;
29
+ - средние показатели на задачах SA, TI снижают влияние авторского стиля и личного отношения автора на ембединг;
30
+ - высокая скорость работы на GPU (> 1k предложений в секунду) позволяет легко расширять базу текстовых документов;
31
+ - пониженная размерность эмбединга (768) ускоряет дальнейшую работу алгоритмов knn при поиске соответствий;
32
+ - совместимость с [SentenceTransformer](https://github.com/UKPLab/sentence-transformers) позволяет проверить модель на своих данных с минимальным объемом кода.
33
 
34
  ## Использование модели с библиотекой `transformers`:
35
 
 
65
  ```
66
 
67
  ## Метрики
68
+ Оценки модели на бенчмарке [encodechka](https://github.com/avidale/encodechka):
69
 
70
  | Модель | STS | PI | NLI | SA | TI |
71
  |:---------------------------------|:---------:|:---------:|:---------:|:---------:|:---------:|
 
84
  - Sentiment analysis (**SA**);
85
  - Toxicity identification (**TI**).
86
 
87
+ ## Быстродействие и размеры
88
 
89
  На бенчмарке [encodechka](https://github.com/avidale/encodechka):
90
 
 
99
 
100
 
101
 
102
+ При использовании батчей с `sentence_transformers`:
103
 
104
  ```python
105
  from sentence_transformers import SentenceTransformer