ai-forever
commited on
replace "retrieval" with "search"
Browse files
README.md
CHANGED
@@ -1651,7 +1651,8 @@ print(sim_scores.diag().tolist())
|
|
1651 |
# [0.47968706488609314, 0.940900444984436, 0.7761018872261047]
|
1652 |
```
|
1653 |
|
1654 |
-
or using prompts:
|
|
|
1655 |
```python
|
1656 |
from sentence_transformers import SentenceTransformer
|
1657 |
|
@@ -1659,15 +1660,14 @@ from sentence_transformers import SentenceTransformer
|
|
1659 |
# loads model with CLS pooling
|
1660 |
model = SentenceTransformer("ai-forever/ru-en-RoSBERTa")
|
1661 |
|
1662 |
-
|
1663 |
classification = model.encode(["Он нам и <unk> не нужон ваш Интернет!", "What a time to be alive!"], prompt_name="classification")
|
1664 |
print(classification[0] @ classification[1].T) # 0.47968706488609314
|
1665 |
|
1666 |
clustering = model.encode(["В Ярославской области разрешили работу бань, но без посетителей", "Ярославским баням разрешили работать без посетителей"], prompt_name="clustering")
|
1667 |
print(clustering[0] @ clustering[1].T) # 0.940900444984436
|
1668 |
|
1669 |
-
query_embedding = model.encode("Сколько программистов нужно, чтобы вкрутить лампочку?", prompt_name="
|
1670 |
-
document_embedding = model.encode("Чтобы вкрутить лампочку, требуется три программиста: один напишет программу извлечения лампочки, другой — вкручивания лампочки, а третий проведет тестирование.", prompt_name="
|
1671 |
print(query_embedding @ document_embedding.T) # 0.7761018872261047
|
1672 |
```
|
1673 |
|
|
|
1651 |
# [0.47968706488609314, 0.940900444984436, 0.7761018872261047]
|
1652 |
```
|
1653 |
|
1654 |
+
or using prompts (sentence-transformers>=2.4.0):
|
1655 |
+
|
1656 |
```python
|
1657 |
from sentence_transformers import SentenceTransformer
|
1658 |
|
|
|
1660 |
# loads model with CLS pooling
|
1661 |
model = SentenceTransformer("ai-forever/ru-en-RoSBERTa")
|
1662 |
|
|
|
1663 |
classification = model.encode(["Он нам и <unk> не нужон ваш Интернет!", "What a time to be alive!"], prompt_name="classification")
|
1664 |
print(classification[0] @ classification[1].T) # 0.47968706488609314
|
1665 |
|
1666 |
clustering = model.encode(["В Ярославской области разрешили работу бань, но без посетителей", "Ярославским баням разрешили работать без посетителей"], prompt_name="clustering")
|
1667 |
print(clustering[0] @ clustering[1].T) # 0.940900444984436
|
1668 |
|
1669 |
+
query_embedding = model.encode("Сколько программистов нужно, чтобы вкрутить лампочку?", prompt_name="search_query")
|
1670 |
+
document_embedding = model.encode("Чтобы вкрутить лампочку, требуется три программиста: один напишет программу извлечения лампочки, другой — вкручивания лампочки, а третий проведет тестирование.", prompt_name="search_document")
|
1671 |
print(query_embedding @ document_embedding.T) # 0.7761018872261047
|
1672 |
```
|
1673 |
|