ai-forever commited on
Commit
dd0056f
·
verified ·
1 Parent(s): 79a7c74

replace "retrieval" with "search"

Browse files
Files changed (1) hide show
  1. README.md +4 -4
README.md CHANGED
@@ -1651,7 +1651,8 @@ print(sim_scores.diag().tolist())
1651
  # [0.47968706488609314, 0.940900444984436, 0.7761018872261047]
1652
  ```
1653
 
1654
- or using prompts:
 
1655
  ```python
1656
  from sentence_transformers import SentenceTransformer
1657
 
@@ -1659,15 +1660,14 @@ from sentence_transformers import SentenceTransformer
1659
  # loads model with CLS pooling
1660
  model = SentenceTransformer("ai-forever/ru-en-RoSBERTa")
1661
 
1662
-
1663
  classification = model.encode(["Он нам и <unk> не нужон ваш Интернет!", "What a time to be alive!"], prompt_name="classification")
1664
  print(classification[0] @ classification[1].T) # 0.47968706488609314
1665
 
1666
  clustering = model.encode(["В Ярославской области разрешили работу бань, но без посетителей", "Ярославским баням разрешили работать без посетителей"], prompt_name="clustering")
1667
  print(clustering[0] @ clustering[1].T) # 0.940900444984436
1668
 
1669
- query_embedding = model.encode("Сколько программистов нужно, чтобы вкрутить лампочку?", prompt_name="retrieval_query")
1670
- document_embedding = model.encode("Чтобы вкрутить лампочку, требуется три программиста: один напишет программу извлечения лампочки, другой — вкручивания лампочки, а третий проведет тестирование.", prompt_name="retrieval_document")
1671
  print(query_embedding @ document_embedding.T) # 0.7761018872261047
1672
  ```
1673
 
 
1651
  # [0.47968706488609314, 0.940900444984436, 0.7761018872261047]
1652
  ```
1653
 
1654
+ or using prompts (sentence-transformers>=2.4.0):
1655
+
1656
  ```python
1657
  from sentence_transformers import SentenceTransformer
1658
 
 
1660
  # loads model with CLS pooling
1661
  model = SentenceTransformer("ai-forever/ru-en-RoSBERTa")
1662
 
 
1663
  classification = model.encode(["Он нам и <unk> не нужон ваш Интернет!", "What a time to be alive!"], prompt_name="classification")
1664
  print(classification[0] @ classification[1].T) # 0.47968706488609314
1665
 
1666
  clustering = model.encode(["В Ярославской области разрешили работу бань, но без посетителей", "Ярославским баням разрешили работать без посетителей"], prompt_name="clustering")
1667
  print(clustering[0] @ clustering[1].T) # 0.940900444984436
1668
 
1669
+ query_embedding = model.encode("Сколько программистов нужно, чтобы вкрутить лампочку?", prompt_name="search_query")
1670
+ document_embedding = model.encode("Чтобы вкрутить лампочку, требуется три программиста: один напишет программу извлечения лампочки, другой — вкручивания лампочки, а третий проведет тестирование.", prompt_name="search_document")
1671
  print(query_embedding @ document_embedding.T) # 0.7761018872261047
1672
  ```
1673