Spaces:

Shakshi3104
/

Cobalt

Sleeping

Shakshi3104 commited on Nov 9, 2024

Commit

b58c0e3

1 Parent(s): 371a1e6

[fix] Rename and add timer

Files changed (2) hide show

model/search/{bm25.py → surface.py} RENAMED Viewed

@@ -11,6 +11,7 @@ from rank_bm25 import BM25Okapi
 from model.search.base import BaseSearchClient
 from model.utils.tokenizer import MeCabTokenizer
 class BM25Wrapper(BM25Okapi):
@@ -105,6 +106,7 @@ class BM25SearchClient(BaseSearchClient):
         bm25 = BM25Wrapper(_data, "tokenized")
         return cls(bm25, corpus_tokenized)
     def search_top_n(self, _query: Union[List[str], str], n: int = 10) -> List[pd.DataFrame]:
         """
         クエリに対する検索結果をtop-n個取得する

 from model.search.base import BaseSearchClient
 from model.utils.tokenizer import MeCabTokenizer
+from model.utils.timer import stop_watch
 class BM25Wrapper(BM25Okapi):
         bm25 = BM25Wrapper(_data, "tokenized")
         return cls(bm25, corpus_tokenized)
+    @stop_watch
     def search_top_n(self, _query: Union[List[str], str], n: int = 10) -> List[pd.DataFrame]:
         """
         クエリに対する検索結果をtop-n個取得する

model/search/{ruri.py → vector.py} RENAMED Viewed

@@ -12,11 +12,11 @@ from loguru import logger
 from tqdm import tqdm
 import sentence_transformers as st
-from sentence_transformers import util as st_util
 import voyager
 from model.search.base import BaseSearchClient
 def array_to_string(array: np.ndarray) -> str:
@@ -94,6 +94,7 @@ class RuriVoyagerSearchClient(BaseSearchClient):
         self.index = index
     @classmethod
     def from_dataframe(cls, _data: pd.DataFrame, _target: str):
         logger.info("🚦 [RuriVoyagerSearchClient] Initialize from DataFrame")
@@ -120,6 +121,7 @@ class RuriVoyagerSearchClient(BaseSearchClient):
         return cls(_data, _target, index, embedder)
     def search_top_n(self, _query: Union[List[str], str], n: int = 10) -> List[pd.DataFrame]:
         """
         クエリに対する検索結果をtop-n個取得する

 from tqdm import tqdm
 import sentence_transformers as st
 import voyager
 from model.search.base import BaseSearchClient
+from model.utils.timer import stop_watch
 def array_to_string(array: np.ndarray) -> str:
         self.index = index
     @classmethod
+    @stop_watch
     def from_dataframe(cls, _data: pd.DataFrame, _target: str):
         logger.info("🚦 [RuriVoyagerSearchClient] Initialize from DataFrame")
         return cls(_data, _target, index, embedder)
+    @stop_watch
     def search_top_n(self, _query: Union[List[str], str], n: int = 10) -> List[pd.DataFrame]:
         """
         クエリに対する検索結果をtop-n個取得する