Spaces:

datasets-topics
/

topics-generator

Sleeping

asoria HF staff commited on Oct 16, 2024

Commit

75e3496

1 Parent(s): b45d09c

Try to fix cuml not finding cuda library?

Files changed (2) hide show

app.py CHANGED Viewed

@@ -23,21 +23,13 @@ from gradio_huggingfacehub_search import HuggingfaceHubSearch
 from bertopic import BERTopic
 from bertopic.representation import KeyBERTInspired
 from bertopic.representation import TextGeneration
 from huggingface_hub import HfApi
 from sklearn.feature_extraction.text import CountVectorizer
 from sentence_transformers import SentenceTransformer
 from prompts import REPRESENTATION_PROMPT
-@spaces.GPU
-def calculate_embeddings(docs):
-    return sentence_model.encode(docs, show_progress_bar=True, batch_size=32)
-from cuml.manifold import UMAP
-from cuml.cluster import HDBSCAN
 """
 TODOs:
 - Improve representation layer (Try with llamacpp or TextGeneration)
@@ -135,6 +127,11 @@ def get_docs_from_parquet(parquet_urls, column, offset, limit):
     return df[column].tolist()
 def calculate_n_neighbors_and_components(n_rows):
     n_neighbors = min(max(n_rows // 20, 15), 100)
     n_components = 10 if n_rows > 1000 else 5  # Higher components for larger datasets

 from bertopic import BERTopic
 from bertopic.representation import KeyBERTInspired
 from bertopic.representation import TextGeneration
+from cuml.manifold import UMAP
+from cuml.cluster import HDBSCAN
 from huggingface_hub import HfApi
 from sklearn.feature_extraction.text import CountVectorizer
 from sentence_transformers import SentenceTransformer
 from prompts import REPRESENTATION_PROMPT
 """
 TODOs:
 - Improve representation layer (Try with llamacpp or TextGeneration)
     return df[column].tolist()
+@spaces.GPU
+def calculate_embeddings(docs):
+    return sentence_model.encode(docs, show_progress_bar=True, batch_size=32)
 def calculate_n_neighbors_and_components(n_rows):
     n_neighbors = min(max(n_rows // 20, 15), 100)
     n_components = 10 if n_rows > 1000 else 5  # Higher components for larger datasets

requirements.txt CHANGED Viewed

@@ -1,3 +1,6 @@
 gradio_huggingfacehub_search==0.0.7
 duckdb
 accelerate
@@ -7,7 +10,6 @@ bitsandbytes
 datamapplot==0.3.0
 bertopic
 pandas
-torch
 numpy
 python-dotenv
 kaleido

+spaces
+gradio
+torch
 gradio_huggingfacehub_search==0.0.7
 duckdb
 accelerate
 datamapplot==0.3.0
 bertopic
 pandas
 numpy
 python-dotenv
 kaleido