Spaces:

priyasaravana
/

CodeSummarization

Build error

priyasaravana commited on Jun 8, 2023

Commit

d1231be

•

1 Parent(s): ae5bfc1

Update gradio_app.py

Files changed (1) hide show

gradio_app.py CHANGED Viewed

@@ -8,18 +8,10 @@ from gradio import utils
 import huggingface_hub
 from pathlib import Path
 from src.utils.utilities import Utility
-model = BERTClassifier(model_name='jeevavijay10/nlp-goemotions-bert')
-classes = Utility().read_emotion_list()
-hf_token = os.getenv("HF_TOKEN")
 dataset_dir = "logs"
 headers = ["input", "output", "timestamp", "elapsed"]
 repo = huggingface_hub.Repository(
     local_dir=dataset_dir,
     clone_from="https://huggingface.co/spaces/priyasaravana/CodeSummarization",
@@ -38,21 +30,30 @@ def log_record(vals):
     schedule.run_pending()
     print(f"Last Sync: {job.last_run}")
-def predict(sentence):
     timestamp = datetime.datetime.now().isoformat()
     start_time = time.time()
-    predictions = model.evaluate([sentence])
-    elapsed_time = time.time() - start_time
-    output = classes[predictions[0]]
     print(f"Sentence: {sentence} \nPrediction: {predictions[0]} - {output}")
     log_record([sentence, output, timestamp, str(elapsed_time)])
     return output
 def sync_logs():
     print(f"Repo Clean: {repo.is_repo_clean()}")
     if not repo.is_repo_clean():

 import huggingface_hub
 from pathlib import Path
 from src.utils.utilities import Utility
+from transformers import RobertaTokenizer, T5ForConditionalGeneration
 dataset_dir = "logs"
 headers = ["input", "output", "timestamp", "elapsed"]
 repo = huggingface_hub.Repository(
     local_dir=dataset_dir,
     clone_from="https://huggingface.co/spaces/priyasaravana/CodeSummarization",
     schedule.run_pending()
     print(f"Last Sync: {job.last_run}")
+def evaluate(sentence):
+    tokenizer = RobertaTokenizer.from_pretrained('Salesforce/codet5-base')
+    model = T5ForConditionalGeneration.from_pretrained('Salesforce/codet5-base-multi-sum')
+    # Prepare the input text
+    input_text = code_snippet.strip()
+    input_ids = tokenizer.encode(input_text, return_tensors='pt')
+    # Generate a summary
+    generated_ids = model.generate(input_ids, max_length=20)
+    summary = tokenizer.decode(generated_ids[0], skip_special_tokens=True)
+    return summary
+def predict(sentence):
     timestamp = datetime.datetime.now().isoformat()
     start_time = time.time()
+    predictions = evaluate([sentence])
+    elapsed_time = time.time() - start_time
+    output = predictions
     print(f"Sentence: {sentence} \nPrediction: {predictions[0]} - {output}")
     log_record([sentence, output, timestamp, str(elapsed_time)])
     return output
 def sync_logs():
     print(f"Repo Clean: {repo.is_repo_clean()}")
     if not repo.is_repo_clean():