Spaces:

valcore
/

Branchy-phi-2

Running on Zero

valcore commited on Jul 10, 2024

Commit

92603a4

verified ·

1 Parent(s): 2d53cd7

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,6 +2,7 @@ import gradio as gr
 import torch
 import pandas as pd
 import plotly.graph_objects as go
 from plotly.subplots import make_subplots
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import time
@@ -73,7 +74,8 @@ def truncate_context(input_ids, max_length=2048):
     if len(input_ids[0]) > max_length:
         return input_ids[:, -max_length:]
     return input_ids
 def generate_response(message, chat_history, epsilon):
     global data, stop_generation
     data = pd.DataFrame(columns=["Time taken (in ms)", "Early exit depth", "Token"])

 import torch
 import pandas as pd
 import plotly.graph_objects as go
+import spaces
 from plotly.subplots import make_subplots
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import time
     if len(input_ids[0]) > max_length:
         return input_ids[:, -max_length:]
     return input_ids
+@spaces.GPU
 def generate_response(message, chat_history, epsilon):
     global data, stop_generation
     data = pd.DataFrame(columns=["Time taken (in ms)", "Early exit depth", "Token"])