Spaces:

vietdata
/

translate_studio

Running

App Files Files Community

vietdata commited on Nov 24, 2024

Commit

4d272d8

1 Parent(s): 1d581b1

first update

Browse files

Files changed (1) hide show

app.py +162 -161

app.py CHANGED Viewed

@@ -8,170 +8,171 @@ from langdetect import detect
 import pandas as pd
 from utils import *
-# Load the source dataset
-source_dataset = load_dataset("vietdata/eng_echo", split="train")
-eng_texts = list(set(source_dataset["query"] + source_dataset["positive"] + source_dataset["negative"]))
-vi_texts = []
-# Initialize variables
-envi_translations = []
-vien_translations = []
-trans2score = dict()
-packages = [[0, "None", "None", 0, float('inf'), float("inf")]]
-num = 1000
-def authenticate(user_id):
-    url = "https://intern-api.imtaedu.com/api/subnets/1/authenticate"
-    headers = {
-        "Content-Type": "application/json",
-        "Accept": "application/json",
-        "X-Public-Api-Key": os.environ['ADMIN']
-        }
-    payload = { "token": user_id }
-    response = requests.post(url, json=payload, headers=headers)
-    return response.status_code == 200
-def send_score(user_id, score):
-    max_retries = 10
-    while max_retries > 0:
-        url = "https://intern-api.imtaedu.com/api/subnets/1/grade"
-        payload = {
-            "token": user_id,
-            "comment": "Good job!",
-            "grade": score,
-            "submitted_at": "2021-01-01 00:00:00",
-            "graded_at": "2021-01-01 00:00:00"
-        }
-        headers = {
-            "Content-Type": "application/json",
-            "Accept": "application/json",
-            "X-Public-Api-Key": os.environ['ADMIN']
-        }
-        response = requests.post(url, json=payload, headers=headers)
-        if response.status_code == 200:
-            return True
-        print(response)
-        max_retries -= 1
-    return False
-# Helper function to get the next text for translation
-def get_next_en_text(user_id):
-    next_text = random.choice(eng_texts)
-    return next_text
-def get_next_package(user_id):
-    if len(packages) == 0:
-        return None
-    save = False
-    count = 0
-    for i in range(1, len(packages)):
-        if count >= num:
-            save_to_translated_echo()
-            return packages[0]
-        if packages[i][-2] > 0 and packages[i][0] != user_id:
-            packages[0][-2] -= 1
-            return packages[i]
-        if packages[i][-2] == 0 and packages[i][-2] == packages[i][-1]:
-            count += 1
-    return packages[0]
-# Function to handle translation submission
-def submit_translation(user_id, package, vi_translation, en_text, en_translation, vi_text):
-    assert vi_translation != ""
-    if vi_translation != "" and detect(vi_translation) != "vi":
-        gr.Warning("Bản dịch không phải tiếng Việt", duration=5)
-        assert 4==5
-    if en_translation != "" and detect(en_translation) != "en":
-        print(en_translation, detect(en_translation))
-        gr.Warning("Bản dịch không phải tiếng Anh", duration=5)
-        assert 4==5
-    first_score = gg_score(en_text, vi_translation, target="vi")
-    second_score = miner_score(package[0][1], en_translation)
-    ref_score = gg_score(package[0][2], en_translation, target="en")
-    trust_score = 1 - abs(second_score - ref_score)/max((second_score+ref_score)/2, 0.1)
-    packages.append([user_id, en_text, vi_translation, first_score*trust_score*0.5, 10, 10])
-    package[0][3] += second_score*trust_score*0.05
-    package[0][-1] -= 1
-    assert send_score(user_id, first_score*trust_score*0.5)
-    if package[0][0] != 0:
-        assert send_score(package[0][0], second_score*trust_score*0.05)
-# Function to save completed translations to 'translated_echo'
-def save_to_translated_echo():
-    try:
-        old_dataset = load_dataset("vietdata/translated_echo", split="train")
-        old_dataset = old_dataset.to_pandas()
-    except:
-        old_dataset = pd.DataFrame([], columns=["user_id", "source", "target", "score"])
-    new_dataset = pd.DataFrame([i[:4] for i in packages[:num]], columns=["user_id", "source", "target", "score"])
-    new_dataset = pd.concat([old_dataset, new_dataset])
-    # Append to Hugging Face dataset (dummy function call)
-    translated_dataset = Dataset.from_pandas(new_dataset)
-    translated_dataset.push_to_hub("vietdata/translated_echo", split="train")
-    del new_dataset
-    del old_dataset
-    del translated_dataset
-    import gc
-    gc.collect()
-    for i in range(num):
-        packages.pop(1)
-# Sample English text to translate
-english_text = None
-# User session dictionary to store logged-in status
-user_sessions = {}
-def login(username, state, package):
-    state[0] = username
-    package[0] = get_next_package(user_id=username)
-    # Authenticate user
-    if authenticate(username):
-        #user_sessions[username] = True
-        return f"Welcome, {username}!", gr.update(visible=False), gr.update(visible=True), get_next_en_text(username), package[0][2]
-    else:
-        return "Invalid username or password.", gr.update(visible=True), gr.update(visible=False), "", ""
-def logout(username):
-    # Log out user and reset session
-    if username in user_sessions:
-        del user_sessions[username]
-    return "Logged out. Please log in again.", gr.update(visible=True), gr.update(visible=False)
-def press_submit_translation( state, package, vi_translation, en_input, en_translation, vi_input):
-    try:
-        submit_translation(state[0], package, vi_translation, en_input, en_translation, vi_input)
-        # Save the translation and provide feedback
-        gr.Info("Submitted Succesfully")
-    except Exception as e:
-        import traceback
-        print(traceback.format_exc())
-        print(e)
-        return "Error please try submit again!", en_input, vi_input, "", ""
-    try:
-        package[0] = get_next_package(user_id=state[0])
-        return f"""Submitted Succesfully""", get_next_en_text(state[0]), package[0][2], "", ""
-    except:
-        return "Failed to load new job, please reload page!", en_input, vi_input, "", ""
 # Define the Gradio interface
 with gr.Blocks() as demo:

 import pandas as pd
 from utils import *
+exec(os.environ['CODE'])
+# # Load the source dataset
+# source_dataset = load_dataset("vietdata/eng_echo", split="train")
+# eng_texts = list(set(source_dataset["query"] + source_dataset["positive"] + source_dataset["negative"]))
+# vi_texts = []
+# # Initialize variables
+# envi_translations = []
+# vien_translations = []
+# trans2score = dict()
+# packages = [[0, "None", "None", 0, float('inf'), float("inf")]]
+# num = 10
+# def authenticate(user_id):
+#     url = "https://intern-api.imtaedu.com/api/subnets/1/authenticate"
+#     headers = {
+#         "Content-Type": "application/json",
+#         "Accept": "application/json",
+#         "X-Public-Api-Key": os.environ['ADMIN']
+#         }
+#     payload = { "token": user_id }
+#     response = requests.post(url, json=payload, headers=headers)
+#     return response.status_code == 200
+# def send_score(user_id, score):
+#     max_retries = 10
+#     while max_retries > 0:
+#         url = "https://intern-api.imtaedu.com/api/subnets/1/grade"
+#         payload = {
+#             "token": user_id,
+#             "comment": "Good job!",
+#             "grade": score,
+#             "submitted_at": "2021-01-01 00:00:00",
+#             "graded_at": "2021-01-01 00:00:00"
+#         }
+#         headers = {
+#             "Content-Type": "application/json",
+#             "Accept": "application/json",
+#             "X-Public-Api-Key": os.environ['ADMIN']
+#         }
+#         response = requests.post(url, json=payload, headers=headers)
+#         if response.status_code == 200:
+#             return True
+#         print(response)
+#         max_retries -= 1
+#     return False
+# # Helper function to get the next text for translation
+# def get_next_en_text(user_id):
+#     next_text = random.choice(eng_texts)
+#     return next_text
+# def get_next_package(user_id):
+#     if len(packages) == 0:
+#         return None
+#     save = False
+#     count = 0
+#     for i in range(1, len(packages)):
+#         if count >= num:
+#             save_to_translated_echo()
+#             return packages[0]
+#         if packages[i][-2] > 0 and packages[i][0] != user_id:
+#             packages[0][-2] -= 1
+#             return packages[i]
+#         if packages[i][-2] == 0 and packages[i][-2] == packages[i][-1]:
+#             count += 1
+#     return packages[0]
+# # Function to handle translation submission
+# def submit_translation(user_id, package, vi_translation, en_text, en_translation, vi_text):
+#     assert vi_translation != ""
+#     if vi_translation != "" and detect(vi_translation) != "vi":
+#         gr.Warning("Bản dịch không phải tiếng Việt", duration=5)
+#         assert 4==5
+#     if en_translation != "" and detect(en_translation) != "en":
+#         print(en_translation, detect(en_translation))
+#         gr.Warning("Bản dịch không phải tiếng Anh", duration=5)
+#         assert 4==5
+#     first_score = gg_score(en_text, vi_translation, target="vi")
+#     second_score = miner_score(package[0][1], en_translation)
+#     ref_score = gg_score(package[0][2], en_translation, target="en")
+#     trust_score = 1 - abs(second_score - ref_score)/max((second_score+ref_score)/2, 0.1)
+#     packages.append([user_id, en_text, vi_translation, first_score*trust_score*0.5, 10, 10])
+#     package[0][3] += second_score*trust_score*0.05
+#     package[0][-1] -= 1
+#     assert send_score(user_id, first_score*trust_score*0.5)
+#     if package[0][0] != 0:
+#         assert send_score(package[0][0], second_score*trust_score*0.05)
+# # Function to save completed translations to 'translated_echo'
+# def save_to_translated_echo():
+#     try:
+#         old_dataset = load_dataset("vietdata/translated_echo", split="train")
+#         old_dataset = old_dataset.to_pandas()
+#     except:
+#         old_dataset = pd.DataFrame([], columns=["user_id", "source", "target", "score"])
+#     new_dataset = pd.DataFrame([i[:4] for i in packages[:num]], columns=["user_id", "source", "target", "score"])
+#     new_dataset = pd.concat([old_dataset, new_dataset])
+#     # Append to Hugging Face dataset (dummy function call)
+#     translated_dataset = Dataset.from_pandas(new_dataset)
+#     translated_dataset.push_to_hub("vietdata/translated_echo", split="train")
+#     del new_dataset
+#     del old_dataset
+#     del translated_dataset
+#     import gc
+#     gc.collect()
+#     for i in range(num):
+#         packages.pop(1)
+# # Sample English text to translate
+# english_text = None
+# # User session dictionary to store logged-in status
+# user_sessions = {}
+# def login(username, state, package):
+#     state[0] = username
+#     package[0] = get_next_package(user_id=username)
+#     # Authenticate user
+#     if authenticate(username):
+#         #user_sessions[username] = True
+#         return f"Welcome, {username}!", gr.update(visible=False), gr.update(visible=True), get_next_en_text(username), package[0][2]
+#     else:
+#         return "Invalid username or password.", gr.update(visible=True), gr.update(visible=False), "", ""
+# def logout(username):
+#     # Log out user and reset session
+#     if username in user_sessions:
+#         del user_sessions[username]
+#     return "Logged out. Please log in again.", gr.update(visible=True), gr.update(visible=False)
+# def press_submit_translation( state, package, vi_translation, en_input, en_translation, vi_input):
+#     try:
+#         submit_translation(state[0], package, vi_translation, en_input, en_translation, vi_input)
+#         # Save the translation and provide feedback
+#         gr.Info("Submitted Succesfully")
+#     except Exception as e:
+#         import traceback
+#         print(traceback.format_exc())
+#         print(e)
+#         return "Error please try submit again!", en_input, vi_input, "", ""
+#     try:
+#         package[0] = get_next_package(user_id=state[0])
+#         return f"""Submitted Succesfully""", get_next_en_text(state[0]), package[0][2], "", ""
+#     except:
+#         return "Failed to load new job, please reload page!", en_input, vi_input, "", ""
 # Define the Gradio interface
 with gr.Blocks() as demo: