Spaces:

JunyiAcademy
/

vaitor2

Sleeping

App Files Files Community

youngtsai commited on Apr 15, 2024

Commit

76215d7

1 Parent(s): fd5cb81

def summary_add_markdown_version(video_id):

Browse files

Files changed (1) hide show

app.py +156 -12

app.py CHANGED Viewed

@@ -1549,6 +1549,132 @@ def create_LLM_content(video_id, df_string, kind):
     return gr.update(value=content, interactive=False)
 # AI 生成教學素材
 def get_meta_data(video_id, source="gcs"):
     if source == "gcs":
@@ -2440,22 +2566,30 @@ with gr.Blocks(theme=gr.themes.Base(primary_hue=gr.themes.colors.orange, seconda
                 df_string_output = gr.Textbox(lines=40, label="Data Text", interactive=False, show_copy_button=True)
         with gr.Tab("文章本文"):
             with gr.Row() as reading_passage_admin:
-                reading_passage_kind = gr.Textbox(value="reading_passage", show_label=False)
-                reading_passage_get_button = gr.Button("取得", size="sm", variant="primary")
-                reading_passage_edit_button = gr.Button("編輯", size="sm", variant="primary")
-                reading_passage_update_button = gr.Button("更新", size="sm", variant="primary")
-                reading_passage_delete_button = gr.Button("刪除", size="sm", variant="primary")
-                reading_passage_create_button = gr.Button("建立", size="sm", variant="primary")
             with gr.Row():
                 reading_passage_text = gr.Textbox(label="reading_passage", lines=40, interactive=False, show_copy_button=True)
         with gr.Tab("重點摘要本文"):
             with gr.Row() as summary_admmin:
-                summary_kind = gr.Textbox(value="summary", show_label=False)
-                summary_get_button = gr.Button("取得", size="sm", variant="primary")
-                summary_edit_button = gr.Button("編輯", size="sm", variant="primary")
-                summary_update_button = gr.Button("更新", size="sm", variant="primary")
-                summary_delete_button = gr.Button("刪除", size="sm", variant="primary")
-                summary_create_button = gr.Button("建立", size="sm", variant="primary")
             with gr.Row():
                 summary_text = gr.Textbox(label="Summary", lines=40, interactive=False, show_copy_button=True)
         with gr.Tab("關鍵時刻本文"):
@@ -2656,6 +2790,11 @@ with gr.Blocks(theme=gr.themes.Base(primary_hue=gr.themes.colors.orange, seconda
     # web_link.change(process_web_link, inputs=web_link, outputs=[btn_1, btn_2, btn_3, df_summarise, df_string_output])
     # reading_passage event
     reading_passage_get_button.click(
         get_LLM_content,
         inputs=[video_id, reading_passage_kind],
@@ -2683,6 +2822,11 @@ with gr.Blocks(theme=gr.themes.Base(primary_hue=gr.themes.colors.orange, seconda
     )
     # summary event
     summary_get_button.click(
         get_LLM_content,
         inputs=[video_id, summary_kind],

     return gr.update(value=content, interactive=False)
+# ---- LLM refresh CRUD ----
+def reading_passage_add_latex_version(video_id):
+    # 確認 GCS 是否有 reading_passage.json
+    print("===reading_passage_convert_to_latex===")
+    gcs_client = GCS_CLIENT
+    bucket_name = 'video_ai_assistant'
+    file_name = f'{video_id}_reading_passage.json'
+    blob_name = f"{video_id}/{file_name}"
+    print(f"blob_name: {blob_name}")
+    # 检查檔案是否存在
+    is_file_exists = GCS_SERVICE.check_file_exists(bucket_name, blob_name)
+    if not is_file_exists:
+        raise gr.Error("reading_passage 不存在!")
+    # 逐字稿已存在，下载逐字稿内容
+    print("reading_passage 已存在于GCS中，轉換 Latex 模式")
+    reading_passage_text = download_blob_to_string(gcs_client, bucket_name, blob_name)
+    reading_passage_json = json.loads(reading_passage_text)
+    original_reading_passage = reading_passage_json["reading_passage"]
+    sys_content = "你是一個擅長資料分析跟影片教學的老師，user 為學生，請精讀資料文本，自行判斷資料的種類，使用 zh-TW"
+    user_content = f"""
+        請根據 {original_reading_passage}
+        敘述中，請把數學或是專業術語，用 Latex 包覆（$...$），並且不要去改原本的文章
+        加減乘除、根號、次方、化學符號、物理符號等等的運算式口語也換成 LATEX 符號
+        請一定要使用繁體中文 zh-TW，並用台灣人的口語
+        產生的結果不要前後文解釋，也不要敘述這篇文章怎麼產生的
+        只需要專注提供 Reading Passage，字數在 200~500 字以內
+    """
+    messages = [
+        {"role": "system", "content": sys_content},
+        {"role": "user", "content": user_content}
+    ]
+    request_payload = {
+        "model": "gpt-4-turbo",
+        "messages": messages,
+        "max_tokens": 4000,
+    }
+    response = OPEN_AI_CLIENT.chat.completions.create(**request_payload)
+    new_reading_passage = response.choices[0].message.content.strip()
+    print("=====new_reading_passage=====")
+    print(new_reading_passage)
+    print("=====new_reading_passage=====")
+    reading_passage_json["reading_passage"] = new_reading_passage
+    reading_passage_text = json.dumps(reading_passage_json, ensure_ascii=False, indent=2)
+    # 另存為 reading_passage_latex.json
+    new_file_name = f'{video_id}_reading_passage_latex.json'
+    new_blob_name = f"{video_id}/{new_file_name}"
+    upload_file_to_gcs_with_json_string(gcs_client, bucket_name, new_blob_name, reading_passage_text)
+    return new_reading_passage
+def summary_add_markdown_version(video_id):
+    # 確認 GCS 是否有 summary.json
+    print("===summary_convert_to_markdown===")
+    gcs_client = GCS_CLIENT
+    bucket_name = 'video_ai_assistant'
+    file_name = f'{video_id}_summary.json'
+    blob_name = f"{video_id}/{file_name}"
+    print(f"blob_name: {blob_name}")
+    # 检查檔案是否存在
+    is_file_exists = GCS_SERVICE.check_file_exists(bucket_name, blob_name)
+    if not is_file_exists:
+        raise gr.Error("summary 不存在!")
+    # 逐字稿已存在，下载逐字稿内容
+    print("summary 已存在于GCS中，轉換 Markdown 模式")
+    summary_text = download_blob_to_string(gcs_client, bucket_name, blob_name)
+    summary_json = json.loads(summary_text)
+    original_summary = summary_json["summary"]
+    sys_content = "你是一個擅長資料分析跟影片教學的老師，user 為學生，請精讀資料文本，自行判斷資料的種類，使用 zh-TW"
+    user_content = f"""
+        請根據 {original_summary}
+        轉換格式為 Markdown
+        只保留：📚 整體摘要、🔖 重點概念、💡 為什麼我們要學這個、❓ 延伸小問題
+        其他的不要保留
+        整體摘要在一百字以內
+        重點概念轉成 bullet points
+        以及可能的結論與結尾延伸小問題提供學生作反思
+        敘述中，請把數學或是專業術語，用 Latex 包覆（$...$）
+        加減乘除、根號、次方等等的運算式口語也換成 LATEX 數學符號
+        整體格式為：
+        ## 📚 整體摘要
+            - (一個 bullet point....)
+        ## 🔖 重點概念
+            - xxx
+            - xxx
+            - xxx
+        ## 💡 為什麼我們要學這個？
+            - (一個 bullet point....)
+        ## ❓ 延伸小問題
+            - (一個 bullet point....)
+    """
+    messages = [
+        {"role": "system", "content": sys_content},
+        {"role": "user", "content": user_content}
+    ]
+    request_payload = {
+        "model": "gpt-4-turbo",
+        "messages": messages,
+        "max_tokens": 4000,
+    }
+    response = OPEN_AI_CLIENT.chat.completions.create(**request_payload)
+    new_summary = response.choices[0].message.content.strip()
+    print("=====new_summary=====")
+    print(new_summary)
+    print("=====new_summary=====")
+    summary_json["summary"] = new_summary
+    summary_text = json.dumps(summary_json, ensure_ascii=False, indent=2)
+    # 另存為 summary_markdown.json
+    new_file_name = f'{video_id}_summary_markdown.json'
+    new_blob_name = f"{video_id}/{new_file_name}"
+    upload_file_to_gcs_with_json_string(gcs_client, bucket_name, new_blob_name, summary_text)
+    return new_summary
 # AI 生成教學素材
 def get_meta_data(video_id, source="gcs"):
     if source == "gcs":
                 df_string_output = gr.Textbox(lines=40, label="Data Text", interactive=False, show_copy_button=True)
         with gr.Tab("文章本文"):
             with gr.Row() as reading_passage_admin:
+                with gr.Column():
+                    with gr.Row():
+                        reading_passage_kind = gr.Textbox(value="reading_passage", show_label=False)
+                    with gr.Row():
+                        reading_passage_text_to_latex = gr.Button("新增 LaTeX", size="sm", variant="primary")
+                        reading_passage_get_button = gr.Button("取得", size="sm", variant="primary")
+                        reading_passage_edit_button = gr.Button("編輯", size="sm", variant="primary")
+                        reading_passage_update_button = gr.Button("更新", size="sm", variant="primary")
+                        reading_passage_delete_button = gr.Button("刪除", size="sm", variant="primary")
+                        reading_passage_create_button = gr.Button("建立", size="sm", variant="primary")
             with gr.Row():
                 reading_passage_text = gr.Textbox(label="reading_passage", lines=40, interactive=False, show_copy_button=True)
         with gr.Tab("重點摘要本文"):
             with gr.Row() as summary_admmin:
+                with gr.Column():
+                    with gr.Row():
+                        summary_kind = gr.Textbox(value="summary", show_label=False)
+                    with gr.Row():
+                        summary_to_markdown = gr.Button("新增 Markdown", size="sm", variant="primary")
+                        summary_get_button = gr.Button("取得", size="sm", variant="primary")
+                        summary_edit_button = gr.Button("編輯", size="sm", variant="primary")
+                        summary_update_button = gr.Button("更新", size="sm", variant="primary")
+                        summary_delete_button = gr.Button("刪除", size="sm", variant="primary")
+                        summary_create_button = gr.Button("建立", size="sm", variant="primary")
             with gr.Row():
                 summary_text = gr.Textbox(label="Summary", lines=40, interactive=False, show_copy_button=True)
         with gr.Tab("關鍵時刻本文"):
     # web_link.change(process_web_link, inputs=web_link, outputs=[btn_1, btn_2, btn_3, df_summarise, df_string_output])
     # reading_passage event
+    reading_passage_text_to_latex.click(
+        reading_passage_add_latex_version,
+        inputs=[video_id],
+        outputs=[reading_passage_text]
+    )
     reading_passage_get_button.click(
         get_LLM_content,
         inputs=[video_id, reading_passage_kind],
     )
     # summary event
+    summary_to_markdown.click(
+        summary_add_markdown_version,
+        inputs=[video_id],
+        outputs=[summary_text]
+    )
     summary_get_button.click(
         get_LLM_content,
         inputs=[video_id, summary_kind],