Spaces:

JunyiAcademy
/

vaitor2

Sleeping

App Files Files Community

youngtsai commited on Apr 18, 2024

Commit

9f0e11f

1 Parent(s): fd34bc4

## 🌟 主題：{{title}} (如果沒有 title 就省略)

Browse files

Files changed (1) hide show

app.py +25 -6

app.py CHANGED Viewed

@@ -888,7 +888,8 @@ def get_video_id_summary(video_id, df_string, source):
         # 检查 summary_file 是否存在
         is_summary_file_exists = GCS_SERVICE.check_file_exists(bucket_name, summary_file_blob_name)
         if not is_summary_file_exists:
-            summary = generate_summarise(df_string)
             summary_json = {"summary": str(summary)}
             summary_text = json.dumps(summary_json, ensure_ascii=False, indent=2)
             upload_file_to_gcs_with_json_string(gcs_client, bucket_name, summary_file_blob_name, summary_text)
@@ -909,7 +910,8 @@ def get_video_id_summary(video_id, df_string, source):
         # 检查逐字稿是否存在
         exists, file_id = check_file_exists(service, folder_id, file_name)
         if not exists:
-            summary = generate_summarise(df_string)
             summary_json = {"summary": str(summary)}
             summary_text = json.dumps(summary_json, ensure_ascii=False, indent=2)
@@ -930,12 +932,27 @@ def get_video_id_summary(video_id, df_string, source):
     return summary_json
-def generate_summarise(df_string):
     # 使用 OpenAI 生成基于上传数据的问题
     sys_content = "你是一個擅長資料分析跟影片教學的老師，user 為學生，請精讀資料文本，自行判斷資料的種類，使用 zh-TW"
     user_content = f"""
-        請根據 {df_string}，判斷這份文本
         格式為 Markdown
         整體摘要在一百字以內
         重點概念列出 bullet points，至少三個，最多五個
         以及可能的結論與結尾延伸小問題提供學生作反思
@@ -943,6 +960,7 @@ def generate_summarise(df_string):
         加減乘除、根號、次方等等的運算式口語也換成 LATEX 數學符號
         整體格式為：
         ## 📚 整體摘要
             - (一個 bullet point....)
@@ -955,7 +973,7 @@ def generate_summarise(df_string):
             - (一個 bullet point....)
         ## ❓ 延伸小問題
-            - (一個 bullet point....)
     """
     # 🗂️ 1. 內容類型：？
@@ -1539,7 +1557,8 @@ def create_LLM_content(video_id, df_string, kind):
         content = generate_reading_passage(df_string)
         update_LLM_content(video_id, content, kind)
     elif kind == "summary_markdown":
-        content = generate_summarise(df_string)
         update_LLM_content(video_id, content, kind)
     elif kind == "mind_map":
         content = generate_mind_map(df_string)

         # 检查 summary_file 是否存在
         is_summary_file_exists = GCS_SERVICE.check_file_exists(bucket_name, summary_file_blob_name)
         if not is_summary_file_exists:
+            meta_data = get_meta_data(video_id)
+            summary = generate_summarise(df_string, meta_data)
             summary_json = {"summary": str(summary)}
             summary_text = json.dumps(summary_json, ensure_ascii=False, indent=2)
             upload_file_to_gcs_with_json_string(gcs_client, bucket_name, summary_file_blob_name, summary_text)
         # 检查逐字稿是否存在
         exists, file_id = check_file_exists(service, folder_id, file_name)
         if not exists:
+            meta_data = get_meta_data(video_id)
+            summary = generate_summarise(df_string, meta_data)
             summary_json = {"summary": str(summary)}
             summary_text = json.dumps(summary_json, ensure_ascii=False, indent=2)
     return summary_json
+def generate_summarise(df_string, metadata=None):
     # 使用 OpenAI 生成基于上传数据的问题
+    if metadata:
+        title = metadata.get("title", "")
+        subject = metadata.get("subject", "")
+        grade = metadata.get("grade", "")
+    else:
+        title = ""
+        subject = ""
+        grade = ""
     sys_content = "你是一個擅長資料分析跟影片教學的老師，user 為學生，請精讀資料文本，自行判斷資料的種類，使用 zh-TW"
     user_content = f"""
+        課程名稱：{title}
+        科目：{subject}
+        年級：{grade}
+        請根據內文： {df_string}
         格式為 Markdown
+        如果有課程名稱，請圍繞「課程名稱」為學習重點，進行重點整理，不要整理跟情境故事相關的問題
         整體摘要在一百字以內
         重點概念列出 bullet points，至少三個，最多五個
         以及可能的結論與結尾延伸小問題提供學生作反思
         加減乘除、根號、次方等等的運算式口語也換成 LATEX 數學符號
         整體格式為：
+        ## 🌟 主題：{{title}} (如果沒有 title 就省略)
         ## 📚 整體摘要
             - (一個 bullet point....)
             - (一個 bullet point....)
         ## ❓ 延伸小問題
+            - (一個 bullet point....請圍繞「課程名稱」為學習重點，進行重點整理，不要整理跟情境故事相關的問題)
     """
     # 🗂️ 1. 內容類型：？
         content = generate_reading_passage(df_string)
         update_LLM_content(video_id, content, kind)
     elif kind == "summary_markdown":
+        meta_data = get_meta_data(video_id)
+        content = generate_summarise(df_string, meta_data)
         update_LLM_content(video_id, content, kind)
     elif kind == "mind_map":
         content = generate_mind_map(df_string)