Sofa321 commited on
Commit
113d0fb
·
verified ·
1 Parent(s): 2f21fc3

Create update_dataset.py

Browse files
Files changed (1) hide show
  1. update_dataset.py +31 -0
update_dataset.py ADDED
@@ -0,0 +1,31 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ import pandas as pd
2
+
3
+ # Load dataset utama dan log
4
+ try:
5
+ dataset = pd.read_csv("dataset.csv")
6
+ except FileNotFoundError:
7
+ dataset = pd.DataFrame(columns=["pertanyaan", "jawaban"])
8
+
9
+ try:
10
+ log = pd.read_csv("chat_log.csv")
11
+ except FileNotFoundError:
12
+ log = pd.DataFrame(columns=["pertanyaan", "jawaban"])
13
+
14
+ # Validasi log: Isi jawaban baru
15
+ print("Log baru yang ditemukan:")
16
+ print(log)
17
+ print("\nMasukkan jawaban untuk setiap pertanyaan:")
18
+ for i, row in log.iterrows():
19
+ if pd.isna(row['jawaban']):
20
+ log.at[i, 'jawaban'] = input(f"Jawaban untuk '{row['pertanyaan']}': ")
21
+
22
+ # Gabungkan log ke dataset utama
23
+ updated_dataset = pd.concat([dataset, log]).drop_duplicates().reset_index(drop=True)
24
+
25
+ # Simpan dataset terbaru
26
+ updated_dataset.to_csv("dataset.csv", index=False)
27
+ print("Dataset telah diperbarui dan disimpan ke 'dataset.csv'.")
28
+
29
+ # Kosongkan log
30
+ log.iloc[0:0].to_csv("chat_log.csv", index=False)
31
+ print("Log telah dikosongkan.")