Spaces:

sakaltcommunity
/

Traningafri

Sleeping

Sakalti commited on 8 days ago

Commit

04519dc

•

1 Parent(s): b330f64

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -40,6 +40,8 @@ if st.button("トレーニング開始"):
             return tokenizer(examples["text"], padding="max_length", truncation=True, max_length=128)
         tokenized_dataset = dataset.map(tokenize_function, batched=True)
         tokenized_dataset = tokenized_dataset.rename_column("text", "labels")
         # 評価用データセットを使わない設定
@@ -48,7 +50,7 @@ if st.button("トレーニング開始"):
         # トレーニング設定
         training_args = TrainingArguments(
             output_dir=output_dir,
-            eval_strategy="no",  # 評価を行わない設定
             learning_rate=2e-5,
             per_device_train_batch_size=8,
             num_train_epochs=1,

             return tokenizer(examples["text"], padding="max_length", truncation=True, max_length=128)
         tokenized_dataset = dataset.map(tokenize_function, batched=True)
+        # input_ids と labels を一致させる（Causal LM の場合）
         tokenized_dataset = tokenized_dataset.rename_column("text", "labels")
         # 評価用データセットを使わない設定
         # トレーニング設定
         training_args = TrainingArguments(
             output_dir=output_dir,
+            eval_strategy="no",  # eval設定を評価しない設定
             learning_rate=2e-5,
             per_device_train_batch_size=8,
             num_train_epochs=1,