Spaces:

JosephCatrambone
/

Chesstour

Build error

App Files Files Community

JosephCatrambone commited on Dec 27, 2022

Commit

6b8f356

1 Parent(s): 1cf8f2a

Changing a few parameters and training for much longer. Should have better outputs now.

Browse files

Files changed (3) hide show

.gitattributes +0 -33
main.py +42 -6
model.pth +2 -2

.gitattributes CHANGED Viewed

@@ -1,34 +1 @@
-*.7z filter=lfs diff=lfs merge=lfs -text
-*.arrow filter=lfs diff=lfs merge=lfs -text
-*.bin filter=lfs diff=lfs merge=lfs -text
-*.bz2 filter=lfs diff=lfs merge=lfs -text
-*.ckpt filter=lfs diff=lfs merge=lfs -text
-*.ftz filter=lfs diff=lfs merge=lfs -text
-*.gz filter=lfs diff=lfs merge=lfs -text
-*.h5 filter=lfs diff=lfs merge=lfs -text
-*.joblib filter=lfs diff=lfs merge=lfs -text
-*.lfs.* filter=lfs diff=lfs merge=lfs -text
-*.mlmodel filter=lfs diff=lfs merge=lfs -text
-*.model filter=lfs diff=lfs merge=lfs -text
-*.msgpack filter=lfs diff=lfs merge=lfs -text
-*.npy filter=lfs diff=lfs merge=lfs -text
-*.npz filter=lfs diff=lfs merge=lfs -text
-*.onnx filter=lfs diff=lfs merge=lfs -text
-*.ot filter=lfs diff=lfs merge=lfs -text
-*.parquet filter=lfs diff=lfs merge=lfs -text
-*.pb filter=lfs diff=lfs merge=lfs -text
-*.pickle filter=lfs diff=lfs merge=lfs -text
-*.pkl filter=lfs diff=lfs merge=lfs -text
-*.pt filter=lfs diff=lfs merge=lfs -text
 *.pth filter=lfs diff=lfs merge=lfs -text
-*.rar filter=lfs diff=lfs merge=lfs -text
-*.safetensors filter=lfs diff=lfs merge=lfs -text
-saved_model/**/* filter=lfs diff=lfs merge=lfs -text
-*.tar.* filter=lfs diff=lfs merge=lfs -text
-*.tflite filter=lfs diff=lfs merge=lfs -text
-*.tgz filter=lfs diff=lfs merge=lfs -text
-*.wasm filter=lfs diff=lfs merge=lfs -text
-*.xz filter=lfs diff=lfs merge=lfs -text
-*.zip filter=lfs diff=lfs merge=lfs -text
-*.zst filter=lfs diff=lfs merge=lfs -text
-*tfevents* filter=lfs diff=lfs merge=lfs -text
























1	*.pth filter=lfs diff=lfs merge=lfs -text

main.py CHANGED Viewed

@@ -10,16 +10,39 @@ import data
 from model import ChessModel
 def train():
     device_string = "cuda" if torch.cuda.is_available() else "cpu"
     device = torch.device(device_string)
-    model = ChessModel(256).to(torch.float32).to(device)
-    opt = torch.optim.Adam(model.parameters())
     reconstruction_loss_fn = nn.CrossEntropyLoss().to(torch.float32).to(device)
     popularity_loss_fn = nn.L1Loss().to(torch.float32).to(device)
     evaluation_loss_fn = nn.L1Loss().to(torch.float32).to(device)
-    data_loader = DataLoader(data.LichessPuzzleDataset(cap_data=65536), batch_size=64, num_workers=1)  # 1 to avoid threading madness.
-    num_epochs = 100
     for epoch in range(num_epochs):
         model.train()
@@ -38,7 +61,8 @@ def train():
             reconstruction_loss = reconstruction_loss_fn(predicted_board_vec, board_vec)
             popularity_loss = popularity_loss_fn(predicted_popularity, popularity)
             evaluation_loss = evaluation_loss_fn(predicted_evaluation, evaluation)
-            total_loss = reconstruction_loss + popularity_loss + evaluation_loss
             opt.zero_grad()
             total_loss.backward()
@@ -54,7 +78,19 @@ def train():
         print(f"Average evaluation loss: {total_evaluation_loss/num_batches}")
         print(f"Average batch loss: {total_batch_loss/num_batches}")
-        torch.save(model, f"checkpoints/epoch_{epoch}.pth")
 def infer(fen):

 from model import ChessModel
+# Experiment parameters:
+RUN_CONFIGURATION = {
+    "learning_rate": 0.0004,
+    "dataset_cap": 100000,
+    "epochs": 1000,
+    "latent_size": 256,
+}
+# Logging:
+wandb = None
+try:
+    import wandb
+    wandb.init("assembly_ai_hackathon_2022", config=RUN_CONFIGURATION)
+except ImportError:
+    print("Weights and Biases not found in packages.")
 def train():
+    learning_rate = RUN_CONFIGURATION["learning_rate"]
+    latent_size = RUN_CONFIGURATION["latent_size"]
+    data_cap = RUN_CONFIGURATION["dataset_cap"]
+    num_epochs = RUN_CONFIGURATION["epochs"]
     device_string = "cuda" if torch.cuda.is_available() else "cpu"
     device = torch.device(device_string)
+    model = ChessModel(latent_size).to(torch.float32).to(device)
+    opt = torch.optim.Adam(model.parameters(), lr=learning_rate)
     reconstruction_loss_fn = nn.CrossEntropyLoss().to(torch.float32).to(device)
     popularity_loss_fn = nn.L1Loss().to(torch.float32).to(device)
     evaluation_loss_fn = nn.L1Loss().to(torch.float32).to(device)
+    data_loader = DataLoader(data.LichessPuzzleDataset(cap_data=data_cap), batch_size=64, num_workers=1)  # 1 to avoid threading madness.
+    save_every_nth_epoch = 50
+    upload_logs_every_nth_epoch = 1
     for epoch in range(num_epochs):
         model.train()
             reconstruction_loss = reconstruction_loss_fn(predicted_board_vec, board_vec)
             popularity_loss = popularity_loss_fn(predicted_popularity, popularity)
             evaluation_loss = evaluation_loss_fn(predicted_evaluation, evaluation)
+            #total_loss = reconstruction_loss + popularity_loss + evaluation_loss
+            total_loss = popularity_loss
             opt.zero_grad()
             total_loss.backward()
         print(f"Average evaluation loss: {total_evaluation_loss/num_batches}")
         print(f"Average batch loss: {total_batch_loss/num_batches}")
+        if save_every_nth_epoch > 0 and (epoch % save_every_nth_epoch) == 0:
+            torch.save(model, f"checkpoints/epoch_{epoch}.pth")
+        if wandb:
+            wandb.log(
+                # For now, just log popularity.
+                {"popularity_loss": total_popularity_loss},
+                commit=(epoch+1) % upload_logs_every_nth_epoch == 0
+            )
+    torch.save(model, "checkpoints/final.pth")
+    if wandb:
+        wandb.finish()
 def infer(fen):

model.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:903a3dc9af8a83bc128b0e6581693a0cf8e74dd2127eb669704420463115e18a
-size 15268009

 version https://git-lfs.github.com/spec/v1
+oid sha256:ed7dc6d33fb3ac545f78b7be413b0bebd565fcca89e6662ed617a2640d99715b
+size 12118255