Initial commit

Files changed (12) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 29.00 +/- 64.30
       name: mean_reward
       verified: false
 ---
@@ -62,7 +62,7 @@ python -m rl_zoo3.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f lo
 ## Hyperparameters
 ```python
-OrderedDict([('batch_size', 16),
              ('buffer_size', 10000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
@@ -70,7 +70,7 @@ OrderedDict([('batch_size', 16),
              ('exploration_fraction', 0.1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
-             ('learning_rate', 0.07782651702448214),
              ('learning_starts', 100000),
              ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),

       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 494.50 +/- 181.50
       name: mean_reward
       verified: false
 ---
 ## Hyperparameters
 ```python
+OrderedDict([('batch_size', 32),
              ('buffer_size', 10000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_fraction', 0.1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
+             ('learning_rate', 0.0001),
              ('learning_starts', 100000),
              ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),

args.yml CHANGED Viewed

@@ -2,7 +2,7 @@
 - - - algo
     - dqn
   - - conf_file
-    - best_dqn.yml
   - - device
     - auto
   - - env
@@ -56,7 +56,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 3641132205
   - - storage
     - null
   - - study_name

 - - - algo
     - dqn
   - - conf_file
+    - dqn.yml
   - - device
     - auto
   - - env
   - - save_replay_buffer
     - false
   - - seed
+    - 1866637971
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -1,6 +1,6 @@
 !!python/object/apply:collections.OrderedDict
 - - - batch_size
-    - 16
   - - buffer_size
     - 10000
   - - env_wrapper
@@ -14,7 +14,7 @@
   - - gradient_steps
     - 1
   - - learning_rate
-    - 0.07782651702448214
   - - learning_starts
     - 100000
   - - n_timesteps

 !!python/object/apply:collections.OrderedDict
 - - - batch_size
+    - 32
   - - buffer_size
     - 10000
   - - env_wrapper
   - - gradient_steps
     - 1
   - - learning_rate
+    - 0.0001
   - - learning_starts
     - 100000
   - - n_timesteps

dqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:05f89ad4df8366a191d2e8cb82ca8c9796d7c32ab11c9cb13f60c8f447288cd7
 size 27220728

 version https://git-lfs.github.com/spec/v1
+oid sha256:1c377129ece06f8c368061c9f8faa9e92e15fc2f847c8c679ee3f11af68ba574
 size 27220728

dqn-SpaceInvadersNoFrameskip-v4/_stable_baselines3_version CHANGED Viewed

	@@ -1 +1 @@
1	- 2.4.~~0a6~~


1	+ 2.4.0a7

dqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2c547718e27c23725c4eded2c1d45246dcdc134c248687ccef616c2a10fea79c
 size 13506172

 version https://git-lfs.github.com/spec/v1
+oid sha256:449eefa05daf35f09473da4d7be8183626fb62b8720d50ec420803f0d15ed07e
 size 13506172

dqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0eff5af7af57b09e0c58bd349f8706af9465381de5eaa35e74e7b658e3382a06
 size 13505370

 version https://git-lfs.github.com/spec/v1
+oid sha256:0d1bb1bbeea7ae31006d6e34789a70d240e3379701f71b52d658eec1888598c7
 size 13505370

dqn-SpaceInvadersNoFrameskip-v4/system_info.txt CHANGED Viewed

@@ -1,6 +1,6 @@
 - OS: Linux-6.1.85+-x86_64-with-glibc2.35 # 1 SMP PREEMPT_DYNAMIC Thu Jun 27 21:05:47 UTC 2024
 - Python: 3.10.12
-- Stable-Baselines3: 2.4.0a6
 - PyTorch: 2.3.1+cu121
 - GPU Enabled: True
 - Numpy: 1.25.2

 - OS: Linux-6.1.85+-x86_64-with-glibc2.35 # 1 SMP PREEMPT_DYNAMIC Thu Jun 27 21:05:47 UTC 2024
 - Python: 3.10.12
+- Stable-Baselines3: 2.4.0a7
 - PyTorch: 2.3.1+cu121
 - GPU Enabled: True
 - Numpy: 1.25.2

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6332f13a1224ba686797bd770b10af974d632c130bd192c46a69bdf79b1811c4
-size 294871

 version https://git-lfs.github.com/spec/v1
+oid sha256:4dce7a56d47515ec9f7f74b0942737184333ece914161bea32fcc021d579186f
+size 261459

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": 29.0, "std_reward": 64.~~29618962271404~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2024-07-~~25T12~~:56:27.~~903756~~"}


1	+ {"mean_reward": 494.5, "std_reward": 181.5, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2024-07-28T17:17:24.572210"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:12e82bb984355dca84ae738eb9e097feacbc33bdb04b50d0c36052fe25fd5d74
-size 41833

 version https://git-lfs.github.com/spec/v1
+oid sha256:b79cd96db5118183679479b99d33224e08c4c283eb5cd6ad902d970fcb690862
+size 43140