Spaces:

gabehubner
/

deep-rl-explainability

Sleeping

App Files Files Community

gabehubner commited on Nov 30, 2023

Commit

ec3a146

1 Parent(s): 569299e

add gitignore and training loop class

Browse files

Files changed (11) hide show

.DS_Store +0 -0
.gitignore +1 -0
__pycache__/ddpg.cpython-311.pyc +0 -0
__pycache__/train.cpython-311.pyc +0 -0
ddpg.py +9 -6
main.py +2 -1
tmp/ddpg/actor_ddpg +0 -0
tmp/ddpg/critic_ddpg +0 -0
tmp/ddpg/target_actor_ddpg +0 -0
tmp/ddpg/target_critic_ddpg +0 -0
train.py +57 -54

.DS_Store DELETED Viewed

Binary file (8.2 kB)

.gitignore ADDED Viewed

	@@ -0,0 +1 @@


1	+ .DS_Store

__pycache__/ddpg.cpython-311.pyc CHANGED Viewed

Binary files a/__pycache__/ddpg.cpython-311.pyc and b/__pycache__/ddpg.cpython-311.pyc differ

__pycache__/train.cpython-311.pyc ADDED Viewed

Binary file (7.28 kB). View file

ddpg.py CHANGED Viewed

@@ -176,20 +176,23 @@ class Agent(object):
         self.target_critic = CriticNetwork(beta, input_dims, layer1_size, layer2_size, n_actions=n_actions, name="target_critic")
         self.noise = OUActionNoise(mu=np.zeros(n_actions))
         self.update_network_parameters(tau=1)
-    def choose_action(self, observation, attribution : IntegratedGradients = None, baseline : np.ndarray=None):
         self.actor.eval()
         observation = T.tensor(observation, dtype=T.float).to(self.actor.device)
         print(f"Observation: {observation.shape=}")
         mu = self.actor(observation).to(self.actor.device)
-        if attribution is not None:
-            if baseline is None:
-                baseline = T.zeros(observation.shape)
-            attributions = attribution.attribute((observation), baselines=baseline, target=0)
-            print('Attributions:', attributions)
         mu_prime = mu + T.tensor(self.noise(), dtype=T.float).to(self.actor.device)

         self.target_critic = CriticNetwork(beta, input_dims, layer1_size, layer2_size, n_actions=n_actions, name="target_critic")
         self.noise = OUActionNoise(mu=np.zeros(n_actions))
+        self.attributions = None
+        self.ig = None
         self.update_network_parameters(tau=1)
+    def choose_action(self, observation, baseline : T.Tensor=None):
         self.actor.eval()
         observation = T.tensor(observation, dtype=T.float).to(self.actor.device)
         print(f"Observation: {observation.shape=}")
         mu = self.actor(observation).to(self.actor.device)
+        # if attribution is not None:
+        #     if baseline is None:
+        #         baseline = T.zeros(observation.shape)
+        #     attributions = attribution.attribute((observation), baselines=baseline, target=0)
+        #     print('Attributions:', attributions)
         mu_prime = mu + T.tensor(self.noise(), dtype=T.float).to(self.actor.device)

main.py CHANGED Viewed

@@ -7,7 +7,8 @@ import argparse
 from train import TrainingLoop
 from captum.attr import (IntegratedGradients, LayerConductance, NeuronAttribution)
-training_loop = TrainingLoop()
 parser = argparse.ArgumentParser(description="Choose a function to run.")
 parser.add_argument("function", choices=["train", "load-trained", "attribute"], help="The function to run.")

 from train import TrainingLoop
 from captum.attr import (IntegratedGradients, LayerConductance, NeuronAttribution)
+training_loop = TrainingLoop(env_spec="LunarLander-v2", continuous=True, gravity=-10, render_mode=None)
+training_loop.create_agent()
 parser = argparse.ArgumentParser(description="Choose a function to run.")
 parser.add_argument("function", choices=["train", "load-trained", "attribute"], help="The function to run.")

tmp/ddpg/actor_ddpg CHANGED Viewed

Binary files a/tmp/ddpg/actor_ddpg and b/tmp/ddpg/actor_ddpg differ

tmp/ddpg/critic_ddpg CHANGED Viewed

Binary files a/tmp/ddpg/critic_ddpg and b/tmp/ddpg/critic_ddpg differ

tmp/ddpg/target_actor_ddpg CHANGED Viewed

Binary files a/tmp/ddpg/target_actor_ddpg and b/tmp/ddpg/target_actor_ddpg differ

tmp/ddpg/target_critic_ddpg CHANGED Viewed

Binary files a/tmp/ddpg/target_critic_ddpg and b/tmp/ddpg/target_critic_ddpg differ

train.py CHANGED Viewed

@@ -3,69 +3,75 @@ import gymnasium as gym
 import numpy as np
 import matplotlib.pyplot as plt
 import torch
-import argparse
 from captum.attr import (IntegratedGradients)
 class TrainingLoop:
-    def __init__(self):
-        pass
-    def train(self):
-        env = gym.make(
-            "LunarLander-v2",
-            continuous = True,
-            gravity = -10.0,
-            render_mode = None
         )
-        agent = Agent(alpha=0.000025, beta=0.00025, input_dims=[8], tau=0.001, env=env, batch_size=64, layer1_size=400, layer2_size=300, n_actions=4)
-        agent.load_models()
-        np.random.seed(0)
         score_history = []
         for i in range(1000):
             done = False
             score = 0
-            obs, _ = env.reset()
             while not done:
-                act = agent.choose_action(obs)
-                new_state, reward, terminated, truncated, info = env.step(act)
                 done = terminated or truncated
-                agent.remember(obs, act, reward, new_state, int(done))
-                agent.learn()
                 score += reward
                 obs = new_state
             score_history.append(score)
             print("episode", i, "score %.2f" % score, "100 game average %.2f" % np.mean(score_history[-100:]))
             if i % 25 == 0:
-                agent.save_models()
     def load_trained(self):
-        env = gym.make(
-            "LunarLanderContinuous-v2",
-            render_mode = "human"
-        )
-        agent = Agent(alpha=0.000025, beta=0.00025, input_dims=[8], tau=0.001, env=env, batch_size=64, layer1_size=400, layer2_size=300, n_actions=4)
-        agent.load_models()
-        np.random.seed(0)
         score_history = []
         for i in range(50):
             done = False
             score = 0
-            obs, _ = env.reset()
             while not done:
-                act = agent.choose_action(obs)
-                new_state, reward, terminated, truncated, info = env.step(act)
                 done = terminated or truncated
                 score += reward
                 obs = new_state
@@ -73,42 +79,42 @@ class TrainingLoop:
             score_history.append(score)
             print("episode", i, "score %.2f" % score, "100 game average %.2f" % np.mean(score_history[-100:]))
     # Model Explainability
     from captum.attr import (IntegratedGradients)
     def _collect_running_baseline_average(self, num_iterations: int) -> torch.Tensor:
-        env = gym.make(
-            "LunarLanderContinuous-v2",
-            render_mode = None
-        )
-        agent = Agent(alpha=0.000025, beta=0.00025, input_dims=[8], tau=0.001, env=env, batch_size=64, layer1_size=400, layer2_size=300, n_actions=4)
-        agent.load_models()
-        torch.manual_seed(0)
         sum_obs = torch.zeros(8)
         for i in range(num_iterations):
             done = False
             score = 0
-            obs, _ = env.reset()
             sum_obs += obs
             print(f"Baseline on interation #{i}: {obs}")
             while not done:
-                act = agent.choose_action(obs, attribution=None, baseline=None)
-                new_state, reward, terminated, truncated, info = env.step(act)
                 done = terminated or truncated
                 score += reward
                 obs = new_state
         return sum_obs / num_iterations
     def explain_trained(self, option: str, num_iterations :int = 10) -> None:
         baseline_options = {
             "1": torch.zeros(8),
             "2": self._collect_running_baseline_average(num_iterations),
@@ -116,27 +122,20 @@ class TrainingLoop:
         baseline = baseline_options[option]
-        env = gym.make(
-            "LunarLanderContinuous-v2",
-            render_mode = "human"
-        )
-        agent = Agent(alpha=0.000025, beta=0.00025, input_dims=[8], tau=0.001, env=env, batch_size=64, layer1_size=400, layer2_size=300, n_actions=4)
-        agent.load_models()
-        ig = IntegratedGradients(agent.actor)
-        np.random.seed(0)
         score_history = []
         for i in range(50):
             done = False
             score = 0
-            obs, _ = env.reset()
             while not done:
-                act = agent.choose_action(obs, attribution=ig, baseline=baseline)
-                new_state, reward, terminated, truncated, info = env.step(act)
                 done = terminated or truncated
                 score += reward
                 obs = new_state
@@ -144,3 +143,7 @@ class TrainingLoop:
             score_history.append(score)
             print("episode", i, "score %.2f" % score, "100 game average %.2f" % np.mean(score_history[-100:]))

 import numpy as np
 import matplotlib.pyplot as plt
 import torch
 from captum.attr import (IntegratedGradients)
 class TrainingLoop:
+    def __init__(self, env_spec, output_path='./output/', seed=0, **kwargs):
+        assert env_spec in gym.envs.registry.keys()
+        defaults = {
+            "continuous": True,
+            "gravity": -10.0,
+            "render_mode": None
+        }
+        self.env = gym.make(
+            env_spec,
+            **defaults
         )
+        torch.manual_seed(seed)
+        self.agent = None
+        self.output_path = output_path
+    # TODO: spec-to-hyperparameters look-up
+    def create_agent(self, alpha=0.000025, beta=0.00025, input_dims=[8], tau=0.001, batch_size=64, layer1_size=400, layer2_size=300, n_actions=4):
+        self.agent = Agent(alpha=alpha, beta=beta, input_dims=input_dims, tau=tau, env=self.env, batch_size=batch_size, layer1_size=layer1_size, layer2_size=layer2_size, n_actions=n_actions)
+    def train(self):
+        assert self.agent is not None
+        self.agent.load_models()
         score_history = []
         for i in range(1000):
             done = False
             score = 0
+            obs, _ = self.env.reset()
             while not done:
+                act = self.agent.choose_action(obs)
+                new_state, reward, terminated, truncated, info = self.env.step(act)
                 done = terminated or truncated
+                self.agent.remember(obs, act, reward, new_state, int(done))
+                self.agent.learn()
                 score += reward
                 obs = new_state
             score_history.append(score)
             print("episode", i, "score %.2f" % score, "100 game average %.2f" % np.mean(score_history[-100:]))
             if i % 25 == 0:
+                self.agent.save_models()
+        self.env.close()
     def load_trained(self):
+        assert self.agent is not None
+        self.agent.load_models()
         score_history = []
         for i in range(50):
             done = False
             score = 0
+            obs, _ = self.env.reset()
             while not done:
+                act = self.agent.choose_action(obs)
+                new_state, reward, terminated, truncated, info = self.env.step(act)
                 done = terminated or truncated
                 score += reward
                 obs = new_state
             score_history.append(score)
             print("episode", i, "score %.2f" % score, "100 game average %.2f" % np.mean(score_history[-100:]))
+        self.env.close()
     # Model Explainability
     from captum.attr import (IntegratedGradients)
     def _collect_running_baseline_average(self, num_iterations: int) -> torch.Tensor:
+        assert self.agent is not None
+        self.agent.load_models()
         sum_obs = torch.zeros(8)
         for i in range(num_iterations):
             done = False
             score = 0
+            obs, _ = self.env.reset()
             sum_obs += obs
             print(f"Baseline on interation #{i}: {obs}")
             while not done:
+                act = self.agent.choose_action(obs, attribution=None, baseline=None)
+                new_state, reward, terminated, truncated, info = self.env.step(act)
                 done = terminated or truncated
                 score += reward
                 obs = new_state
+        self.env.close()
         return sum_obs / num_iterations
     def explain_trained(self, option: str, num_iterations :int = 10) -> None:
+        assert self.agent is not None
         baseline_options = {
             "1": torch.zeros(8),
             "2": self._collect_running_baseline_average(num_iterations),
         baseline = baseline_options[option]
+        self.agent.load_models()
+        ig = IntegratedGradients(self.agent.actor)
+        self.agent.ig = ig
         score_history = []
         for i in range(50):
             done = False
             score = 0
+            obs, _ = self.env.reset()
             while not done:
+                act = self.agent.choose_action(obs, baseline=baseline)
+                new_state, reward, terminated, truncated, info = self.env.step(act)
                 done = terminated or truncated
                 score += reward
                 obs = new_state
             score_history.append(score)
             print("episode", i, "score %.2f" % score, "100 game average %.2f" % np.mean(score_history[-100:]))
+        self.env.close()
+        return self.agent.attributions