Spaces:

baiyanlali-zhao
/

NCERL-Diverse-PCG

Sleeping

App Files Files Community

baiyanlali-zhao commited on Jul 19

Commit

3582c8a

•

1 Parent(s): 8be1cb6

添加注释

Browse files

Files changed (28) hide show

README.md +58 -16
analysis/tests.py +0 -3
app.py +1 -7
generate_and_play.py +8 -5
media/banner.png +0 -0
models/example_policy/samples.lvls +122 -122
models/example_policy/samples.png +0 -0
plots.py +0 -733
pyproject.toml +0 -21
requirements.txt +0 -0
src/drl/egsac/train_egsac.py +2 -2
src/drl/sunrise/train_sunrise.py +3 -8
src/drl/train_async.py +15 -0
src/drl/train_sinproc.py +13 -0
src/env/environments.py +2 -5
src/env/rfunc.py +6 -5
src/gan/adversarial_train.py +0 -21
src/gan/gankits.py +2 -2
src/gan/gans.py +1 -1
src/olgen/olg_policy.py +7 -44
src/smb/asyncsimlt.py +4 -9
src/smb/proxy.py +0 -8
src/utils/img.py +0 -1
test_ddpm.py +1 -81
test_gen_log.py +0 -15
test_gen_samples.py +0 -24
tests.py +0 -140
train.py +2 -0

README.md CHANGED Viewed

@@ -8,26 +8,39 @@ python_version: 3.9
 app_file: app.py
 pinned: false
 ---
-# Negatively Correlated Ensemble RL
-### Verified environment
-* Python 3.9.6
-* JPype 1.3.0
-* dtw 1.4.0
-* scipy 1.7.2
-* torch 1.8.2+cu111
-* numpy 1.20.3
-* gym 0.21.0
-* scipy 1.7.2
-* Pillow 10.0.0
-* matplotlib 3.6.3
-* pandas 1.3.2
-* sklearn 1.0.1
-### How to use
 All training are launched by running `train.py` with option and arguments. For example, execute `python train.py ncesac --lbd 0.3 --m 5` will train NCERL with hyperparameters set as $\lambda = 0.3, m=5$.
  Plot script is `plots.py`
@@ -36,9 +49,38 @@ All training are launched by running `train.py` with option and arguments. For e
 * `python train.py sac`: to train a standard SAC as the policy for online game level generation
 * `python train.py asyncsac`: to train a SAC with an asynchronous evaluation environment as the policy for online game level generation
 * `python train.py ncesac`: to train an NCERL based on SAC as the policy for online game level generation
-* `python train.py egsac`: to train an episodic generative SAC (see paper [*The fun facets of Mario: Multifaceted experience-driven PCG via reinforcement learning*](https://dl.acm.org/doi/abs/10.1145/3555858.3563282?casa_token=AHQWYSj_GyoAAAAA:MhwOltqfijP1NQj-c6NaTQikCnlNwyaMky07gCvTK5ZlSq063ew40awAcqEcw6S5zG9Sq9ZyDsspuaM)) as the policy for online game level generation
 * `python train.py pmoe`: to train an episodic generative SAC (see paper [*Probabilistic Mixture-of-Experts for Efficient Deep Reinforcement Learning*](https://arxiv.org/abs/2104.09122)) as the policy for online game level generation
 * `python train.py sunrise`: to train a SUNRISE (see paper [*SUNRISE: A Simple Unified Framework for Ensemble Learning in Deep Reinforcement Learning*](https://proceedings.mlr.press/v139/lee21g.html)) as the policy for online game level generation
 * `python train.py dvd`: to train a DvD-SAC (see paper [*Effective Diversity in Population Based Reinforcement Learning*](https://proceedings.neurips.cc/paper_files/paper/2020/hash/d1dc3a8270a6f9394f88847d7f0050cf-Abstract.html)) as the policy for online game level generation
 For the training arguments, please refer to the help `python train.py [option] --help`

 app_file: app.py
 pinned: false
 ---
+![alt text](./media/banner.png)
+# Negatively Correlated Ensemble RL
+## 环境安装
+创建conda环境
+```bash
+conda create -n ncerl python=3.9
+```
+安装环境依赖
+```bash
+pip install -r requirements.txt
+```
+注：该程序不需要您使用任何显卡，但是需要安装pytorch。如果您的显卡支持cuda，那么请安装cuda版本，否则安装cpu版本。使用cuda版本可以提高推理速度。
+切换conda环境
+```
+conda activate ncerl
+```
+## 快速开始
+如果您想查看效果，可以通过
+```
+python app.py
+```
+后打开命令行显示连接互动查看。
+也可以通过运行
+```
+python generate_and_play.py
+```
+后查看`models/example_policy/samples.png`查看生成效果。
+## 开始训练
 All training are launched by running `train.py` with option and arguments. For example, execute `python train.py ncesac --lbd 0.3 --m 5` will train NCERL with hyperparameters set as $\lambda = 0.3, m=5$.
  Plot script is `plots.py`
 * `python train.py sac`: to train a standard SAC as the policy for online game level generation
 * `python train.py asyncsac`: to train a SAC with an asynchronous evaluation environment as the policy for online game level generation
 * `python train.py ncesac`: to train an NCERL based on SAC as the policy for online game level generation
+* `python train.py egsac`: to train an episodic generative SAC (see paper [*The fun facets of Mario: Multifaceted experience-driven PCG via reinforcement learning*](https://dl.acm.org/doi/abs/10.1145/3555858.3563282)) as the policy for online game level generation
 * `python train.py pmoe`: to train an episodic generative SAC (see paper [*Probabilistic Mixture-of-Experts for Efficient Deep Reinforcement Learning*](https://arxiv.org/abs/2104.09122)) as the policy for online game level generation
 * `python train.py sunrise`: to train a SUNRISE (see paper [*SUNRISE: A Simple Unified Framework for Ensemble Learning in Deep Reinforcement Learning*](https://proceedings.mlr.press/v139/lee21g.html)) as the policy for online game level generation
 * `python train.py dvd`: to train a DvD-SAC (see paper [*Effective Diversity in Population Based Reinforcement Learning*](https://proceedings.neurips.cc/paper_files/paper/2020/hash/d1dc3a8270a6f9394f88847d7f0050cf-Abstract.html)) as the policy for online game level generation
 For the training arguments, please refer to the help `python train.py [option] --help`
+## 目录结构
+```
+NCERL-DIVERSE-PCG/
+* analysis/
+  * generate.py 未使用
+  * tests.py 做evaluation使用
+* media/ markdown素材文件
+* models/
+  * example_policy/ 做生成展示使用
+* smb/ 马里奥仿真以及图片资源数据
+* src/
+  * ddpm/ ddpm模型相关目录
+  * drl/ drl模型、训练目录
+  * env/ 马里奥gym环境和reward function
+  * gan/ gan模型、训练目录
+  * olgen/ 在线生成环境与policy目录
+  * rlkit/ 强化学习使用部件目录
+  * smb/ 马里奥与仿真器交互组件以及多进程异步池组件
+  * utils/ 一些功能性文件
+* training_data/ 训练数据
+* README.md 当前文件
+* app.py 用于gradio展示用途文件
+* generate_and_play.py 用于非gradio展示文件
+* train.py 训练文件
+* test_ddpm.py 测试训练ddpm文件
+* requirements.txt 环境依赖文件
+```

analysis/tests.py CHANGED Viewed

@@ -36,7 +36,6 @@ def evaluate_rewards(lvls, rfunc='default', dest_path='', parallel=1, eval_pool=
 def evaluate_mnd(lvls, refs, parallel=2):
     eval_pool = AsycSimltPool(parallel, verbose=False, refs=[str(ref) for ref in refs])
-    # m, _ = len(lvls), len(refs)
     res = []
     for lvl in lvls:
         eval_pool.put('mnd_item', str(lvl))
@@ -49,7 +48,6 @@ def evaluate_mnd(lvls, refs, parallel=2):
 def evaluate_mpd(lvls, parallel=2):
     task_datas = [[] for _ in range(parallel)]
     for i, (A, B) in enumerate(combinations(lvls, 2)):
-        # lvlA, lvlB = lvls[i * 2], lvls[i * 2 + 1]
         task_datas[i % parallel].append((str(A), str(B)))
     hms, dtws = [], []
@@ -73,7 +71,6 @@ def evaluate_gen_log(path, parallel=5):
         step = name[4:]
         rewards = [sum(item) for item in evaluate_rewards(lvls, rfunc_name, parallel=parallel)]
         r_avg, r_std = np.mean(rewards), np.std(rewards)
-        # mpd_hm, mpd_dtw = evaluate_mpd(lvls, parallel=parallel)
         mpd = evaluate_mpd(lvls, parallel=parallel)
         line = [step, r_avg, r_std, mpd, '']
         wrtr.writerow(line)

 def evaluate_mnd(lvls, refs, parallel=2):
     eval_pool = AsycSimltPool(parallel, verbose=False, refs=[str(ref) for ref in refs])
     res = []
     for lvl in lvls:
         eval_pool.put('mnd_item', str(lvl))
 def evaluate_mpd(lvls, parallel=2):
     task_datas = [[] for _ in range(parallel)]
     for i, (A, B) in enumerate(combinations(lvls, 2)):
         task_datas[i % parallel].append((str(A), str(B)))
     hms, dtws = [], []
         step = name[4:]
         rewards = [sum(item) for item in evaluate_rewards(lvls, rfunc_name, parallel=parallel)]
         r_avg, r_std = np.mean(rewards), np.std(rewards)
         mpd = evaluate_mpd(lvls, parallel=parallel)
         line = [step, r_avg, r_std, mpd, '']
         wrtr.writerow(line)

app.py CHANGED Viewed

@@ -9,7 +9,6 @@ sys.path.append(path.dirname(path.abspath(__file__)))
 from src.olgen.ol_generator import VecOnlineGenerator
-# from src.olgen.olg_game import MarioOnlineGenGame
 from src.olgen.olg_policy import RLGenPolicy
 from src.smb.level import save_batch
 from src.utils.filesys import getpath
@@ -21,7 +20,7 @@ device = 'cuda:0' if torch.cuda.is_available() else 'cpu'
 def generate_and_play():
     path = 'models/example_policy'
-    # Generate with example policy model
     N, L = 8, 10
     plc = RLGenPolicy.from_path(path, device)
     generator = VecOnlineGenerator(plc, g_device=device)
@@ -29,14 +28,9 @@ def generate_and_play():
     os.makedirs(fd, exist_ok=True)
     lvls = generator.generate(N, L)
-    # save_batch(lvls, f'{path}/samples.lvls')
     imgs = [lvl.to_img() for lvl in lvls]
     return imgs
-    # make_img_sheet(imgs, 1, save_path=f'{path}/samples.png')
-    # # Play with the example policy model
-    # game = MarioOnlineGenGame(path)
-    # game.play()
 with gr.Blocks(title="NCERL Demo") as demo:

 from src.olgen.ol_generator import VecOnlineGenerator
 from src.olgen.olg_policy import RLGenPolicy
 from src.smb.level import save_batch
 from src.utils.filesys import getpath
 def generate_and_play():
     path = 'models/example_policy'
+    # 使用example policy做生成
     N, L = 8, 10
     plc = RLGenPolicy.from_path(path, device)
     generator = VecOnlineGenerator(plc, g_device=device)
     os.makedirs(fd, exist_ok=True)
     lvls = generator.generate(N, L)
     imgs = [lvl.to_img() for lvl in lvls]
     return imgs
 with gr.Blocks(title="NCERL Demo") as demo:

generate_and_play.py CHANGED Viewed

@@ -1,5 +1,5 @@
 import os
 from src.olgen.ol_generator import VecOnlineGenerator
 from src.olgen.olg_game import MarioOnlineGenGame
 from src.olgen.olg_policy import RLGenPolicy
@@ -7,12 +7,14 @@ from src.smb.level import save_batch
 from src.utils.filesys import getpath
 from src.utils.img import make_img_sheet
 if __name__ == '__main__':
     path = 'models/example_policy'
     # Generate with example policy model
     N, L = 8, 10
-    plc = RLGenPolicy.from_path(path)
-    generator = VecOnlineGenerator(plc)
     fd, _ = os.path.split(getpath(path))
     os.makedirs(fd, exist_ok=True)
@@ -22,6 +24,7 @@ if __name__ == '__main__':
     make_img_sheet(imgs, 1, save_path=f'{path}/samples.png')
     # # Play with the example policy model
-    # game = MarioOnlineGenGame(path)
-    # game.play()
     pass

 import os
+import torch
 from src.olgen.ol_generator import VecOnlineGenerator
 from src.olgen.olg_game import MarioOnlineGenGame
 from src.olgen.olg_policy import RLGenPolicy
 from src.utils.filesys import getpath
 from src.utils.img import make_img_sheet
+device = 'cuda:0' if torch.cuda.is_available() else 'cpu'
 if __name__ == '__main__':
     path = 'models/example_policy'
     # Generate with example policy model
     N, L = 8, 10
+    plc = RLGenPolicy.from_path(path, device=device)
+    generator = VecOnlineGenerator(plc, g_device=device)
     fd, _ = os.path.split(getpath(path))
     os.makedirs(fd, exist_ok=True)
     make_img_sheet(imgs, 1, save_path=f'{path}/samples.png')
     # # Play with the example policy model
+    # 请保证您的电脑上已经安装了jvm, 并且在命令行中输入java可以看到Java的信息
+    game = MarioOnlineGenGame(path)
+    game.play()
     pass

media/banner.png ADDED Viewed

models/example_policy/samples.lvls CHANGED Viewed

@@ -1,135 +1,135 @@
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------#----------------------------------------------------------------------------------------------------------------------------------------------
-------------------------------oo-------------------------------o---------------------------------------------------------------o------------------------------------------------
--------------------------------------------------------------------------------------------------o------------------------------------------------------------------------------
---------------------------------------SSSSSSSSSS---------------------Q--------------------------------------------------------------QQQ-----------------------------QQQQ--------
---------------So----------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------o----------------------o---------------------------------------K----------------------------------------------------------------o-
------------#---------------------o---------------------------------------------------------------------------2------------------------------------------------------------------
----------####--------------------------------oS------------------#---SoS-----US------------------------------U-------------------#--SSSS-----US--------tt--------##-###S-----US-
----------####----------tt-----T------------------------TT----#--TT-----------------------TT------------B---------------TT----#T-TT---------------------tt--------##-------------
---------########-------Tt-----T------------------------TT----TT-TT-----K----------------TTT------------B---------------TT----TT-TT---------------------tt----TT--##-------------
--------#########--gggg-Tt---kkT------k-----kk-----gggg-TT---kTT-T#-k-k-g--k-----k-ty----TTT--ggg---k-gog----kkk---gggg-TT---kTT-T--k-k-g--k-k-----g----tt---kkg--##k-k-g--k-k---
-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
 ;
-------------------------------------------------------------------------------------------------------------------------------------------S----------------------------S--S-----
-----------------------------------------------------------------------S-------------------------------------------------------------------------------------------S-SSSSSS------
------------------------------------------------------------------------------------------------------------------------------------------%%-------------------------------------
-----------------------------------S------------------------------------------------------------------------------------------------------||-------------------------------------
-----------------------------------------------------------------------------Koo---------------------------------------o------------------||----------------------------o-o-----o
------------------------------------------------------------------------------------------------------------------------------------------||-------------------------------------
-----------------S--Q--SSoSS--SSS--o-----------------QQoo--------------SSS----SSS%---SS-----------------------U-------SSSS-------------SSSSSSSS-------------------------SS-------
-S-------------------------------------------------------------------------------|--------------------------------o--------------------------------------------------------------
-SSS-So---------------------------------------S-S--------------------------------|-------------o--------------------------------------------------------------K------------------
-----------------------------------------------S--------o------------------------|--------------------------------S-------------------------------------------2------------oo----
-----------------Q---QS@Q----S@SSS-------------S--------2-----U-----------------S|------------US--------------U-------------------------------SS--------------U-------------%----
-----------T--------------------------------------------tt---------------#-------|------B---------------TT----#-----------------------------------------B-------------------|----
----------TT--------------------------------K-----------tt--------------##--#-#--|------B---------------TT---TTT---------#-------------t----------------B-------------------|----
----------TT----#---k------k----------------b---g--gggg-tt---k--------####----#--|-gggggb--k-k-k---g----TT---kT#-------###-------------t------k-g---k-gog----kkk------------|----
----XXX-XXXXXXXXXXXXXXXXXXXXXXXXX------XXXXXXoXXXXXXXXXXXXXXXXXXXXoXXXXXXXX--oXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX%XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX--%%%%-----|---@
----XXX-X-XXXXXXXXXXXXXXXXXXXXXXX------XXXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX@--XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX---||------|----
 ;
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-------------------------------oo-----------------------------------------------o------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------%S---So--------------QQ--------------------------------------------------------------Q-QQ--------S--QQSSQSSSSSSS-----QQQ----------------------------------------
-----------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------|--------------------------------------------K--------------------------------##-------------oo------------------------------oo---------------------------------
-----------------|--------------------------------------------U-------------------o-----o-----###------g-------------------------------------------------------------------------
-----------------|----------------#---SoS-----US--------------U-------------------------tt----###--#-####Q---S@S-#------------US--------------U-------------------------------o--
-----------------|------TT-----K-TT---------------------B------K--------TT----#T--------tt---###------------------------------##--------K---------------TT----TT--------t--------
-----------------|------TT-----U-TT-----K---------------B---------------TT----TT--------tt--####-----------------------------###------------------------TT----TT--------t--------
---kk-----------g|-gggg-Tt---k-U-T#-k-k----k--------k---t----k-----gggg-TT---kTT-Tg-----tt--####----k------k-k-----ggggg----####----k-kkyk---kkk--ggg-g-TT---TTT------k-tt----#--
-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX--XXXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
 ;
 --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
 --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
 --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-------------------------------oo-----------------------------------------------------------------------------------------------o------------------------------------------------
----------------------------------o-----------------------------------------------------------------------------------------------------------------o----------------------------
-----------------%----So--------------Q---------------QQQQ------------Qo--------------QQQQS-----#--------------------------------SooS--SS-----S-----SQQQ---------------o---------
-----------------|------------------------------------------------------------------------------#--------------------------------------------------------------------------------
-----------------|----------------------------------------------------------------------------###-------------K------------------------------------------------o-----------------
-----------------|----------------------------------------------------------------------------###-------------2---------------------------------o--------------------------------
--------------oo-|----------------#--USoS-----US--#------------------------------Q-Q----QQ----###----------------------------------UQS------------------------US--------------o--
-----------------|------TT-----K-TT---------------##----t---------------t---------------------###-------B---------------TT----#T----------------------------------------tt-------
----------------@|------TT-----U-TT-----K---------#---------------------t--------------------####-------B---------------TT----TT----------------------------------------tt-------
----gg----------g|-gggg-Tt---k-U-T--k-k----k------#-k--kk-----k-----k-gog----kkk---or--------####---k-gog----k-k---gggg-TT---kTT--------------------kgggg--k-k-----ggggott---kkk-
-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX%%%%%-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX--XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-|XX--XXXXXXXXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
-;
 --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
 --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
 --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------SSSS------------------------------------------------------------------------
------------------------------------------------o--------------------------------------------------------------------------------------------------------------------------------
 --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------QS--------------------------------Q-Q------------------------------------U--SSSSSSSSo----SSS---S@S@QQ-------%---SS------------------------------QQQQ--------
---------------------------------------------------------------------------------------------------------------------------------|-----------------------------------------------
------------------------------------------------------------------------------K---------------------------------------o----------|----o--------o-------------------------------o-
------------#-----------------------------------------------------------------2------------------g-------------------------------|------------------------------------g----------
----------TT#-------------------------------------T#--S#S-----US--------------U---------------U--S--SS---------S-----USSS-----US-|----S-2-----US------------------######S-----US-
----------TT----------------------------TT----TT-TT---------------------B---------------TT----#---------K------------------------|------K--K------------tt----#---##-------------
---------TTT----T-----------------------TT----TT------------------------B---------------TT----TT---------------------------------|------B---------------Tt----TT--##-------------
-T-------TTT----T-----gg-------kg--gggg-TT---kTT-----------k--------k-gog----k-k---g----TT---kT#-------k-----k------kgggg----k---|--k-gog--k-k-----ggg--Tt----kT--##k---g--k-k---
-XXXXXXXXXXXXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
-X-XXXXXXXXXXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
 ;
---------------------------------------------------------------------------------------------------------------------------S-----------------------------------------------------
------------------------------------------------------------------------------------------------------------------S-SSSSS-SS-----------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------------------SSSSSS--------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------oo----------------
-------SSS---SS--------------------------------------SQo------------------------------Q--------------------------@SSSSSSSQSSSSSSS----SQo-----------------------SS----QQQQQSS--S@S
-------------------------------------------------------------------------------------------------------------------------------------------------S--------------#----------------
--------------------------------------------------------------K-----------------------o-------------------------------------------------------U--S--------------#----------------
--------------------------------------------------------------------------------------------------------o---------------g---------------------------------------#----------------
----------S---@S------------------#--USSS-----US-----US-2-----U---------tt-----------USSS-----US--------tt--------SQ-SSSQQ----US--------2-----U----------------##Q-Q--QQQQS---o--
------------------------tt----TT-TT---------------------K---------------tt-------T----------------------tt----T-------------------------K--K------------------###----------------
------------------------Tt----TT-TT---------------------B---------------tt------------------------------tt----T-------------------------B-------------------#####----------------
-----ggk-----k-----gggg-Tt---kkTTT--k-k----k--------k-gog--k-k-----g----tt---kkg----k---g--k-----------ttt---kkk----k---------------k-gog--k-k--------------#####----------------
-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXXXXXXXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXXXXXXXX-XXXXXXXXXXXXXXXXXXXXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
 ;
--------------------------------------------------------k------------------------------------------------------------------------------------------------------------------------
--------------------------------------S------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
--------SSSSSSSSS----------------------------------------------------------------------------------------------------------------------------------------------------------------
-------------------------------oo---------------------------------------------------------------o-----------o-o----o----------o--------------------------------------------------
----------------------------------------------o-------------------------------------------------------------------------------------------------o--------------------------------
-----------------%S---So----------------Q--------------SSSSSSSSSS-------------------------------------SQSoSSS-SS----S--SSSS----o-----QQ---------S--------------------------------
-----------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------|------------------------------------------------------------U-------------------------------------------------------------------------------K------------------
-----------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------
-----SS----------|----------------T--S##SS----US------------SSS---------------U------------------------QQQ----USS--Qo-----#------QSQ---SSSSSSS%S--------------U---------------o--
-----------------|------TT-----K-TT-----------------------------------------------------TT----TT-------------------------##-------------------|---------B---------------Tt----#--
-----------------|------TT-----U-TT-------------------------------------B---------------TT----TT------------------------###---#---------------|---------B---------------TT----TT-
-----------------|-gggg-Tt---k-U-TT---k----b------------------------k---b----kkk---gggg-TT---kTT----U------------------####--------or-k-------|-----k-gog----kkk---ggg--Tt----kT-
-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXXXXXXXXX--XX---------X--XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXX--XXXXXXXXXX--XXXXXXXX---XXXXX%XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXXXXXX---X---------X--XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXX--X-XXX-XXXX--XXXXXXXX---XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
 ;
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------S-------------------------------------------------------------------------------------------------------------------------------------SSS-----------------------------
------------------------------U-o-----------------------------------------------o------------------------------------------------------------------------------------------------
--------------------------------------------------o---------------------------------------------o--------------------------------------------------------------------------------
-------------------------------------------SS---S%--------------------------------------------------------------------QQ-------------QQoo-----U-------QQQo------------Qo---------
-------------------------------------------------|-------------------------------------------------------------------------------------------------------------------------------
----------#-----T--------------------------------|------------------------------------o-------------------------------------------------------K----------------------------------
---------#------o--------------------------------|------------------------------------------------------o------------------------------------------------------------------------
--------TT------T--------------------------------|----So2-----US---------------------USSS-----@S--------tt-----------USoS-----U------U--2-----U--###--------------------------U--
--------TT----T---------TT----TT--------o--------|------K--K------------TT----TT-T----------------------tt----#---------K---------------K--------###--------------------B--------
-------#TT---TT---------TT----TT--------#t-------|------B---------------TT----TT------------------------tt----T---------B---------------B--------###--------------------B--------
------##TT---TT----gg-#-Tt---kkT---gggg-TT--#y---|-gk-gog--k-k----ggggg-TT---kTT----k------k-------g----tt---kkT-T--k-kkb--k-k------k-gob--k-k---##----k-----------gggggb----k-k-
-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

+----------------------------------------------------------------------------------------------------------S---------------------------------------------------------------------
+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
+----------------------------------------------------------------------------------------------------------------------------------------------------------------SSS-------------
+------------------------------oo---------------------------------------------------------------------------------------------------------------o--------------------------------
+--------------oo----------------------------------------------------------------------------------------------------------------------------------------------------------------
+-------SS---%%%%%----So----------S--QSSSoS---SS---------------------QQQQQSSS-SSS---------------o-------------------------------U--------------------QS--------------------------
+-------------||-|---------------------------------------------------------------------------------------------------------------------------------------------------------------
+-------------||-|--------------------------------------------K---------------------------------------------------------------oo-------------------------------------------------
+-------------||-|--------------------------------------------2---------------------------------------------oo----------------------------------------------------------o--------
+-------QSSS-%%%%|---------------Q#-----------SS-----------------------QQQSSSS@S--------------------------S%%%----------------@S---------------------USSS-----US--------tt-------
+-------------||-|------TT-----K------------------------B------K--------------------------------------------|---------------------------tt----#-------------------------tt----T--
+-------------||-|------TT-----U------------------------B---------------------------------------------------|-----------B---------------Tt----TT------------------------tt----T--
+---t---------||-|-gggg-Tt---k-U-------k-k----------k-gog----k-k----k-------------------------#-------------|------gk---b----k-k---ggg--Tt----kT----k-oog--k-k----------tt---kkk-
+XX%XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXXXXXXXXXXXXXXXXXX-XXXXXXXXXX-XXXXXXXXXXXXXXXXXXXX---%%%%%%%%|----XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
+X-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXXXXXXXXXXXXXXXXXX-XXXXXXXXXX-XXXXXXXXXXXXXXXXXXXX----||||||-|----XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
 ;
+--------------------------------------------------------------------------k-----------------------------------------------------------------------------------------------------
+---------------------------------------------------------S----------------K-----------------------------------------------------------------------------------------------------
+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
+------------------------------oo-------------------------o----------------------------------------------------------------------------------------------------------------------
+---------------------------------------------------------------------------------------------------------------o----------------------------------------------------------------
+-------------------------------------Q----------------SSSSS--SSS----QQQQQ--------------------------------------------------------------QQ-----------SQo-------------------------
+-------------------------------------------------------------------------------o------------------------------------------------------------------------------------------------
+-------------------------------------o---------------------------------------------------------------o---------------------------------------oo--------------U------------------
+-----------------------------------------------------------------T--------------------------------------------------------------------g-----------------------------------------
+------------------------------------USSS-----US------------SSSS--T#--------------------------o------USSS-----@S--------tt-------#-#-####-----@S--------2-----U------------------
+-----------------------tt-----T-TT-------------------------------T#----K---------------t--------T----------------------tt-------###--------------------K--K------------Tt----#--
+-----------------------Tt-----T-T--------------------------------##--------------------t-----TT------------------------tt-------T#-----K---------------B---------------TT----TT-
+---------------o--gggg-Tt---kkk-T--k-k-g--k---------------------TT#----k----k-k---kggg-b----kkg----k------k-------g----tt---kkg-T#-k------k--------k-gog--k-k-----gg---TT----TT-
+XXXXXXXX----XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-------XXX---XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
+XXXXXXXX-X-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX---X---XX----XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
 ;
+-------K----------------------------------------------------------------------------------k---------------------------------------------------------------------------S---------
+----------------------------------------------------------------------------------------------------------------------------------------------------------------------S---------
+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
+----------------------------------------------------------------------------------------------------------------SSSSSSSSSSSSSSSS------------------------------------------------
+-----------------------------------------------o----------------------------------------------------------------S--------------S------------------------------------------------
+-------------ooo------------------------------------------------------------------------------------------------SSS------ooo---S----------------------------------o-------------
+----------%%%%%%-%-------------U----------------SSoSSSSSS----SSS--------------------QSQQQ----SSS------------------SSSSSSSSSSSSSS----QQSSSSS------------SS-SSSS---S%--------SS---
+-----------||||--|------------------------------------------------------------------------------------------------------------------------------------------------|----TT-------
+-----------||||--|-----------oo----------------------------------------------K-----------------------o---------------------------------------oo-------------------|----TT-------
+---------ooo|||--|--------------------------------------------oo-------------2------------------------------------------------------------------------------------|----TT---SS--
+------%%%%%%%%K--|-----------@o-----------------QSQSS---------SS--------------------Q--------USS----USSS----S@S-----------------------------S@S-------------S@S---|---###--S----
+-------||||||-o--|-----t---------------TT----TT------------------------B------------------------T-----------------------------------------------------------------|--------S----
+-------||||||%%%-|-----t---------------TT----TT------------------------B------------------------------------------------t-----------------------------------------|--------S----
+---r---||||||-|--|kk---b-----gkg--gggg-TT---kTT-----ggg------------k-gog----k-k----k--------k------k------k-----T------tt------g--kggk--------------kk---------k--|-------oy----
+%%%%%%%%%%%||-|-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXXXXXXXX--XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXXXXXXXXXXXXXXXXX-SS--SXX-X--
+-|||||||||-||-|-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXXXXXXXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXXXXXXXXXXXXXXXXX---------X-X
 ;
 --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
 --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
 --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
+----------------------------------------------------------------SSSS------------------------------------------------------------------------------------------------------------
 --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
 --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
+--------------------------------------SS-----S------QQ------------------------------Q---QS---SSS----SQo-----------------------------QS----------------------------oo------------
 --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
+-------------------------------------------------------------------------------------------------------------U------------------------------------------------------------------
+-----------------------------------------------------------------------o---------o---------------------------------------------------------------------o------------------------
+------------------------------------oo-------o-------2-------U---------tt-------Q#QQQ---Q----U---------2-----U----------------------USoS-----US--------tt----o---------------SSS
+-----------------------tt----TT------------------------K---------------tt----T-------------------------K--K------------Tt----#-------------------------tt----#------------------
+-----------------------Tt----TT------------------------B---------------tt----TT--------------#---------B---------------TT----TT------------------------tt----TT-----------------
+--kk--------------gggg-Tt---kkT--------------------k-k-b----k-----g----tt---kkT---ok--------k------k-gog----k-----g----TT----TT----k-kog--k-k----------tt----k------------k-----
+XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXX
+XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-XXXX
+;
 --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
+-------------------------------------------------------------K-K-------------------------------------------------SS-------------------------------------------------------------
+---------------------------------------------------------------o----------------------------------------------------------------------------------------------------------------
+------------------------------%%-----------------------------%%t------------------------------------------------SSSSSSSSSSSSSSSS------------------------------------------------
+------------------------------||-----------------------------||o------------------------------------------------S---SSS------S-------------------------------------------------o
+------------------------------||-----------------------------||%------------------------------------------------SSSSSSSSSSSoSSSS------------------------------------------------
+------------------------S-----|o---------------U------%%%%%--|||S--SSS-------SSS--------------------------------SSSSSSSSSSSSSSSS-----QQ---------%---SS--------------------------
+------------------------------||-----------------------|||---|||--------------------------------------------------------------------------------|-------------------------------
+------------------------------||-----o-------oo--------|||---|||-----------------------------K--------------------------------------------------|------------Ko-----------------
+------------------------------||-----------------------|||-o-SS|-g----------------------------------------------ooooooo--------S----------------|-------------------------------
+---------T--------------------||-----S-------@S--------|||%%%--|QSQSSSSSSSS-S@S%-------------U---------------U--SSSSSSS--------S-#--------------|----S-------US-----------------
+---------TT---TT--------------||----------K------------|||-|---|---------------|-----------------------BB----#-------------------------t--------|------K--K------------TT----TT-
+--B------TT---TT--------------||-------B---------------|||-|---|---------------|-----------------------Tt----TT---------------------------------|------B---------------TT----TT-
+--b------TT---TT--------------|r--gk---b----k-k--------|||-|---r---k------k----|--kk---k----kkk---ggg--Tt---kkg------ggg-------g---k--kk----k---|--k-gog--k-k-----gggg-TT---kTT-
+XXXXXXXXXXXXXXXX---------X---X%%XXXXXXXXXXXXXXXX-------|||-|%%%%XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
+XXXXXXXXXXXXXXXX--------XX---X|XXXXXXXXXXXXXXXXX-------|||-|-||-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
 ;
+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
+--------------------------------------------------------------------------------------------------K-----------------------------------------------------------------------------
+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
+-----------------------------------------------------------------------------------------------o-------------------------------o------------------------------------------------
+-------------------------------------------------------------------------------o---------------------------------------------------------------------------------ooo-----ooooo--
+-------QQ-----------Q-QQQ------------SSSQS---SSS----SQQ----------------------%%%----QQQ------------------------2------SSSS-----------Qo-------------QQQQSSS--S--%%--------------
+------------------------------------------------------------------------------|------------------B---------------------------o----------------------------------||--------------
+-------------------------------------------------------K----------------------|------------------------------------------------------------------------------oo-||--------------
+------------------------------------------------------------------------------|-----------------o-o-------------------------------------------------------------||--------------
+-------------------#------------------Q--------------2-2-----U---------------oo-----------------------------------------------------------------------QQQ---S@S-||---2---%%%----
+--------------------------------------t----------------K--K-------------------|--------@----------T------o-----------------------------B------------------------||--------|-----
+--------------------------------------t------#---------B----------------------|--------tt---------TT----TT-----------------------------B------------------------||-----K--|----T
+------------k------k--------k--------kk------#-----k-gog----k-k---------------##---ygg-tt---k-----TT----TTT-k--------kk------------k-gog----kkk----k-k------k---|g-ggg-b--|----o
+XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX------%XXXX-XXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX--XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
+XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX------|-XXXXXXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX--XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
 ;
+------------------------------------------------------------------------------------------------------------------------------------------S-------------------------------------
+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
+------------------------------------------------------------------------------------------------SSSSSSS---------SS----S---SSSSSS------------------------------------------------
+-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------o
+-----------------------------------------------------------------------------------------------o--------------------------------------------------------------------------------
+S----SQQQ-----------------------SSSSSSSS-----SSS------------------------------------------------------------------------------------------------%---SS--------------------------
+------------------------------------------------------------------------------------------------------------------------------------------------|-------------------------------
+---------------------------------------------o---------------K-----------------------o------------------------------------------------TU--------|----o-------oo-----------------
+-----------------------o--------o----------------------------2-------------------------------------------------------S----------------T------o--|-------------------------------
+-SSS-SSSSS--SU---------tt--------------------@SS-----------------------------U------USSS-----US--------t-----------------------------S@#--------|----SS------@S--------------o--
+-----------------------tt----T-------------------------B---------------TT----#--T----------------------tt----------------T------S---------------|----------------------TT----#--
+-----------------------tt----TT------------------------B---------------TT----TT-----------------------ttt----T----------TTT---------------K-----|----------------------TT----TT-
+---k--g-----------ggg--tt---kkT----kgggg--k-k------k-gog----kkk---ggg--TT---kTT----k------k-----------ttt---kk----------TTT---------------U-----|--k-g-g--k-k-----gggg-TT---kTg-
+XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX---XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
+XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX---XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
 ;
+---------------------------------------------------------------------------------------------------K--S---S---------------------------------------------------------------------
+--------------------------------------------------------------------------------------------------SS----------------------------------------------------------------------------
+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
+--------------------------------------------------------------------------------------------------------------ooSS--------------------------------------------------------------
+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
+-----------------------------------------------------------------o--------------------------------------------------------------------------------o------------o----------------
+-------------------------------------Q--------------QQQQQS------------------------------oo-----U----------------------SSSS----to----------------%%%-----------------QQ---------U
+-------------------------------------------------------------------------------------------------------o----------------------K------------------|------------------------------
+-----------------------------------------------------------------------------K---------------o-----------------------------------------------K---|----------------------------o-
+-----gg----------------------------------------------------------------------U-------------------------------SS------------------------------U---|------------------------------
+Q-#####-----------------------------USSS-----US--------QQ-----------------------------------S@S-------------------------------Q------------------|---------------------------US-
+-----------------------tt----TT-TT-------------------------------------B------K----------------------------------------------##--------B------K--|------------------------------
+-----------------------Tt----TT-T--------------------------------------B----------------------------------------------------###--------B---------|------------T-----------------
+------------k-----gggg-Tt---kkT-T--k-k-g--k--------------------k---k-gog----k-k----k-------------------------r--------------##-----k-gog----k-k--|-----------oro--gggg-g----k---
+XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX--XX----XX--XXXX--------%%%%%%%%XXXXXXXXXX--XXXXXXXXXXXXXXXXXXXX-|XXXXXXXXXXX%%%XXXXXXXXXXXXXXXX
+XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX--XX---XXX--XXXX---------||||||-XXXXXXXXXX-XXXXXXXXXXXXXXXXXXXXX-|XXXX-X-XXX--|-XXXXXXXXXXXXXXXX

models/example_policy/samples.png CHANGED Viewed

plots.py DELETED Viewed

@@ -1,733 +0,0 @@
-import glob
-import json
-import os
-import re
-import numpy as np
-import pandas as pds
-import matplotlib
-import matplotlib.pyplot as plt
-from math import sqrt
-import torch
-from root import PRJROOT
-from sklearn.manifold import TSNE
-from itertools import product, chain
-# from src.drl.drl_uses import load_cfgs
-from src.gan.gankits import get_decoder, process_onehot
-from src.gan.gans import nz
-from src.smb.level import load_batch, hamming_dis, lvlhcat
-from src.utils.datastruct import RingQueue
-from src.utils.filesys import load_dict_json, getpath
-from src.utils.img import make_img_sheet
-from torch.distributions import Normal
-matplotlib.rcParams["axes.formatter.limits"] = (-5, 5)
-def print_compare_tab():
-    rand_lgp, rand_fhp, rand_divs = load_dict_json(
-        'test_data/rand_policy/performance.csv', 'lgp', 'fhp', 'diversity'
-    )
-    rand_performance = {'lgp': rand_lgp, 'fhp': rand_fhp, 'diversity': rand_divs}
-    def _print_line(_data, minimise=False):
-        means = _data.mean(axis=-1)
-        stds = _data.std(axis=-1)
-        max_i, min_i = np.argmax(means), np.argmin(means)
-        mean_str_content = [*map(lambda x: '%.4g' % x, _data.mean(axis=-1))]
-        std_str_content = [*map(lambda x: '$\pm$%.3g' % x, _data.std(axis=-1))]
-        if minimise:
-            mean_str_content[min_i] = r'\textbf{%s}' % mean_str_content[min_i]
-            mean_str_content[max_i] = r'\textit{%s}' % mean_str_content[max_i]
-            std_str_content[min_i] = r'\textbf{%s}' % std_str_content[min_i]
-            std_str_content[max_i] = r'\textit{%s}' % std_str_content[max_i]
-        else:
-            mean_str_content[max_i] = r'\textbf{%s}' % mean_str_content[max_i]
-            mean_str_content[min_i] = r'\textit{%s}' % mean_str_content[min_i]
-            std_str_content[max_i] = r'\textbf{%s}' % std_str_content[max_i]
-            std_str_content[min_i] = r'\textit{%s}' % std_str_content[min_i]
-        print('    &', ' & '.join(mean_str_content), r'\\')
-        print('    & &', ' & '.join(std_str_content), r'\\')
-        pass
-    def _print_block(_task):
-        fds = [
-            f'sac/{_task}', f'egsac/{_task}', f'asyncsac/{_task}',
-            f'pmoe/{_task}', f'dvd/{_task}', f'sunrise/{_task}',
-            f'varpm-{_task}/l0.0_m5', f'varpm-{_task}/l0.1_m5', f'varpm-{_task}/l0.2_m5',
-            f'varpm-{_task}/l0.3_m5', f'varpm-{_task}/l0.4_m5', f'varpm-{_task}/l0.5_m5'
-        ]
-        rewards, divs = [], []
-        for fd in fds:
-            rewards.append([])
-            divs.append([])
-            # print(getpath())
-            for path in glob.glob(getpath('test_data', fd, '**', 'performance.csv'), recursive=True):
-                reward, div = load_dict_json(path, 'reward', 'diversity')
-                rewards[-1].append(reward)
-                divs[-1].append(div)
-        rewards = np.array(rewards)
-        divs = np.array(divs)
-        print('    & \\multirow{2}{*}{Reward}')
-        _print_line(rewards)
-        print('    \\cline{2-14}')
-        print('    & \\multirow{2}{*}{Diversity}')
-        _print_line(divs)
-        print('    \\cline{2-14}')
-        print('    & \\multirow{2}{*}{G-mean}')
-        gmean = np.sqrt(rewards * divs)
-        _print_line(gmean)
-        print('    \\cline{2-14}')
-        print('    & \\multirow{2}{*}{N-rank}')
-        r_rank = np.zeros_like(rewards.flatten())
-        r_rank[np.argsort(-rewards.flatten())] = np.linspace(1, len(r_rank), len(r_rank))
-        d_rank = np.zeros_like(divs.flatten())
-        d_rank[np.argsort(-divs.flatten())] = np.linspace(1, len(r_rank), len(r_rank))
-        n_rank = (r_rank.reshape([12, 5]) + d_rank.reshape([12, 5])) / (2 * 5)
-        _print_line(n_rank, True)
-    print('    \\multirow{8}{*}{MarioPuzzle}')
-    _print_block('fhp')
-    print('    \\midrule')
-    print('    \\multirow{8}{*}{MultiFacet}')
-    _print_block('lgp')
-    pass
-def print_compare_tab_nonrl():
-    # rand_lgp, rand_fhp, rand_divs = load_dict_json(
-    #     'test_data/rand_policy/performance.csv', 'lgp', 'fhp', 'diversity'
-    # )
-    # rand_performance = {'lgp': rand_lgp, 'fhp': rand_fhp, 'diversity': rand_divs}
-    def _print_line(_data, minimise=False):
-        means = _data.mean(axis=-1)
-        stds = _data.std(axis=-1)
-        max_i, min_i = np.argmax(means), np.argmin(means)
-        mean_str_content = [*map(lambda x: '%.4g' % x, _data.mean(axis=-1))]
-        std_str_content = [*map(lambda x: '$\pm$%.3g' % x, _data.std(axis=-1))]
-        if minimise:
-            mean_str_content[min_i] = r'\textbf{%s}' % mean_str_content[min_i]
-            mean_str_content[max_i] = r'\textit{%s}' % mean_str_content[max_i]
-            std_str_content[min_i] = r'\textbf{%s}' % std_str_content[min_i]
-            std_str_content[max_i] = r'\textit{%s}' % std_str_content[max_i]
-        else:
-            mean_str_content[max_i] = r'\textbf{%s}' % mean_str_content[max_i]
-            mean_str_content[min_i] = r'\textit{%s}' % mean_str_content[min_i]
-            std_str_content[max_i] = r'\textbf{%s}' % std_str_content[max_i]
-            std_str_content[min_i] = r'\textit{%s}' % std_str_content[min_i]
-        print('    &', ' & '.join(mean_str_content), r'\\')
-        print('    & &', ' & '.join(std_str_content), r'\\')
-        pass
-    def _print_block(_task):
-        fds = [
-            f'GAN-{_task}', f'DDPM-{_task}',
-            f'varpm-{_task}/l0.0_m5', f'varpm-{_task}/l0.1_m5', f'varpm-{_task}/l0.2_m5',
-            f'varpm-{_task}/l0.3_m5', f'varpm-{_task}/l0.4_m5', f'varpm-{_task}/l0.5_m5'
-        ]
-        rewards, divs = [], []
-        for fd in fds:
-            rewards.append([])
-            divs.append([])
-            # print(getpath())
-            for path in glob.glob(getpath('test_data', fd, '**', 'performance.csv'), recursive=True):
-                reward, div = load_dict_json(path, 'reward', 'diversity')
-                rewards[-1].append(reward)
-                divs[-1].append(div)
-        rewards = np.array(rewards)
-        divs = np.array(divs)
-        print('    & \\multirow{2}{*}{Reward}')
-        _print_line(rewards)
-        print('    \\cline{2-10}')
-        print('    & \\multirow{2}{*}{Diversity}')
-        _print_line(divs)
-        print('    \\cline{2-10}')
-        # print('    & \\multirow{2}{*}{G-mean}')
-        # gmean = np.sqrt(rewards * divs)
-        # _print_line(gmean)
-        #
-        # print('    \\cline{2-10}')
-        # print('    & \\multirow{2}{*}{N-rank}')
-        # r_rank = np.zeros_like(rewards.flatten())
-        # r_rank[np.argsort(-rewards.flatten())] = np.linspace(1, len(r_rank), len(r_rank))
-        #
-        # d_rank = np.zeros_like(divs.flatten())
-        # d_rank[np.argsort(-divs.flatten())] = np.linspace(1, len(r_rank), len(r_rank))
-        # n_rank = (r_rank.reshape([8, 5]) + d_rank.reshape([8, 5])) / (2 * 5)
-        # _print_line(n_rank, True)
-    print('    \\multirow{4}{*}{MarioPuzzle}')
-    _print_block('fhp')
-    print('    \\midrule')
-    print('    \\multirow{4}{*}{MultiFacet}')
-    _print_block('lgp')
-    pass
-def plot_cmp_learning_curves(task, save_path='', title=''):
-    plt.style.use('seaborn')
-    colors = [plt.plot([0, 1], [-1000, -1000])[0].get_color() for _ in range(6)]
-    plt.cla()
-    plt.style.use('default')
-    # colors = ('#5D2CAB', '#005BD4', '#007CE4', '#0097DD', '#00ADC4', '#00C1A5')
-    def _get_algo_data(fd):
-        res = []
-        for i in range(1, 6):
-            path = getpath(fd, f't{i}', 'step_tests.csv')
-            try:
-                data = pds.read_csv(path)
-                trajectory = [
-                    [float(item['step']), float(item['r-avg']), float(item['diversity'])]
-                    for _, item in data.iterrows()
-                ]
-                trajectory.sort(key=lambda x: x[0])
-                res.append(trajectory)
-                if len(trajectory) != 26:
-                    print('Not complete (%d)/26:' % len(trajectory), path)
-            except FileNotFoundError:
-                print(path)
-        res = np.array(res)
-        # rdsum = res[:, :, 1] + res[:, :, 2]
-        gmean = np.sqrt(res[:, :, 1] * res[:, :, 2])
-        steps = res[0, :, 0]
-        # r_avgs = np.mean(res[:, :, 1], axis=0)
-        # r_stds = np.std(res[:, :, 1], axis=0)
-        # divs = np.mean(res[:, :, 2], axis=0)
-        # div_std = np.std(res[:, :, 2], axis=0)
-        _performances = {
-            'reward': (np.mean(res[:, :, 1], axis=0), np.std(res[:, :, 1], axis=0)),
-            'diversity': (np.mean(res[:, :, 2], axis=0), np.std(res[:, :, 2], axis=0)),
-            # 'rdsum': (np.mean(rdsum, axis=0), np.std(rdsum, axis=0)),
-            'gmean': (np.mean(gmean, axis=0), np.std(gmean, axis=0)),
-        }
-        # print(_performances['gmean'])
-        return steps, _performances
-    def _plot_criterion(_ax, _criterion):
-        i, j, k = 0, 0, 0
-        for algo, (steps, _performances) in performances.items():
-            avgs, stds = _performances[_criterion]
-            if '\lambda' in algo:
-                ls = '-'
-                _c = colors[i]
-                i += 1
-            elif algo in {'SAC', 'EGSAC', 'ASAC'}:
-                ls = ':'
-                _c = colors[j]
-                j += 1
-            else:
-                ls = '--'
-                _c = colors[j]
-                j += 1
-            _ax.plot(steps, avgs, color=_c, label=algo, ls=ls)
-            _ax.fill_between(steps, avgs - stds, avgs + stds, color=_c, alpha=0.15)
-            _ax.grid(False)
-            # plt.plot(steps, avgs, label=algo)
-            # plt.plot(_performances, label=algo)
-        pass
-        _ax.set_xlabel('Time step')
-    fig, ax = plt.subplots(1, 3, figsize=(9.6, 3.2), dpi=250, width_ratios=[1, 1, 1])
-    # fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(5, 4), dpi=256)
-    # fig, ax1 = plt.subplots(1, 1, figsize=(8, 3), dpi=256)
-    # ax2 = ax1.twinx()
-    # fig = plt.plot(figsize=(4, 3), dpi=256)
-    performances = {
-        'SUNRISE': _get_algo_data(f'test_data/sunrise/{task}'),
-        '$\lambda$=0.0': _get_algo_data(f'test_data/varpm-{task}/l0.0_m5'),
-        'DvD': _get_algo_data(f'test_data/dvd/{task}'),
-        '$\lambda$=0.1': _get_algo_data(f'test_data/varpm-{task}/l0.1_m5'),
-        'PMOE': _get_algo_data(f'test_data/pmoe/{task}'),
-        '$\lambda$=0.2': _get_algo_data(f'test_data/varpm-{task}/l0.2_m5'),
-        'SAC': _get_algo_data(f'test_data/sac/{task}'),
-        '$\lambda$=0.3': _get_algo_data(f'test_data/varpm-{task}/l0.3_m5'),
-        'EGSAC': _get_algo_data(f'test_data/egsac/{task}'),
-        '$\lambda$=0.4': _get_algo_data(f'test_data/varpm-{task}/l0.4_m5'),
-        'ASAC': _get_algo_data(f'test_data/asyncsac/{task}'),
-        '$\lambda$=0.5': _get_algo_data(f'test_data/varpm-{task}/l0.5_m5'),
-    }
-    # _plot_algo(*_get_algo_data(glob.glob(getpath('test_data/SAC', '**', 'step_tests.csv'))), 'SAC')
-    # _plot_algo(*_get_algo_data(glob.glob(getpath('test_data/EGSAC', '**', 'step_tests.csv'))), 'EGSAC')
-    # _plot_algo(*_get_algo_data(glob.glob(getpath('test_data/AsyncSAC', '**', 'step_tests.csv'))), 'AsyncSAC')
-    # _plot_algo(*_get_algo_data(glob.glob(getpath('test_data/SUNRISE', '**', 'step_tests.csv'))), 'SUNRISE')
-    # _plot_algo(*_get_algo_data(glob.glob(getpath('test_data/DvD-ES', '**', 'step_tests.csv'))), 'DvD-ES')
-    # _plot_algo(*_get_algo_data(glob.glob(getpath('test_data/lbd-m-crosstest/l0.04_m5', '**', 'step_tests.csv'))), 'NCESAC')
-    _plot_criterion(ax[0], 'reward')
-    _plot_criterion(ax[1], 'diversity')
-    # _plot_criterion(ax[2], 'rdsum')
-    _plot_criterion(ax[2], 'gmean')
-    # ax[0].set_title(f'{title} reward')
-    ax[0].set_title(f'Cumulative Reward')
-    ax[1].set_title('Diversity Score')
-    # ax[2].set_title('Summation')
-    ax[2].set_title('G-mean')
-    # plt.title(title)
-    lines, labels = fig.axes[-1].get_legend_handles_labels()
-    fig.suptitle(title, fontsize=14)
-    plt.tight_layout(pad=0.5)
-    if save_path:
-        plt.savefig(getpath(save_path))
-    else:
-        plt.show()
-    plt.cla()
-    plt.figure(figsize=(9.6, 2.4), dpi=250)
-    plt.grid(False)
-    plt.axis('off')
-    plt.yticks([1.0])
-    plt.legend(
-        lines, labels, loc='lower center', ncol=6, edgecolor='white', fontsize=15,
-        columnspacing=0.8, borderpad=0.16, labelspacing=0.2, handlelength=2.4, handletextpad=0.3
-    )
-    plt.tight_layout(pad=0.5)
-    plt.show()
-    pass
-def plot_crosstest_scatters(rfunc, xrange=None, yrange=None, title=''):
-    def get_pareto():
-        all_points = list(chain(*scatter_groups.values())) + cmp_points
-        res = []
-        for p in all_points:
-            non_dominated = True
-            for q in all_points:
-                if q[0] >= p[0] and q[1] >= p[1] and (q[0] > p[0] or q[1] > p[1]):
-                    non_dominated = False
-                    break
-            if non_dominated:
-                res.append(p)
-        res.sort(key=lambda item:item[0])
-        return np.array(res)
-    def _hex_color(_c):
-        return
-    scatter_groups = {}
-    all_lbd = set()
-    # Initialise
-    plt.style.use('seaborn-v0_8-dark-palette')
-    # plt.figure(figsize=(4, 4), dpi=256)
-    plt.figure(figsize=(2.5, 2.5), dpi=256)
-    plt.axes().set_axisbelow(True)
-    # Competitors' performances
-    cmp_folders = ['asyncsac', 'egsac', 'sac', 'sunrise', 'dvd', 'pmoe']
-    cmp_names = ['ASAC', 'EGSAC', 'SAC', 'SUNRISE', 'DvD', 'PMOE']
-    cmp_labels = ['A', 'E', 'S', 'R', 'D', 'M']
-    cmp_markers = ['2', 'x', '+', 'o', '*', 'D']
-    cmp_sizes = [42, 20, 32, 16, 24, 10, 10]
-    cmp_points = []
-    for name, folder, label, mk, s in zip(cmp_names, cmp_folders, cmp_labels, cmp_markers, cmp_sizes):
-        path_fmt = getpath('test_data', folder, rfunc, '*', 'performance.csv')
-        # print(path_fmt)
-        xs, ys = [], []
-        for path in glob.glob(path_fmt, recursive=True):
-            # print(path)
-            try:
-                x, y = load_dict_json(path, 'reward', 'diversity')
-                xs.append(x)
-                ys.append(y)
-                cmp_points.append([x, y])
-                # plt.text(x, y, label, size=7, weight='bold', va='center', ha='center', color='#202020')
-            except FileNotFoundError:
-                print(path)
-        if label in {'A', 'E', 'S'}:
-            plt.scatter(xs, ys, marker=mk, zorder=2, s=s, label=name, color='#202020')
-        else:
-            plt.scatter(
-                xs, ys, marker=mk, zorder=2, s=s, label=name, color=[0., 0., 0., 0.],
-                edgecolors='#202020', linewidths=1
-            )
-    # NCESAC performances
-    for path in glob.glob(getpath('test_data', f'varpm-{rfunc}', '**', 'performance.csv'), recursive=True):
-        try:
-            x, y = load_dict_json(path, 'reward', 'diversity')
-            key = path.split('\\')[-3]
-            _, mtxt = key.split('_')
-            ltxt, _ = key.split('_')
-            lbd = float(ltxt[1:])
-            # if mtxt in {'m2', 'm3', 'm4'}:
-            #     continue
-            all_lbd.add(lbd)
-            if key not in scatter_groups.keys():
-                scatter_groups[key] = []
-            scatter_groups[key].append([x, y])
-        except Exception as e:
-            print(path)
-            print(e)
-    palette = plt.get_cmap('seismic')
-    color_x = [0.2, 0.33, 0.4, 0.61, 0.67, 0.79]
-    colors = {lbd: matplotlib.colors.to_hex(c) for c, lbd in zip(palette(color_x), sorted(all_lbd))}
-    colors = {0.0: '#150080', 0.1: '#066598', 0.2: '#01E499', 0.3: '#9FD40C', 0.4: '#F3B020', 0.5: '#FA0000'}
-    for lbd in sorted(all_lbd): plt.plot([-20], [-20], label=f'$\\lambda={lbd:.1f}$', lw=6, c=colors[lbd])
-    markers = {2: 'o', 3: '^', 4: 'D', 5: 'p', 6: 'h'}
-    msizes = {2: 25, 3: 25, 4: 16, 5: 28, 6: 32}
-    for key, group in scatter_groups.items():
-        ltxt, mtxt = key.split('_')
-        l = float(ltxt[1:])
-        m = int(mtxt[1:])
-        arr = np.array(group)
-        plt.scatter(
-            arr[:, 0], arr[:, 1], marker=markers[m], s=msizes[m], color=[0., 0., 0., 0.], zorder=2,
-            edgecolors=colors[l], linewidths=1
-        )
-    plt.xlim(xrange)
-    plt.ylim(yrange)
-    # plt.xlabel('Task Reward')
-    # plt.ylabel('Diversity')
-    # plt.legend(ncol=2)
-    # plt.legend(
-    #     ncol=2, loc='lower left', columnspacing=1.2, borderpad=0.0,
-    #     handlelength=1, handletextpad=0.5, framealpha=0.
-    # )
-    pareto = get_pareto()
-    plt.plot(
-        pareto[:, 0], pareto[:, 1], color='black', alpha=0.18, lw=6, zorder=3,
-        solid_joinstyle='round', solid_capstyle='round'
-    )
-    # plt.plot([88, 98, 98, 88, 88], [35, 35, 0.2, 0.2, 35], color='black', alpha=0.3, lw=1.5)
-    # plt.xticks(fontsize=16)
-    # plt.yticks(fontsize=16)
-    # plt.xticks([(1+space) * (m-mlow) + 0.5 for m in ms], [f'm={m}' for m in ms])
-    plt.title(title)
-    plt.grid()
-    plt.tight_layout(pad=0.4)
-    plt.show()
-def plot_varpm_heat(task, name):
-    def _get_score(m, l):
-        fd = getpath('test_data', f'varpm-{task}', f'l{l}_m{m}')
-        rewards, divs = [], []
-        for i in range(5):
-            reward, div = load_dict_json(f'{fd}/t{i+1}/performance.csv', 'reward', 'diversity')
-            rewards.append(reward)
-            divs.append(div)
-        gmean = [sqrt(r * d) for r, d in zip(rewards, divs)]
-        return np.mean(rewards), np.std(rewards), \
-            np.mean(divs), np.std(divs), \
-            np.mean(gmean), np.std(gmean)
-    def _plot_map(avg_map, std_map, criterion):
-        fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(9, 3), dpi=256, width_ratios=(1, 1))
-        heat1 = ax1.imshow(avg_map, cmap='spring')
-        heat2 = ax2.imshow(std_map, cmap='spring')
-        ax1.set_xlim([-0.5, 5.5])
-        ax1.set_xticks([0, 1, 2, 3, 4, 5], ['$\lambda$=0.0', '$\lambda$=0.1', '$\lambda$=0.2', '$\lambda$=0.3', '$\lambda$=0.4', '$\lambda$=0.5'])
-        ax1.set_ylim([-0.5, 3.5])
-        ax1.set_yticks([0, 1, 2, 3], ['m=5', 'm=4', 'm=3', 'm=2'])
-        ax1.set_title('Average')
-        for x, y in product([0, 1, 2, 3, 4, 5], [0, 1, 2, 3]):
-            v = avg_map[y, x]
-            s = '%.4f' % v
-            if v >= 1000: s = s[:4]
-            elif v >= 1: s = s[:5]
-            else: s = s[1:6]
-            ax1.text(x, y, s, va='center', ha='center')
-        plt.colorbar(heat1, ax=ax1, shrink=0.9)
-        ax2.set_xlim([-0.5, 5.5])
-        ax2.set_xticks([0, 1, 2, 3, 4, 5], ['$\lambda$=0.0', '$\lambda$=0.1', '$\lambda$=0.2', '$\lambda$=0.3', '$\lambda$=0.4', '$\lambda$=0.5'])
-        ax2.set_ylim([-0.5, 3.5])
-        ax2.set_yticks([0, 1, 2, 3], ['m=5', 'm=4', 'm=3', 'm=2'])
-        for x, y in product([0, 1, 2, 3, 4, 5], [0, 1, 2, 3]):
-            v = std_map[y, x]
-            s = '%.4f' % v
-            if v >= 1000: s = s[:4]
-            elif v >= 1: s = s[:5]
-            else: s = s[1:6]
-            ax2.text(x, y, s, va='center', ha='center')
-        ax2.set_title('Standard Deviation')
-        plt.colorbar(heat2, ax=ax2, shrink=0.9)
-        fig.suptitle(f'{name}: {criterion}', fontsize=14)
-        plt.tight_layout()
-        # plt.show()
-        plt.savefig(getpath(f'results/heat/{name}-{criterion}.png'))
-    r_mean_map, r_std_map, d_mean_map, d_std_map, g_mean_map, g_std_map \
-        = (np.zeros([4, 6], dtype=float) for _ in range(6))
-    ms = [2, 3, 4, 5]
-    ls = ['0.0', '0.1', '0.2', '0.3', '0.4', '0.5']
-    for i, j in product(range(4), range(6)):
-        r_mean, r_std, d_mean, d_std, g_mean, g_std = _get_score(ms[i], ls[j])
-        r_mean_map[i, j] = r_mean
-        r_std_map[i, j] = r_std
-        d_mean_map[i, j] = d_mean
-        d_std_map[i, j] = d_std
-        g_mean_map[i, j] = g_mean
-        g_std_map[i, j] = g_std
-    _plot_map(r_mean_map, r_std_map, 'Reward')
-    _plot_map(d_mean_map, d_std_map, 'Diversity')
-    _plot_map(g_mean_map, g_std_map,'G-mean')
-    # _plot_map(g_mean_map, g_std_map,'G-mean')
-def vis_samples():
-    # for l, m in product(['0.0', '0.1', '0.2', '0.3', '0.4', '0.5'], [2, 3, 4, 5]):
-    #     for i in range(1, 6):
-    #         lvls = load_batch(f'{PRJROOT}/test_data/varpm-fhp/l{l}_m{m}/t{i}/samples.lvls')
-    #         imgs = [lvl.to_img(save_path=None) for lvl in lvls[:10]]
-    #         make_img_sheet(imgs, 1, save_path=f'{PRJROOT}/test_data/varpm-fhp/l{l}_m{m}/t{i}/samples.png')
-    # for algo in ['sac', 'egsac', 'asyncsac', 'dvd', 'sunrise', 'pmoe']:
-    #     for i in range(1, 6):
-    #         lvls = load_batch(f'{PRJROOT}/test_data/{algo}/fhp/t{i}/samples.lvls')
-    #         imgs = [lvl.to_img(save_path=None) for lvl in lvls[:10]]
-    #         make_img_sheet(imgs, 1, save_path=f'{PRJROOT}/test_data/{algo}/fhp/t{i}/samples.png')
-    for i in range(1, 6):
-        lvls = load_batch(f'{PRJROOT}/test_data/DDPM-fhp/t{i}/samples.lvls')
-        imgs = [lvl.to_img(save_path=None) for lvl in lvls[:10]]
-        make_img_sheet(imgs, 1, save_path=f'{PRJROOT}/test_data/DDPM-fhp/t{i}/samples.png')
-        pass
-    pass
-def make_tsne(task, title, n=500, save_path=None):
-    if not os.path.exists(getpath('test_data', f'samples_dist-{task}_{n}.npy')):
-        samples = []
-        for algo in ['dvd', 'egsac', 'pmoe', 'sunrise', 'asyncsac', 'sac']:
-            for t in range(5):
-                lvls = load_batch(getpath('test_data', algo, task, f't{t+1}', 'samples.lvls'))
-                samples += lvls[:n]
-        for l in ['0.0', '0.1', '0.2', '0.3', '0.4', '0.5']:
-            for t in range(5):
-                lvls = load_batch(getpath('test_data', f'varpm-{task}', f'l{l}_m5', f't{t+1}', 'samples.lvls'))
-                samples += lvls[:n]
-        distmat = []
-        for a in samples:
-            dist_list = []
-            for b in samples:
-                dist_list.append(hamming_dis(a, b))
-            distmat.append(dist_list)
-        distmat = np.array(distmat)
-        np.save(getpath('test_data', f'samples_dist-{task}_{n}.npy'), distmat)
-    labels = (
-        '$\lambda$=0.0', '$\lambda$=0.1', '$\lambda$=0.2', '$\lambda$=0.3', '$\lambda$=0.4',
-        '$\lambda$=0.5', 'DvD', 'EGSAC', 'PMOE', 'SUNRISE', 'ASAC', 'SAC'
-    )
-    tsne = TSNE(learning_rate='auto', n_components=2, metric='precomputed')
-    print(np.load(getpath('test_data', f'samples_dist-{task}_{n}.npy')).shape)
-    data = np.load(getpath('test_data', f'samples_dist-{task}_{n}.npy'))
-    embx = np.array(tsne.fit_transform(data))
-    plt.style.use('seaborn-dark-palette')
-    plt.figure(figsize=(5, 5), dpi=384)
-    colors = [plt.plot([-1000, -1100], [0, 0])[0].get_color() for _ in range(6)]
-    for i in range(6):
-        x, y = embx[i*n*5:(i+1)*n*5, 0], embx[i*n*5:(i+1)*n*5, 1]
-        plt.scatter(x, y, s=10, label=labels[i], marker='x', c=colors[i])
-    for i in range(6, 12):
-        x, y = embx[i*n*5:(i+1)*n*5, 0], embx[i*n*5:(i+1)*n*5, 1]
-        plt.scatter(x, y, s=8, linewidths=0, label=labels[i], c=colors[i-6])
-    # plt.scatter(embx[100:200, 0], embx[100:200, 1], c=colors[1], s=12, linewidths=0, label='Killer')
-    # plt.scatter(embx[200:, 0], embx[200:, 1], c=colors[2], s=12, linewidths=0, label='Collector')
-    # for i in range(4):
-    #     plt.text(embx[i+100, 0], embx[i+100, 1], str(i+1))
-    #     plt.text(embx[i+200, 0], embx[i+200, 1], str(i+1))
-    #     pass
-    # for emb, lb, c in zip(embs, labels,colors):
-    #     plt.scatter(emb[:,0], emb[:,1], c=c, label=lb, alpha=0.15, linewidths=0, s=7)
-    # xspan = 1.08 * max(abs(embx[:, 0].max()), abs(embx[:, 0].min()))
-    # yspan = 1.08 * max(abs(embx[:, 1].max()), abs(embx[:, 1].min()))
-    xrange = [1.05 * embx[:, 0].min(), 1.05 * embx[:, 0].max()]
-    yrange = [1.05 * embx[:, 1].min(), 1.25 * embx[:, 1].max()]
-    plt.xlim(xrange)
-    plt.ylim(yrange)
-    plt.xticks([])
-    plt.yticks([])
-    # plt.legend(ncol=6, handletextpad=0.02, labelspacing=0.05, columnspacing=0.16)
-    # plt.xticks([-xspan, -0.5 * xspan, 0, 0.5 * xspan, xspan], [''] * 5)
-    # plt.yticks([-yspan, -0.5 * yspan, 0, 0.6 * yspan, yspan], [''] * 5)
-    plt.title(title)
-    plt.legend(loc='upper center', ncol=6, fontsize=9, handlelength=.5, handletextpad=0.5, columnspacing=0.3, framealpha=0.)
-    plt.tight_layout(pad=0.2)
-    if save_path:
-        plt.savefig(getpath(save_path))
-    else:
-        plt.show()
-def _prob_fmt(p, digitals=3, threshold=0.001):
-    fmt = '%.' + str(digitals) + 'f'
-    if p < threshold:
-        return '$\\approx 0$'
-    else:
-        txt = '$%s$' % ((fmt % p)[1:])
-        if txt == '$.000$':
-            txt = '$1.00$'
-        return txt
-def _g_fmt(v, digitals=4):
-    fmt = '%.' + str(digitals) + 'g'
-    txt = (fmt % v)
-    lack = digitals - len(txt.replace('-', '').replace('.', ''))
-    if lack > 0 and '.' not in txt:
-        txt += '.'
-    return txt + '0' * lack
-    pass
-def print_selection_prob(path, h=15, runs=2):
-    s0 = 0
-    model = torch.load(getpath(f'{path}/policy.pth'), map_location='cpu')
-    model.requires_grad_(False)
-    model.to('cpu')
-    n = 11
-    # n = load_cfgs(path, 'N')
-    # print(model.m)
-    init_vec = np.load(getpath('analysis/initial_seg.npy'))[s0]
-    decoder = get_decoder(device='cpu')
-    obs_buffer = RingQueue(n)
-    for r in range(runs):
-        for _ in range(h): obs_buffer.push(np.zeros([nz]))
-        obs_buffer.push(init_vec)
-        level_latvecs = [init_vec]
-        probs = np.zeros([model.m, h])
-        # probs = []
-        selects = []
-        for t in range(h):
-            # probs.append([])
-            obs = torch.tensor(np.concatenate(obs_buffer.to_list(), axis=-1), dtype=torch.float).view([1, -1])
-            muss, stdss, betas = model.get_intermediate(torch.tensor(obs))
-            i = torch.multinomial(betas.squeeze(), 1).item()
-            # print(i)
-            mu, std = muss[0][i], stdss[0][i]
-            action = Normal(mu, std).rsample([1]).squeeze().numpy()
-            # print(action)
-            # print(mu)
-            # print(std)
-            # print(action.numpy())
-            obs_buffer.push(action)
-            level_latvecs.append(action)
-            # i = torch.multinomial(betas.squeeze(), 1).item()
-            # print(i)
-            probs[:, t] = betas.squeeze().numpy()
-            selects.append(i)
-            pass
-        onehots = decoder(torch.tensor(level_latvecs).view(-1, nz, 1, 1))
-        segs = process_onehot(onehots)
-        lvl = lvlhcat(segs)
-        lvl.to_img(f'figures/gen_process/run{r}-01.png')
-        txts = [[_prob_fmt(p) for p in row] for row in probs]
-        for t, i in enumerate(selects):
-            txts[i][t] = r'$\boldsymbol{%s}$' % txts[i][t][1:-1]
-        for i, txt in enumerate(txts):
-            print(f'    & $\\beta_{i+1}$ &', ' & '.join(txt), r'\\')
-        print(r'\midrule')
-    pass
-def calc_selection_freqs(task, n):
-    def _count_one_init():
-        counts = np.zeros([model.m])
-        # init_vec = np.load(getpath('analysis/initial_seg.npy'))
-        obs_buffer = RingQueue(n)
-        for _ in range(runs):
-            for _ in range(h): obs_buffer.push(np.zeros([len(init_vecs), nz]))
-            obs_buffer.push(init_vecs)
-            # level_latvecs = [init_vec]
-            for _ in range(h):
-                obs = np.concatenate(obs_buffer.to_list(), axis=-1)
-                obs = torch.tensor(obs, device='cuda:0', dtype=torch.float)
-                muss, stdss, betas = model.get_intermediate(obs)
-                selects = torch.multinomial(betas.squeeze(), 1).squeeze()
-                mus = muss[[*range(len(init_vecs))], selects, :]
-                stds = stdss[[*range(len(init_vecs))], selects, :]
-                actions = Normal(mus, stds).rsample().squeeze().cpu().numpy()
-                obs_buffer.push(actions)
-                for i in selects:
-                    counts[i] = counts[i] + 1
-        return counts
-        # onehots = decoder(torch.tensor(level_latvecs).view(-1, nz, 1, 1))
-        pass
-    pass
-    init_vecs = np.load(getpath('analysis/initial_seg.npy'))
-    freqs = [[] for _ in range(30)]
-    start_line = 0
-    for l in ('0.0', '0.1', '0.2', '0.3', '0.4', '0.5'):
-        print(r'    \midrule')
-        for t, m in product(range(1, 6), (2, 3, 4, 5)):
-            path = getpath(f'test_data/varpm-{task}/l{l}_m{m}/t{t}')
-            model = torch.load(getpath(f'{path}/policy.pth'), map_location='cuda:0')
-            model.requires_grad_(False)
-            freq = np.zeros([m])
-            # n = load_cfgs(path, 'N')
-            runs, h = 100, 25
-            freq += _count_one_init()
-            freq /= (len(init_vecs) * runs * h)
-            freq = np.sort(freq)[::-1]
-            i = start_line + t - 1
-            freqs[i] += freq.tolist()
-            print(freqs[i])
-        start_line += 5
-        print(freqs)
-    with open(getpath(f'analysis/select_freqs-{task}.json'), 'w') as f:
-        json.dump(freqs, f)
-def print_selection_freq():
-    # task, n = 'lgp', 5
-    task, n = 'fhp', 11
-    if not os.path.exists(getpath(f'analysis/select_freqs-{task}.json')):
-        calc_selection_freqs(task, n)
-    with open(getpath(f'analysis/select_freqs-{task}.json'), 'r') as f:
-        freqs = json.load(f)
-    lbds = ['0.0', '0.1', '0.2', '0.3', '0.4', '0.5']
-    for i, row_data in enumerate(freqs):
-        if i % 5 == 0:
-            print(r'  \midrule')
-            print(r'  \multirow{5}{*}{$%s$}' % lbds[i//5])
-        txt = ' & '.join(map(_prob_fmt, row_data))
-        print(f'  & {i%5+1} &', txt, r'\\')
-def print_individual_performances(task):
-    for m, l in product((2, 3, 4, 5), ('0.0', '0.1', '0.2', '0.3', '0.4', '0.5')):
-        values = []
-        if l == '0.0':
-            print(r'  \midrule')
-            print(r'  \multirow{6}{*}{%d}' % m)
-        for t in range(1, 6):
-            path = f'test_data/varpm-{task}/l{l}_m{m}/t{t}/performance.csv'
-            reward, diversity = load_dict_json(path, 'reward', 'diversity')
-            values.append([reward, diversity])
-        values.sort(key=lambda item: -item[0])
-        values = [*chain(*values)]
-        txts = [_g_fmt(v) for v in values]
-        print('  &', f'${l}$ & ', ' & '.join(txts), r'\\')
-    pass
-if __name__ == '__main__':
-    # print_selection_prob('test_data/varpm-fhp/l0.5_m5/t5')
-    # print_selection_prob('test_data/varpm-fhp/l0.1_m5/t5')
-    # print_selection_freq()
-    # print_compare_tab_nonrl()
-    # print_individual_performances('fhp')
-    # print('\n\n')
-    # print_individual_performances('lgp')
-    # plot_cmp_learning_curves('fhp', save_path='results/learning_curves/fhp.png', title='MarioPuzzle')
-    # plot_cmp_learning_curves('lgp', save_path='results/learning_curves/lgp.png', title='MultiFacet')
-    # plot_crosstest_scatters('fhp', title='MarioPuzzle')
-    # plot_crosstest_scatters('lgp', title='MultiFacet')
-    # # plot_crosstest_scatters('fhp', yrange=(0, 2500), xrange=(20, 70), title='MarioPuzzle')
-    # plot_crosstest_scatters('lgp', yrange=(0, 1500), xrange=(20, 50), title='MultiFacet')
-    # plot_crosstest_scatters('lgp', yrange=(0, 800), xrange=(44, 48), title=' ')
-    # plot_varpm_heat('fhp', 'MarioPuzzle')
-    # plot_varpm_heat('lgp', 'MultiFacet')
-    vis_samples()
-    # make_tsne('fhp', 'MarioPuzzle', n=100)
-    # make_tsne('lgp', 'MultiFacet', n=100)
-    pass

pyproject.toml DELETED Viewed

@@ -1,21 +0,0 @@
-[tool.poetry]
-name = "ncerl"
-version = "0.1.0"
-description = ""
-authors = ["Ziqi Wang"]
-readme = "README.md"
-[tool.poetry.dependencies]
-python = "^3.9"
-JPype1 = "1.3.0"
-dtw = "1.4.0"
-torch = "1.8.1"
-numpy = "^2.0.0"
-pillow = "10.0.0"
-matplotlib = "3.6.3"
-pandas = "1.3.2"
-[build-system]
-requires = ["poetry-core"]
-build-backend = "poetry.core.masonry.api"

requirements.txt CHANGED Viewed

Binary files a/requirements.txt and b/requirements.txt differ

src/drl/egsac/train_egsac.py CHANGED Viewed

@@ -71,6 +71,7 @@ def train_EGSAC(args):
         return
     device = 'cpu' if args.gpuid < 0 or not torch.cuda.is_available() else f'cuda:{args.gpuid}'
     rfunc = importlib.import_module('src.env.rfuncs').__getattribute__(f'{args.rfunc_name}')()
     with open(res_path + '/run_config.txt', 'w') as f:
         f.write(time.strftime('%Y-%m-%d %H:%M') + '\n')
@@ -83,8 +84,7 @@ def train_EGSAC(args):
         f.write('-' * 50 + '\n')
         f.write(str(rfunc))
     hist_len = rfunc.get_n()
-    # with open(f'{res_path}/hist_len.json', 'w') as f:
-    #     json.dump(hist_len, f)
     with open(f'{res_path}/cfgs.json', 'w') as f:
         data = {'N': hist_len, 'gamma': args.gamma, 'h': args.eplen, 'rfunc': args.rfunc_name}
         json.dump(data, f)

         return
     device = 'cpu' if args.gpuid < 0 or not torch.cuda.is_available() else f'cuda:{args.gpuid}'
+    # 动态导入reward function
     rfunc = importlib.import_module('src.env.rfuncs').__getattribute__(f'{args.rfunc_name}')()
     with open(res_path + '/run_config.txt', 'w') as f:
         f.write(time.strftime('%Y-%m-%d %H:%M') + '\n')
         f.write('-' * 50 + '\n')
         f.write(str(rfunc))
     hist_len = rfunc.get_n()
     with open(f'{res_path}/cfgs.json', 'w') as f:
         data = {'N': hist_len, 'gamma': args.gamma, 'h': args.eplen, 'rfunc': args.rfunc_name}
         json.dump(data, f)

src/drl/sunrise/train_sunrise.py CHANGED Viewed

@@ -141,7 +141,6 @@ def get_trainer(args, obs_dim, action_dim, path, device):
     trainer = NeurIPS20SACEnsembleTrainer(
-        # env=eval_env,
         policy=L_policy,
         qf1=L_qf1,
         qf2=L_qf2,
@@ -159,7 +158,6 @@ def get_trainer(args, obs_dim, action_dim, path, device):
         **variant['trainer_kwargs']
     )
     return trainer
-    pass
 def get_algo(args, rfunc, device, path):
     algorithm = AsyncOffPolicyALgo(
@@ -178,6 +176,7 @@ def get_algo(args, rfunc, device, path):
     return algorithm
 def train_SUNRISE(args):
     if not args.path:
         path = auto_dire('training_data', args.name)
     else:
@@ -192,6 +191,8 @@ def train_SUNRISE(args):
         print(f'Trainning at <{path}> is skipped as there has a finished trial already.')
         return
     device = 'cpu' if args.gpuid < 0 or not torch.cuda.is_available() else f'cuda:{args.gpuid}'
     rfunc = importlib.import_module('src.env.rfuncs').__getattribute__(f'{args.rfunc}')()
     with open(path + '/run_configuration.txt', 'w') as f:
@@ -217,9 +218,3 @@ def train_SUNRISE(args):
     trainer = get_trainer(args, obs_dim, action_dim, path, device)
     algorithm = get_algo(args, rfunc, device, path)
     _, timecost = record_time(algorithm.train)(env, trainer, args.budget, args.inference_type, path)
-    pass
-if __name__ == '__main__':
-    pass

     trainer = NeurIPS20SACEnsembleTrainer(
         policy=L_policy,
         qf1=L_qf1,
         qf2=L_qf2,
         **variant['trainer_kwargs']
     )
     return trainer
 def get_algo(args, rfunc, device, path):
     algorithm = AsyncOffPolicyALgo(
     return algorithm
 def train_SUNRISE(args):
+    # 创建目录
     if not args.path:
         path = auto_dire('training_data', args.name)
     else:
         print(f'Trainning at <{path}> is skipped as there has a finished trial already.')
         return
     device = 'cpu' if args.gpuid < 0 or not torch.cuda.is_available() else f'cuda:{args.gpuid}'
+    # 导入reward function
     rfunc = importlib.import_module('src.env.rfuncs').__getattribute__(f'{args.rfunc}')()
     with open(path + '/run_configuration.txt', 'w') as f:
     trainer = get_trainer(args, obs_dim, action_dim, path, device)
     algorithm = get_algo(args, rfunc, device, path)
     _, timecost = record_time(algorithm.train)(env, trainer, args.budget, args.inference_type, path)

src/drl/train_async.py CHANGED Viewed

@@ -36,6 +36,9 @@ def set_common_args(parser):
     )
 def drl_train(foo):
     def __inner(args):
         if not args.path:
             path = auto_dire('training_data', args.name)
@@ -74,6 +77,7 @@ def drl_train(foo):
             json.dump(data, f)
         obs_dim, act_dim = env.histlen * nz, nz
         agent = foo(args, path, device, obs_dim, act_dim)
         agent.to(device)
@@ -89,6 +93,7 @@ def set_AsyncSAC_parser(parser):
     set_common_args(parser)
     parser.add_argument('--name', type=str, default='AsyncSAC', help='Name of this algorithm.')
 @drl_train
 def train_AsyncSAC(args, path, device, obs_dim, act_dim):
     actor = SoftActor(
@@ -116,12 +121,16 @@ def set_NCESAC_parser(parser):
 @drl_train
 def train_NCESAC(args, path, device, obs_dim, act_dim):
     me_reg, actor_nn_constructor = None, None
     if args.me_type == 'log':
         me_reg = LogWassersteinExclusion(args.lbd)
     elif args.me_type == 'clip':
         me_reg = ClipExclusion(args.lbd)
     elif args.me_type == 'logclip':
         me_reg = LogClipExclusion(args.lbd)
     if args.actor_net_type == 'conv':
         actor_nn_constructor = lambda: EsmbGaussianConv(
             obs_dim, act_dim, args.actor_hiddens, args.actor_hiddens, args.m
@@ -130,7 +139,11 @@ def train_NCESAC(args, path, device, obs_dim, act_dim):
         actor_nn_constructor = lambda: EsmbGaussianMLP(
             obs_dim, act_dim, args.actor_hiddens, args.actor_hiddens, args.m
         )
     actor = MERegMixSoftActor(actor_nn_constructor, me_reg, tar_ent=args.tar_entropy)
     critic = MERegSoftDoubleClipCriticQ(
         lambda : ObsActMLP(obs_dim, act_dim, args.critic_hiddens),
         gamma=args.gamma, tau=args.tau
@@ -139,6 +152,8 @@ def train_NCESAC(args, path, device, obs_dim, act_dim):
         lambda : ObsActMLP(obs_dim, act_dim, args.critic_hiddens),
         gamma=args.gamma, tau=args.tau
     )
     with open(f'{path}/nn_architecture.txt', 'w') as f:
         f.writelines([
             '-' * 24 + 'Actor' + '-' * 24 + '\n', actor.get_nn_arch_str(),

     )
 def drl_train(foo):
+    """
+    DRL Train, foo是被调用的函数, 如train_AsyncSAC.
+    """
     def __inner(args):
         if not args.path:
             path = auto_dire('training_data', args.name)
             json.dump(data, f)
         obs_dim, act_dim = env.histlen * nz, nz
+        # 根据foo的不同返回agent, 返回的类型是ActCrtAgent
         agent = foo(args, path, device, obs_dim, act_dim)
         agent.to(device)
     set_common_args(parser)
     parser.add_argument('--name', type=str, default='AsyncSAC', help='Name of this algorithm.')
+#同样的sac训练，但是多了异步
 @drl_train
 def train_AsyncSAC(args, path, device, obs_dim, act_dim):
     actor = SoftActor(
 @drl_train
 def train_NCESAC(args, path, device, obs_dim, act_dim):
     me_reg, actor_nn_constructor = None, None
+    # 初始化不同的正则化器
     if args.me_type == 'log':
         me_reg = LogWassersteinExclusion(args.lbd)
     elif args.me_type == 'clip':
         me_reg = ClipExclusion(args.lbd)
     elif args.me_type == 'logclip':
         me_reg = LogClipExclusion(args.lbd)
+    # 初始化不同的 网络构造器
     if args.actor_net_type == 'conv':
         actor_nn_constructor = lambda: EsmbGaussianConv(
             obs_dim, act_dim, args.actor_hiddens, args.actor_hiddens, args.m
         actor_nn_constructor = lambda: EsmbGaussianMLP(
             obs_dim, act_dim, args.actor_hiddens, args.actor_hiddens, args.m
         )
+    # 初始化Actor
     actor = MERegMixSoftActor(actor_nn_constructor, me_reg, tar_ent=args.tar_entropy)
+    # 初始化Critic
     critic = MERegSoftDoubleClipCriticQ(
         lambda : ObsActMLP(obs_dim, act_dim, args.critic_hiddens),
         gamma=args.gamma, tau=args.tau
         lambda : ObsActMLP(obs_dim, act_dim, args.critic_hiddens),
         gamma=args.gamma, tau=args.tau
     )
+    # 保存神经网络架构
     with open(f'{path}/nn_architecture.txt', 'w') as f:
         f.writelines([
             '-' * 24 + 'Actor' + '-' * 24 + '\n', actor.get_nn_arch_str(),

src/drl/train_sinproc.py CHANGED Viewed

@@ -30,24 +30,30 @@ def set_common_args(parser):
 def drl_train(foo):
     def __inner(args):
         if not args.path:
             path = auto_dire('training_data', args.name)
         else:
             path = getpath('training_data', args.path)
             os.makedirs(path, exist_ok=True)
         if os.path.exists(f'{path}/policy.pth'):
             print(f'Trainning at <{path}> is skipped as there has a finished trial already.')
             return
         device = 'cpu' if args.gpuid < 0 or not torch.cuda.is_available() else f'cuda:{args.gpuid}'
         rfunc = importlib.import_module('src.env.rfuncs').__getattribute__(f'{args.rfunc}')()
         env = SingleProcessOLGenEnv(rfunc, get_decoder('models/decoder.pth'), args.eplen, device=device)
         loggers = [
             AsyncCsvLogger(f'{path}/log.csv', rfunc),
             AsyncStdLogger(rfunc, 2000, f'{path}/log.txt' if args.redirect else '')
         ]
         if args.periodic_gen_num > 0:
             loggers.append(GenResLogger(path, args.periodic_gen_num, args.gen_period))
         with open(path + '/run_configuration.txt', 'w') as f:
             f.write(time.strftime('%Y-%m-%d %H:%M') + '\n')
             f.write(f'---------{args.name}---------\n')
@@ -59,14 +65,18 @@ def drl_train(foo):
             f.write('-' * 50 + '\n')
             f.write(str(rfunc))
         N = rfunc.get_n()
         with open(f'{path}/cfgs.json', 'w') as f:
             data = {'N': N, 'gamma': args.gamma, 'h': args.eplen, 'rfunc': args.rfunc}
             json.dump(data, f)
         obs_dim, act_dim = env.hist_len * nz, nz
         agent = foo(args, path, device, obs_dim, act_dim)
         agent.to(device)
         trainer = SinProcOffpolicyTrainer(
             ReplayMem(args.mem_size, device=device), update_per=args.update_per, batch=args.batch
         )
@@ -76,10 +86,12 @@ def drl_train(foo):
     return __inner
 ############### SAC ###############
 def set_SAC_parser(parser):
     set_common_args(parser)
     parser.add_argument('--name', type=str, default='SAC', help='Name of this algorithm.')
 @drl_train
 def train_SAC(args, path, device, obs_dim, act_dim):
     actor = SoftActor(
@@ -88,6 +100,7 @@ def train_SAC(args, path, device, obs_dim, act_dim):
     critic = SoftDoubleClipCriticQ(
         lambda : ObsActMLP(obs_dim, act_dim, args.critic_hiddens), gamma=args.gamma, tau=args.tau
     )
     with open(f'{path}/nn_architecture.txt', 'w') as f:
         f.writelines([
             '-' * 24 + 'Actor' + '-' * 24 + '\n', actor.get_nn_arch_str(),

 def drl_train(foo):
     def __inner(args):
+        # 设置保存路径
         if not args.path:
             path = auto_dire('training_data', args.name)
         else:
             path = getpath('training_data', args.path)
             os.makedirs(path, exist_ok=True)
+        # 检查是否已经存在训练完成的模型
         if os.path.exists(f'{path}/policy.pth'):
             print(f'Trainning at <{path}> is skipped as there has a finished trial already.')
             return
         device = 'cpu' if args.gpuid < 0 or not torch.cuda.is_available() else f'cuda:{args.gpuid}'
+        # 导入reward函数
         rfunc = importlib.import_module('src.env.rfuncs').__getattribute__(f'{args.rfunc}')()
         env = SingleProcessOLGenEnv(rfunc, get_decoder('models/decoder.pth'), args.eplen, device=device)
+        # 设置日志记录器
         loggers = [
             AsyncCsvLogger(f'{path}/log.csv', rfunc),
             AsyncStdLogger(rfunc, 2000, f'{path}/log.txt' if args.redirect else '')
         ]
         if args.periodic_gen_num > 0:
             loggers.append(GenResLogger(path, args.periodic_gen_num, args.gen_period))
+        # 保存运行配置
         with open(path + '/run_configuration.txt', 'w') as f:
             f.write(time.strftime('%Y-%m-%d %H:%M') + '\n')
             f.write(f'---------{args.name}---------\n')
             f.write('-' * 50 + '\n')
             f.write(str(rfunc))
         N = rfunc.get_n()
+        # 保存配置文件
         with open(f'{path}/cfgs.json', 'w') as f:
             data = {'N': N, 'gamma': args.gamma, 'h': args.eplen, 'rfunc': args.rfunc}
             json.dump(data, f)
+        # 设置观察和动作维度
         obs_dim, act_dim = env.hist_len * nz, nz
+        # 创建代理
         agent = foo(args, path, device, obs_dim, act_dim)
         agent.to(device)
+        # 创建训练器
         trainer = SinProcOffpolicyTrainer(
             ReplayMem(args.mem_size, device=device), update_per=args.update_per, batch=args.batch
         )
     return __inner
 ############### SAC ###############
+# 设置SAC参数的函数
 def set_SAC_parser(parser):
     set_common_args(parser)
     parser.add_argument('--name', type=str, default='SAC', help='Name of this algorithm.')
+# SAC训练函数
 @drl_train
 def train_SAC(args, path, device, obs_dim, act_dim):
     actor = SoftActor(
     critic = SoftDoubleClipCriticQ(
         lambda : ObsActMLP(obs_dim, act_dim, args.critic_hiddens), gamma=args.gamma, tau=args.tau
     )
+    # 保存神经网络架构
     with open(f'{path}/nn_architecture.txt', 'w') as f:
         f.writelines([
             '-' * 24 + 'Actor' + '-' * 24 + '\n', actor.get_nn_arch_str(),

src/env/environments.py CHANGED Viewed

@@ -43,7 +43,7 @@ class SingleProcessOLGenEnv(gym.Env):
         self.device = device
         self.action_space = gym.spaces.Box(-1, 1, (nz,))
         self.observation_space = gym.spaces.Box(-1, 1, (self.hist_len * nz,))
-        # self.obs_queue = RingQueue(self.hist_len)
         self.lat_vecs = []
         self.simulator = MarioProxy()
         pass
@@ -62,7 +62,6 @@ class SingleProcessOLGenEnv(gym.Env):
     def __evalute(self):
         z = torch.tensor(np.stack(self.lat_vecs).reshape([-1, nz, 1, 1]), device=self.device, dtype=torch.float)
-        # print(z.shape)
         segs = process_onehot(self.decoder(z))
         lvl = lvlhcat(segs)
         simlt_res = MarioProxy.get_seg_infos(self.simulator.simulate_complete(lvl))
@@ -123,6 +122,7 @@ class AsyncOlGenEnv:
         self.decoder = decoder
         self.decoder.to(device)
         self.device = device
         self.eval_pool = eval_pool
         self.eplen = eplen
         self.tid = 0
@@ -250,7 +250,6 @@ class SyncOLGenWorkerEnv(gym.Env):
         done = self.counter >= self.eplen
         if done:
             full_level = lvlhcat(self.segs)
-            # full_level = self.repairer.repair(full_level)
             w = MarioLevel.seg_width
             segs = [full_level[:, s: s + w] for s in range(0, full_level.w, w)]
             if self.mario_proxy:
@@ -352,14 +351,12 @@ class VecOLGenEnv(SubprocVecEnv):
         target_remotes = self._get_target_remotes(env_ids)
         n_inits = 1 if self.init_one else self.hist_len
-        # latvecs = [sample_latvec(n_inits, tensor=False) for _ in range(len(env_ids))]
         latvecs = [self.latvec_set[random.sample(range(len(self.latvec_set)), n_inits)] for _ in range(len(env_ids))]
         with torch.no_grad():
             segss = [[] for _ in range(len(env_ids))]
             for i in range(len(env_ids)):
                 z = torch.tensor(latvecs[i]).view(-1, nz, 1, 1).to(self.device)
-                # print(self.decoder(z).shape)
                 segss[i] = [process_onehot(self.decoder(z))] if self.init_one else process_onehot(self.decoder(z))
         for remote, latvec, segs in zip(target_remotes, latvecs, segss):
             kwargs = {'backup_latvecs': latvec, 'backup_strsegs': [str(seg) for seg in segs]}

         self.device = device
         self.action_space = gym.spaces.Box(-1, 1, (nz,))
         self.observation_space = gym.spaces.Box(-1, 1, (self.hist_len * nz,))
         self.lat_vecs = []
         self.simulator = MarioProxy()
         pass
     def __evalute(self):
         z = torch.tensor(np.stack(self.lat_vecs).reshape([-1, nz, 1, 1]), device=self.device, dtype=torch.float)
         segs = process_onehot(self.decoder(z))
         lvl = lvlhcat(segs)
         simlt_res = MarioProxy.get_seg_infos(self.simulator.simulate_complete(lvl))
         self.decoder = decoder
         self.decoder.to(device)
         self.device = device
+        # mario simulator 在eval_pool里面
         self.eval_pool = eval_pool
         self.eplen = eplen
         self.tid = 0
         done = self.counter >= self.eplen
         if done:
             full_level = lvlhcat(self.segs)
             w = MarioLevel.seg_width
             segs = [full_level[:, s: s + w] for s in range(0, full_level.w, w)]
             if self.mario_proxy:
         target_remotes = self._get_target_remotes(env_ids)
         n_inits = 1 if self.init_one else self.hist_len
         latvecs = [self.latvec_set[random.sample(range(len(self.latvec_set)), n_inits)] for _ in range(len(env_ids))]
         with torch.no_grad():
             segss = [[] for _ in range(len(env_ids))]
             for i in range(len(env_ids)):
                 z = torch.tensor(latvecs[i]).view(-1, nz, 1, 1).to(self.device)
                 segss[i] = [process_onehot(self.decoder(z))] if self.init_one else process_onehot(self.decoder(z))
         for remote, latvec, segs in zip(target_remotes, latvecs, segss):
             kwargs = {'backup_latvecs': latvec, 'backup_strsegs': [str(seg) for seg in segs]}

src/env/rfunc.py CHANGED Viewed

@@ -44,6 +44,9 @@ class RewardTerm:
 class Playability(RewardTerm):
     def __init__(self, magnitude=1):
         super(Playability, self).__init__(True)
         self.magnitude=magnitude
@@ -57,6 +60,9 @@ class Playability(RewardTerm):
 class MeanDivergenceFun(RewardTerm):
     def __init__(self, goal_div, n=defaults['n'], s=8):
         super().__init__(False)
         self.l = goal_div * 0.26 / 0.6
@@ -74,7 +80,6 @@ class MeanDivergenceFun(RewardTerm):
             divergences = []
             while k * self.s <= (min(self.n, i) - 1) * MarioLevel.seg_width:
                 cmp_seg = histroy[:, k * self.s: k * self.s + MarioLevel.seg_width]
-                # print(i, nd, cmp_seg.shape)
                 divergences.append(tile_pattern_js_div(seg, cmp_seg))
                 k += 1
             mean_d = sum(divergences) / len(divergences)
@@ -211,9 +216,5 @@ class HistoricalDeviation(RewardTerm):
 if __name__ == '__main__':
-    # print(type(ceil(0.2)))
-    # arr = [1., 3., 2.]
-    # arr.sort()
-    # print(arr)
     rfunc = HistoricalDeviation()

 class Playability(RewardTerm):
+    """
+    可玩性
+    """
     def __init__(self, magnitude=1):
         super(Playability, self).__init__(True)
         self.magnitude=magnitude
 class MeanDivergenceFun(RewardTerm):
+    """
+    多样性
+    """
     def __init__(self, goal_div, n=defaults['n'], s=8):
         super().__init__(False)
         self.l = goal_div * 0.26 / 0.6
             divergences = []
             while k * self.s <= (min(self.n, i) - 1) * MarioLevel.seg_width:
                 cmp_seg = histroy[:, k * self.s: k * self.s + MarioLevel.seg_width]
                 divergences.append(tile_pattern_js_div(seg, cmp_seg))
                 k += 1
             mean_d = sum(divergences) / len(divergences)
 if __name__ == '__main__':
     rfunc = HistoricalDeviation()

src/gan/adversarial_train.py CHANGED Viewed

@@ -87,7 +87,6 @@ def train_GAN(args):
         w = csv.writer(f)
         w.writerow(['key', 'value', ''])
         w.writerows(list(cfgs.items()))
-    # pds.DataFrame.from_dict(cfgs, orient='index', columns=['value']).to_csv(f'{path_}/cfgs.csv')
     start_time = time.time()
     log_target = open(f'{res_path}/logs.csv', 'w')
@@ -120,26 +119,6 @@ def train_GAN(args):
                 loss_G = -netD(fake).mean()
                 loss_G.backward()
                 optG.step()
-        # # Evaluate
-        # if t % args.eval_itv == (args.eval_itv - 1):
-        #     netG.eval()
-        #     netD.eval()
-        #     with torch.no_grad():
-        #         real = torch.stack(data[:min(100, len(data))])
-        #         z = sample_latvec(100, device=device, distribuion=args.noise)
-        #         fake = netG(z)
-        #         y_real = netD(real).mean().item()
-        #         y_fake = netD(fake).mean().item()
-        #     # hamming_divs, tpjs_divs = evaluate_diversity(process_onehot(fake))
-        #
-        #     # items = (t+1, y_real, y_fake, hamming_divs, tpjs_divs, time.time() - start_time)
-        #     # log_writer.writerow(items)
-        #     print(
-        #         'Iteration %d, y-real=%.3g, y-fake=%.3g, Hamming-divs: %.5g, TPJS-divs: %.5g, '
-        #         'time: %.1fs' % items
-        #     )
-        #     netD.train()
-        #     netG.train()
         if t % args.save_itv == (args.save_itv - 1):
             netG.eval()
             netD.eval()

         w = csv.writer(f)
         w.writerow(['key', 'value', ''])
         w.writerows(list(cfgs.items()))
     start_time = time.time()
     log_target = open(f'{res_path}/logs.csv', 'w')
                 loss_G = -netD(fake).mean()
                 loss_G.backward()
                 optG.step()
         if t % args.save_itv == (args.save_itv - 1):
             netG.eval()
             netD.eval()

src/gan/gankits.py CHANGED Viewed

@@ -3,7 +3,7 @@ from src.smb.level import MarioLevel
 from src.gan.gans import nz
 from src.utils.filesys import getpath
 def sample_latvec(n=1, device='cpu', distribuion='uniform'):
     if distribuion == 'uniform':
         return torch.rand(n, nz, 1, 1, device=device) * 2 - 1
@@ -12,6 +12,7 @@ def sample_latvec(n=1, device='cpu', distribuion='uniform'):
     else:
         raise TypeError(f'unknow noise distribution: {distribuion}')
 def process_onehot(raw_tensor_onehot):
     H, W = MarioLevel.height, MarioLevel.seg_width
     res = []
@@ -26,6 +27,5 @@ def get_decoder(path='models/decoder.pth', device='cpu'):
     decoder.requires_grad_(False)
     decoder.eval()
     return decoder
-    pass

 from src.gan.gans import nz
 from src.utils.filesys import getpath
+# 采样噪声
 def sample_latvec(n=1, device='cpu', distribuion='uniform'):
     if distribuion == 'uniform':
         return torch.rand(n, nz, 1, 1, device=device) * 2 - 1
     else:
         raise TypeError(f'unknow noise distribution: {distribuion}')
+# 处理onehot数组
 def process_onehot(raw_tensor_onehot):
     H, W = MarioLevel.height, MarioLevel.seg_width
     res = []
     decoder.requires_grad_(False)
     decoder.eval()
     return decoder

src/gan/gans.py CHANGED Viewed

@@ -5,7 +5,7 @@ from src.utils.dl import SelfAttn
 nz = 20
 class SAGenerator(nn.Module):
     def __init__(self, base_channels=32):
         super(SAGenerator, self).__init__()

 nz = 20
+# Self Attention GAN
 class SAGenerator(nn.Module):
     def __init__(self, base_channels=32):
         super(SAGenerator, self).__init__()

src/olgen/olg_policy.py CHANGED Viewed

@@ -1,6 +1,6 @@
 import glob
 import random
-from abc import abstractmethod, abstractstaticmethod
 import numpy as np
 import torch
 from src.utils.filesys import getpath
@@ -49,8 +49,6 @@ class RLGenPolicy(GenPolicy):
         if d < nz * self.n:
             obs = torch.cat([torch.zeros([b, nz * self.n - d], device=self.device), obs], dim=-1)
         with torch.no_grad():
-            # mus, sigmas, betas = self.model.get_intermediate(obs)
-            # print(mus[0].cpu().numpy(), '\n', betas[0].cpu().numpy(), '\n')
             model_output, _ = self.model(obs)
         return torch.clamp(model_output, -1, 1).squeeze().cpu().numpy()
@@ -60,43 +58,6 @@ class RLGenPolicy(GenPolicy):
         n = load_cfgs(path, 'N')
         return RLGenPolicy(model, n, device)
-#
-# class SunriseGenPolicy(GenPolicy):
-#     def __init__(self, models, n, device='cpu'):
-#         super(SunriseGenPolicy, self).__init__(n)
-#         for model in models:
-#             model.to(device)
-#         self.models = models
-#         self.m = len(self.models)
-#
-#         self.agent = SunriseProxyAgent(models, device)
-#
-#     def step(self, obs):
-#         actions = [m(obs.unsqueeze()).squeeze().cpu().numpy() for m in self.models]
-#         if len(obs.shape) == 1:
-#             return random.choice(actions)
-#         else:
-#             actions = np.array(actions)
-#             selections = [random.choice(range(self.m)) for _ in range(len(obs))]
-#             selected = [actions[s, i, :] for i, s in enumerate(selections)]
-#             return np.array(selected)
-#     #
-#     # def reset(self):
-#     #     # self.agent.reset()
-#     #     pass
-#
-#     @staticmethod
-#     def from_path(path, device='cpu'):
-#         models = [
-#             torch.load(p, map_location=device)
-#             for p in glob.glob(getpath(path, 'policy*.pth'))
-#         ]
-#         n = load_cfgs(path, 'N')
-#         return SunriseGenPolicy(models, n, device)
-#
-#     # @property
-#     # def device(self):
-#     #     return self.agent.device
 class EnsembleGenPolicy(GenPolicy):
@@ -114,20 +75,25 @@ class EnsembleGenPolicy(GenPolicy):
         actions = []
         with torch.no_grad():
             for m in self.models:
-                a = m(o)
                 if type(a) == tuple:
                     a = a[0]
                 actions.append(torch.clamp(a, -1, 1).cpu().numpy())
         if len(obs.shape) == 1:
             return random.choice(actions)
         else:
             actions = np.array(actions)
             selections = [random.choice(range(self.m)) for _ in range(len(obs))]
             selected = [actions[s, i, :] for i, s in enumerate(selections)]
             return np.array(selected)
     @staticmethod
     def from_path(path, device='cpu'):
         models = [
             torch.load(p, map_location=device)
             for p in glob.glob(getpath(path, 'policy*.pth'))
@@ -141,9 +107,6 @@ class RandGenPolicy(GenPolicy):
         super(RandGenPolicy, self).__init__(1)
     def step(self, obs):
-        # if len(obs.shape) == 1:
-        #     return sample_latvec(1).squeeze().numpy()
-        # else:
         n = obs.shape[0]
         return sample_latvec(n).squeeze().numpy()

 import glob
 import random
+from abc import abstractmethod
 import numpy as np
 import torch
 from src.utils.filesys import getpath
         if d < nz * self.n:
             obs = torch.cat([torch.zeros([b, nz * self.n - d], device=self.device), obs], dim=-1)
         with torch.no_grad():
             model_output, _ = self.model(obs)
         return torch.clamp(model_output, -1, 1).squeeze().cpu().numpy()
         n = load_cfgs(path, 'N')
         return RLGenPolicy(model, n, device)
 class EnsembleGenPolicy(GenPolicy):
         actions = []
         with torch.no_grad():
             for m in self.models:
+                a = m(o) # action model predict
                 if type(a) == tuple:
                     a = a[0]
                 actions.append(torch.clamp(a, -1, 1).cpu().numpy())
         if len(obs.shape) == 1:
             return random.choice(actions)
         else:
+            # 这里对于每个observation, 选择m个模型, 每个模型都输出一个动作, 然后随机选择其中一个动作
             actions = np.array(actions)
+            # 这里的self.m就是模型的数量, 等价于len(self.models)
             selections = [random.choice(range(self.m)) for _ in range(len(obs))]
             selected = [actions[s, i, :] for i, s in enumerate(selections)]
             return np.array(selected)
     @staticmethod
     def from_path(path, device='cpu'):
+        """
+        读取path中的所有模型
+        """
         models = [
             torch.load(p, map_location=device)
             for p in glob.glob(getpath(path, 'policy*.pth'))
         super(RandGenPolicy, self).__init__(1)
     def step(self, obs):
         n = obs.shape[0]
         return sample_latvec(n).squeeze().numpy()

src/smb/asyncsimlt.py CHANGED Viewed

@@ -54,14 +54,11 @@ def _simlt_worker(remote, parent_remote, rfunc, resource):
                         min_dtw = min(min_dtw, vdtw)
                 remote.send((min_hm, min_dtw))
             elif cmd == 'mpd':
-                # strpairs = data
                 hms, dtws = [], []
                 for strlvl1, strlvl2 in data:
                     lvl1, lvl2 = MarioLevel(strlvl1), MarioLevel(strlvl2)
                     hms.append(hamming_dis(lvl1, lvl2))
-                    # dtws.append(lvl_dtw(lvl1, lvl2))
                 remote.send((hms, None))
-                # remote.send((hms, dtws))
             else:
                 raise KeyError(f'Unknown command for simulation worker: {cmd}')
         except EOFError:
@@ -70,6 +67,9 @@ def _simlt_worker(remote, parent_remote, rfunc, resource):
 class AsycSimltPool:
     def __init__(self, poolsize, queuesize=None, rfunc_name='default', verbose=True, **rsrc):
         self.np, self.nq = poolsize, poolsize if queuesize is None else queuesize
         self.waiting_queue = Queue(self.nq)
@@ -149,6 +149,7 @@ class AsycSimltPool:
         for work_remote, remote in zip(self.work_remotes, self.remotes):
             args = (work_remote, remote, rfunc, resource)
             # daemon=True: if the main process crashes, we should not cause things to hang
             process = ctx.Process(target=_simlt_worker, args=args, daemon=True)  # pytype:disable=attribute-error
             process.start()
             self.processes.append(process)
@@ -162,12 +163,6 @@ class AsycSimltPool:
             time.sleep(0.01)
     def close(self):
-        # finish = False
-        # while not finish:
-        #     self.refresh()
-        #     finish = all(r for r in self.ready)
-        #     time.sleep(0.01)
-        # self.__wait()
         res = self.get(True)
         for remote, p in zip(self.remotes, self.processes):
             remote.send(('close', None))

                         min_dtw = min(min_dtw, vdtw)
                 remote.send((min_hm, min_dtw))
             elif cmd == 'mpd':
                 hms, dtws = [], []
                 for strlvl1, strlvl2 in data:
                     lvl1, lvl2 = MarioLevel(strlvl1), MarioLevel(strlvl2)
                     hms.append(hamming_dis(lvl1, lvl2))
                 remote.send((hms, None))
             else:
                 raise KeyError(f'Unknown command for simulation worker: {cmd}')
         except EOFError:
 class AsycSimltPool:
+    """
+    异步池, 用于多进程马里奥模拟任务
+    """
     def __init__(self, poolsize, queuesize=None, rfunc_name='default', verbose=True, **rsrc):
         self.np, self.nq = poolsize, poolsize if queuesize is None else queuesize
         self.waiting_queue = Queue(self.nq)
         for work_remote, remote in zip(self.work_remotes, self.remotes):
             args = (work_remote, remote, rfunc, resource)
             # daemon=True: if the main process crashes, we should not cause things to hang
+            # 开启多进程来做异步计算
             process = ctx.Process(target=_simlt_worker, args=args, daemon=True)  # pytype:disable=attribute-error
             process.start()
             self.processes.append(process)
             time.sleep(0.01)
     def close(self):
         res = self.get(True)
         for remote, p in zip(self.remotes, self.processes):
             remote.send(('close', None))

src/smb/proxy.py CHANGED Viewed

@@ -9,10 +9,6 @@ from src.smb.level import MarioLevel, LevelRender
 from src.utils.filesys import getpath
 JVMPath = None
-# JVMPath = '/home/cseadmin/java/jdk1.8.0_301/jre/lib/amd64/server/libjvm.so'
-# JVMPath = '/home/liujl_lab/12132362/java/jdk1.8.0_301/jre/lib/amd64/server/libjvm.so'
-# JVMPath = '/home/liujl_lab/12132333/java/jdk1.8.0_301/jre/lib/amd64/server/libjvm.so'
 class MarioJavaAgents(Enum):
     Runner = 'agents.robinBaumgarten'
@@ -27,7 +23,6 @@ class MarioProxy:
     def __init__(self):
         if not jpype.isJVMStarted():
             jar_path = getpath('smb/Mario-AI-Framework.jar')
-            # print(f"-Djava.class.path={jar_path}/Mario-AI-Framework.jar")
             jpype.startJVM(
                 jpype.getDefaultJVMPath() if JVMPath is None else JVMPath,
                 f"-Djava.class.path={jar_path}", '-Xmx2g'
@@ -137,6 +132,3 @@ class MarioProxy:
 if __name__ == '__main__':
     simulator = MarioProxy()
-    # lvl = MarioLevel.from_file('smb/levels/lvl-1.lvl')
-    # print(simulator.simulate_complete(lvl))
-    # print(simulator.play_game(lvl))

 from src.utils.filesys import getpath
 JVMPath = None
 class MarioJavaAgents(Enum):
     Runner = 'agents.robinBaumgarten'
     def __init__(self):
         if not jpype.isJVMStarted():
             jar_path = getpath('smb/Mario-AI-Framework.jar')
             jpype.startJVM(
                 jpype.getDefaultJVMPath() if JVMPath is None else JVMPath,
                 f"-Djava.class.path={jar_path}", '-Xmx2g'
 if __name__ == '__main__':
     simulator = MarioProxy()

src/utils/img.py CHANGED Viewed

@@ -10,7 +10,6 @@ def make_img_sheet(imgs, ncols, x_margin=6, y_margin=6, save_path='./image.png',
     w_canvas = (w + x_margin) * ncols - x_margin
     h_canvas = (h + y_margin) * nrows - y_margin
     canvas = Image.new('RGBA', (w_canvas, h_canvas), (0, 0, 0, 0))
-    # canvas.fill(margin_color)
     for i in range(len(imgs)):
         row_id, col_id = i // ncols, i % ncols
         canvas.paste(imgs[i], ((w + x_margin) * col_id, (h + y_margin) * row_id), imgs[i])

     w_canvas = (w + x_margin) * ncols - x_margin
     h_canvas = (h + y_margin) * nrows - y_margin
     canvas = Image.new('RGBA', (w_canvas, h_canvas), (0, 0, 0, 0))
     for i in range(len(imgs)):
         row_id, col_id = i // ncols, i % ncols
         canvas.paste(imgs[i], ((w + x_margin) * col_id, (h + y_margin) * row_id), imgs[i])

test_ddpm.py CHANGED Viewed

@@ -4,16 +4,10 @@ import torch
 import torch.optim as optim
 import torch.nn as nn
 import logging
-# from tqdm import tqdm
-# from torch.utils.tensorboard import SummaryWriter
 from src.ddpm.diffusion import Diffusion
 from src.ddpm.modules import UNet
-# from pytorch_model_summary import summary
-# from matplotlib import pyplot as plt
 from src.ddpm.dataset import create_dataloader
-# from utils.plot import get_img_from_level
 from pathlib import Path
-# from src.smb.level import MarioLevel
 import argparse
 import datetime
@@ -21,16 +15,12 @@ from src.gan.gankits import process_onehot, get_decoder
 from src.smb.level import MarioLevel, lvlhcat, save_batch
 from src.utils.filesys import getpath
 from src.utils.img import make_img_sheet
-# sprite_counts = np.power(np.array([102573, 9114, 1017889, 930, 3032, 7330, 2278, 2279, 5227, 5229, 5419]), 1/4)
 sprite_counts = np.power(np.array([
         74977, 15252, 572591, 5826, 1216, 7302, 237, 237, 2852, 1074, 235, 304, 48, 96, 160, 1871, 936, 186, 428, 80, 428
     ]), 1/4
 )
 min_count = np.min(sprite_counts)
-# filepath = Path(__file__).parent.resolve()
-# DATA_PATH = os.path.join(filepath, "levels", "ground", "unique_onehot.npz")
 def setup_logging(run_name, beta_schedule):
     model_path = os.path.join("models", beta_schedule, run_name)
@@ -39,41 +29,8 @@ def setup_logging(run_name, beta_schedule):
     os.makedirs(result_path, exist_ok=True)
     return model_path, result_path
-# def plot_images(epoch, sampled_images, result_path):
-#     fig = plt.figure(figsize=(30, 15))
-#     for i in range(len(sampled_images)):
-#         ax1 = fig.add_subplot(4, int(len(sampled_images)/4), i+1)
-#         ax1.tick_params(left=False, right=False, labelleft=False, labelbottom=False, bottom=False)
-#         level = sampled_images[i].argmax(dim=0).cpu().numpy()
-#         level_img = get_img_from_level(level)
-#         ax1.imshow(level_img)
-#     plt.savefig(os.path.join(result_path, f"{epoch:04d}_sample.png"))
-#     plt.close()
-# def plot_training_images(epoch, original_img, x_t, noise, predicted_noise, reconstructed_img, training_result_path):
-#     fig = plt.figure(figsize=(15, 10))
-#     for i in range(2):
-#         ax1 = fig.add_subplot(2, 5, i*5+1)
-#         ax1.imshow(get_img_from_level(original_img[i].cpu().numpy()))
-#         ax1.set_title(f"Original {i}")
-#         ax2 = fig.add_subplot(2, 5, i*5+2)
-#         ax2.imshow(get_img_from_level(noise[i].cpu().numpy()))
-#         ax2.set_title(f"Noise {i}")
-#         ax3 = fig.add_subplot(2, 5, i*5+3)
-#         ax3.imshow(get_img_from_level(x_t.argmax(dim=1).cpu().numpy()[i]))
-#         ax3.set_title(f"x_t {i}")
-#         ax4 = fig.add_subplot(2, 5, i*5+4)
-#         ax4.imshow(get_img_from_level(predicted_noise[i].cpu().numpy()))
-#         ax4.set_title(f"Predicted Noise {i}")
-#         ax5 = fig.add_subplot(2, 5, i*5+5)
-#         ax5.imshow(get_img_from_level(reconstructed_img.probs.argmax(dim=-1).cpu().numpy()[i]))
-#         ax5.set_title(f"Reconstructed Image {i}")
-#     plt.savefig(os.path.join(training_result_path, f"{epoch:04d}.png"))
-#     plt.close()
 def train(args):
-    # model_path, result_path = setup_logging(args.run_name, args.beta_schedule)
-    # training_result_path = os.path.join(result_path, "training")
     path = getpath(args.res_path)
     os.makedirs(path, exist_ok=True)
@@ -83,24 +40,15 @@ def train(args):
     optimizer = optim.AdamW(model.parameters(), lr=args.lr)
     mse = nn.MSELoss()
     diffusion = Diffusion(device=device, schedule=args.beta_schedule)
-    # logger = SummaryWriter(os.path.join("logs", args.beta_schedule, args.run_name))
     temperatures = torch.tensor(min_count / sprite_counts, dtype=torch.float32).to(device)
     l = len(dataloader)
-    # print(summary(model, torch.zeros((64, MarioLevel.n_types, 14, 14)).to(device), diffusion.sample_timesteps(64).to(device), show_input=True))
-    # if args.resume_from != 0:
-    #     checkpoint = torch.load(os.path.join(model_path, f'ckpt_{args.resume_from}'))
-    #     model.load_state_dict(checkpoint['model_state_dict'])
-    #     optimizer.load_state_dict(checkpoint['optimizer_state_dict'])
     for epoch in range(args.resume_from+1, args.resume_from+args.epochs+1):
         logging.info(f"Starting epoch {epoch}:")
         epoch_loss = {'rec_loss': 0, 'mse': 0, 'loss': 0}
-        # pbar = tqdm(dataloader)
         for i, images in enumerate(dataloader):
             images = images.to(device)
-            # print(images.shape)
             t = diffusion.sample_timesteps(images.shape[0]).to(device)  # random int from 1~1000
             x_t, noise = diffusion.noise_images(images, t)  # x_t: image with noise at t, noise: gaussian noise
             predicted_noise = model(x_t.float(), t.float()) # returns predicted noise eps_theta
@@ -117,38 +65,13 @@ def train(args):
             loss.backward()
             optimizer.step()
-            # pbar.set_postfix(LOSS=loss.item())
-            # logger.add_scalar("Rec_loss", rec_loss.item(), global_step=(epoch - 1) * l + i)
-            # logger.add_scalar("MSE", mse_loss.item(), global_step=(epoch - 1) * l + i)
-            # logger.add_scalar("LOSS", loss.item(), global_step=(epoch - 1) * l + i)
-        # logger.add_scalar("Epoch_Rec_loss", epoch_loss['rec_loss']/l, global_step=epoch)
-        # logger.add_scalar("Epoch_MSE", epoch_loss['mse']/l, global_step=epoch)
-        # logger.add_scalar("Epoch_LOSS", epoch_loss['loss']/l, global_step=epoch)
         print(
             '\nIteration: %d' % epoch,
             'rec_loss: %.5g' % (epoch_loss['rec_loss']/l),
             'mse: %.5g' % (epoch_loss['mse']/l)
         )
-        # if epoch % 20 == 19:
-        #     sampled_images = diffusion.sample(model, n=50)
-        #     imgs = [lvl.to_img() for lvl in process_onehot(sampled_images[-1])]
-        #     make_img_sheet(imgs, 10, save_path=f'{args.res_path}/sample{epoch+1}.png')
-        # plot_images(epoch, sampled_images[-1], result_path)
-        # plot_training_images(epoch, original_img, x_t, noise.argmax(dim=1), predicted_noise.argmax(dim=1), reconstructed_img, training_result_path)
         if epoch % 1000 == 0:
-            # torch.save(model.state_dict(), os.path.join(model_path, f"ckpt_{epoch:04d}.pt"))
-            # torch.save({
-            #     'epoch': epoch,
-            #     'model_state_dict': model.state_dict(),
-            #     'optimizer_state_dict': optimizer.state_dict(),
-            #     'Epoch_Rec_loss': epoch_loss['rec_loss']/l,
-            #     'Epoch_MSE': epoch_loss['mse']/l,
-            #     'Epoch_LOSS': epoch_loss['loss']/l
-            # }, getpath(f"{args.res_path}/ddpm_{epoch}.pt"))
             itpath = getpath(path, f'it{epoch}')
             os.makedirs(itpath, exist_ok=True)
             model.save(getpath(path, itpath, 'ddpm.pth'))
@@ -173,11 +96,8 @@ def train(args):
 def launch():
     parser = argparse.ArgumentParser()
     parser.add_argument("--epochs", type=int, default=10000)
-    # parser.add_argument("--data_path", type=str, default=DATA_PATH)
     parser.add_argument("--batch_size", type=int, default=256)
     parser.add_argument("--res_path", type=str, default='exp_data/DDPM')
-    # parser.add_argument("--image_size", type=int, default=14)
-    # parser.add_argument("--device", type=str, default="cuda")
     parser.add_argument("--gpuid", type=int, default=0)
     parser.add_argument("--lr", type=float, default=3e-4)
     parser.add_argument("--beta_schedule", type=str, default="quadratic", choices=['linear', 'quadratic', 'sigmoid'])

 import torch.optim as optim
 import torch.nn as nn
 import logging
 from src.ddpm.diffusion import Diffusion
 from src.ddpm.modules import UNet
 from src.ddpm.dataset import create_dataloader
 from pathlib import Path
 import argparse
 import datetime
 from src.smb.level import MarioLevel, lvlhcat, save_batch
 from src.utils.filesys import getpath
 from src.utils.img import make_img_sheet
 sprite_counts = np.power(np.array([
         74977, 15252, 572591, 5826, 1216, 7302, 237, 237, 2852, 1074, 235, 304, 48, 96, 160, 1871, 936, 186, 428, 80, 428
     ]), 1/4
 )
 min_count = np.min(sprite_counts)
 def setup_logging(run_name, beta_schedule):
     model_path = os.path.join("models", beta_schedule, run_name)
     os.makedirs(result_path, exist_ok=True)
     return model_path, result_path
+# 测试DDPM的模型训练
 def train(args):
     path = getpath(args.res_path)
     os.makedirs(path, exist_ok=True)
     optimizer = optim.AdamW(model.parameters(), lr=args.lr)
     mse = nn.MSELoss()
     diffusion = Diffusion(device=device, schedule=args.beta_schedule)
     temperatures = torch.tensor(min_count / sprite_counts, dtype=torch.float32).to(device)
     l = len(dataloader)
     for epoch in range(args.resume_from+1, args.resume_from+args.epochs+1):
         logging.info(f"Starting epoch {epoch}:")
         epoch_loss = {'rec_loss': 0, 'mse': 0, 'loss': 0}
         for i, images in enumerate(dataloader):
             images = images.to(device)
             t = diffusion.sample_timesteps(images.shape[0]).to(device)  # random int from 1~1000
             x_t, noise = diffusion.noise_images(images, t)  # x_t: image with noise at t, noise: gaussian noise
             predicted_noise = model(x_t.float(), t.float()) # returns predicted noise eps_theta
             loss.backward()
             optimizer.step()
         print(
             '\nIteration: %d' % epoch,
             'rec_loss: %.5g' % (epoch_loss['rec_loss']/l),
             'mse: %.5g' % (epoch_loss['mse']/l)
         )
         if epoch % 1000 == 0:
             itpath = getpath(path, f'it{epoch}')
             os.makedirs(itpath, exist_ok=True)
             model.save(getpath(path, itpath, 'ddpm.pth'))
 def launch():
     parser = argparse.ArgumentParser()
     parser.add_argument("--epochs", type=int, default=10000)
     parser.add_argument("--batch_size", type=int, default=256)
     parser.add_argument("--res_path", type=str, default='exp_data/DDPM')
     parser.add_argument("--gpuid", type=int, default=0)
     parser.add_argument("--lr", type=float, default=3e-4)
     parser.add_argument("--beta_schedule", type=str, default="quadratic", choices=['linear', 'quadratic', 'sigmoid'])

test_gen_log.py DELETED Viewed

@@ -1,15 +0,0 @@
-import time
-import argparse
-from tests import evaluate_rewards, evaluate_gen_log
-if __name__ == '__main__':
-    parser = argparse.ArgumentParser()
-    parser.add_argument('--path', type=str)
-    parser.add_argument('--parallel', type=int, default=50)
-    parser.add_argument('--rfunc', type=str)
-    args = parser.parse_args()
-    start = time.time()
-    evaluate_gen_log(args.path, args.rfunc, parallel=args.parallel)
-    print(f'Evaluation for {args.path} finished,', '%.2f' % (time.time() - start))
-    pass

test_gen_samples.py DELETED Viewed

@@ -1,24 +0,0 @@
-import json
-import argparse
-import time
-import numpy as np
-from tests import evaluate_rewards, evaluate_mpd
-from src.smb.level import load_batch
-from src.utils.filesys import getpath
-if __name__ == '__main__':
-    parser = argparse.ArgumentParser()
-    parser.add_argument('--path', type=str)
-    parser.add_argument('--parallel', type=int, default=50)
-    parser.add_argument('--rfunc', type=str)
-    args = parser.parse_args()
-    start = time.time()
-    lvls = load_batch(getpath(args.path, 'samples.lvls'))
-    rewards = [sum(item) for item in evaluate_rewards(lvls, args.rfunc, parallel=args.parallel)]
-    diversity = evaluate_mpd(lvls)
-    with open(getpath(args.path, 'performance.csv'), 'w') as f:
-        json.dump({'reward': np.mean(rewards), 'diversity': diversity}, f)
-    print(f'Evaluation for {args.path} finished,', '%.2f' % (time.time() - start))
-    pass

tests.py DELETED Viewed

@@ -1,140 +0,0 @@
-import csv
-import time
-import torch
-from plots import print_compare_tab_nonrl
-from src.gan.gankits import *
-from src.smb.level import *
-from itertools import combinations, chain
-from src.utils.filesys import getpath
-from src.smb.asyncsimlt import AsycSimltPool
-def evaluate_rewards(lvls, rfunc='default', dest_path='', parallel=1, eval_pool=None):
-    internal_pool = eval_pool is None
-    if internal_pool:
-        eval_pool = AsycSimltPool(parallel, rfunc_name=rfunc, verbose=False, test=True)
-    res = []
-    for lvl in lvls:
-        eval_pool.put('evaluate', (0, str(lvl)))
-        buffer = eval_pool.get()
-        for _, item in buffer:
-            res.append([sum(r) for r in zip(*item.values())])
-    if internal_pool:
-        buffer = eval_pool.close()
-    else:
-        buffer = eval_pool.get(True)
-    for _, item in buffer:
-        res.append([sum(r) for r in zip(*item.values())])
-    if len(dest_path):
-        np.save(dest_path, res)
-    return res
-def evaluate_mpd(lvls, parallel=2):
-    task_datas = [[] for _ in range(parallel)]
-    for i, (A, B) in enumerate(combinations(lvls, 2)):
-        # lvlA, lvlB = lvls[i * 2], lvls[i * 2 + 1]
-        task_datas[i % parallel].append((str(A), str(B)))
-    hms, dtws = [], []
-    eval_pool = AsycSimltPool(parallel, verbose=False)
-    for task_data in task_datas:
-        eval_pool.put('mpd', task_data)
-    res = eval_pool.get(wait=True)
-    for task_hms, _ in res:
-        hms += task_hms
-    return np.mean(hms)
-def evaluate_gen_log(path, rfunc_name, parallel=5):
-    f = open(getpath(f'{path}/step_tests.csv'), 'w', newline='')
-    wrtr = csv.writer(f)
-    cols = ['step', 'r-avg', 'r-std', 'diversity']
-    wrtr.writerow(cols)
-    start_time = time.time()
-    for lvls, name in traverse_batched_level_files(f'{path}/gen_log'):
-        step = name[4:]
-        rewards = [sum(item) for item in evaluate_rewards(lvls, rfunc_name, parallel=parallel)]
-        r_avg, r_std = np.mean(rewards), np.std(rewards)
-        mpd = evaluate_mpd(lvls, parallel=parallel)
-        line = [step, r_avg, r_std, mpd]
-        wrtr.writerow(line)
-        f.flush()
-        print(
-            f'{path}: step{step} evaluated in {time.time()-start_time:.1f}s -- '
-            + '; '.join(f'{k}: {v}' for k, v in zip(cols, line))
-        )
-    f.close()
-    pass
-if __name__ == '__main__':
-    # print_compare_tab_nonrl()
-    arr = [[1, 2], [1, 2]]
-    arr = [*chain(*arr)]
-    print(arr)
-    for i in range(5):
-        path = f'training_data/GAN{i}'
-        lvls = []
-        init_lateves = torch.tensor(np.load(getpath('analysis/initial_seg.npy')), device='cuda:0')
-        decoder = get_decoder(device='cuda:0')
-        init_seg_onehots = decoder(init_lateves.view(*init_lateves.shape, 1, 1))
-        gan = get_decoder(f'{path}/decoder.pth', device='cuda:0')
-        for init_seg_onehot in init_seg_onehots:
-            seg_onehots = gan(sample_latvec(25, device='cuda:0'))
-            a = init_seg_onehot.view(1, *init_seg_onehot.shape)
-            b = seg_onehots
-            # print(a.shape, b.shape)
-            segs = process_onehot(torch.cat([a, b], dim=0))
-            level = lvlhcat(segs)
-            lvls.append(level)
-        save_batch(lvls, getpath(path, 'samples.lvls'))
-        lvls = load_batch(f'{path}/samples.lvls')[:15]
-        imgs = [lvl.to_img() for lvl in lvls]
-        make_img_sheet(imgs, 1, save_path=f'generation_results/GAN/trial{i+1}/sample_lvls.png')
-    ts = torch.tensor([
-        [[0, 0], [0, 1], [0, 2]],
-        [[1, 0], [1, 1], [1, 2]],
-    ])
-    print(ts.shape)
-    print(ts[[*range(2)], [1, 2], :])
-    task = 'fhp'
-    parallel = 50
-    samples = []
-    for algo in ['dvd', 'egsac', 'pmoe', 'sunrise', 'asyncsac', 'sac']:
-        for t in range(5):
-            lvls = load_batch(getpath('test_data', algo, task, f't{t + 1}', 'samples.lvls'))
-            samples += lvls
-    for l in ['0.0', '0.1', '0.2', '0.3', '0.4', '0.5']:
-        for t in range(5):
-            lvls = load_batch(getpath('test_data', f'varpm-{task}', f'l{l}_m5', f't{t + 1}', 'samples.lvls'))
-            samples += lvls
-    # task_datas = [[] for _ in range(parallel)]
-    # for i, (A, B) in enumerate(combinations(samples, 2)):
-    #     lvlA, lvlB = lvls[i * 2], lvls[i * 2 + 1]
-        # task_datas[i % parallel].append((str(A), str(B)))
-    distmat = []
-    eval_pool = AsycSimltPool(parallel, verbose=False)
-    for A in samples:
-        eval_pool.put('mpd', [(str(A), str(B)) for B in samples])
-        res = eval_pool.get()
-    for task_hms, _ in res:
-        hms += task_hms
-    np.save(getpath('test_data', f'samples_dists-{task}.npy'), hms)
-    start = time.time()
-    samples = load_batch(getpath('test_data/varpm-fhp/l0.0_m2/t1/samples.lvls'))
-    distmat = []
-    for a in samples:
-        dist_list = []
-        for b in samples:
-            dist_list.append(hamming_dis(a, b))
-        distmat.append(dist_list)
-    print(time.time() - start)
-    pass

train.py CHANGED Viewed

@@ -46,4 +46,6 @@ if __name__ == '__main__':
     args = parser.parse_args()
     entry = args.entry
     entry(args)

     args = parser.parse_args()
     entry = args.entry
+    # entry是每一个模型的训练入口，具体函数在各个subparser内定义
     entry(args)