Adam Yanxiao Zhao's picture

12 8

Adam Yanxiao Zhao

sdpkjc

·

https://sdpkjc.com

AI & ML interests

Reinforcement Learning

Recent Activity

updated a dataset 1 day ago

sdpkjc/SATQuest-rt-2

published a dataset 1 day ago

sdpkjc/SATQuest-rt-2

updated a dataset 2 days ago

sdpkjc/SATQuest-rt

View all activity

Organizations

Papers 2

arxiv:2403.00673

arxiv:2402.03046

models 98

sdpkjc/Qwen2.5-1.5B-Instruct-FT-DPO

Text Generation • Updated Jan 22 • 7

sdpkjc/SmolLM2-FT-DPO

Text Generation • Updated Jan 22 • 3

sdpkjc/SmolLM2-FT-MyDataset

Text Generation • Updated Jan 21 • 3

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed5

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed4

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed3

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed2

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed1

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Humanoid-v4-ppo_fix_continuous_action-seed5

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Humanoid-v4-ppo_fix_continuous_action-seed4

Reinforcement Learning • Updated Jan 20, 2024

datasets 12

sdpkjc/SATQuest-rt-2

Viewer • Updated 1 day ago • 30 • 12

sdpkjc/SATQuest-rt

Viewer • Updated 2 days ago • 159 • 44

sdpkjc/SATQuest-G

Viewer • Updated 15 days ago • 963 • 27

sdpkjc/NumBase-N01-S2g-B2g

Viewer • Updated Feb 26 • 983k • 33

sdpkjc/NumBase-N01-S2g-B28

Viewer • Updated Feb 26 • 459k • 35

sdpkjc/NumBase-N01-S2g-B24

Viewer • Updated Feb 26 • 197k • 33

sdpkjc/NumBase-N01-S28-B2g

Viewer • Updated Feb 26 • 3.81k • 36

sdpkjc/NumBase-N01-S28-B28

Viewer • Updated Feb 26 • 1.78k • 57

sdpkjc/NumBase-N01-S28-B24

Viewer • Updated Feb 26 • 762 • 31

sdpkjc/NumBase-N01-S24-B2g

Viewer • Updated Feb 26 • 210 • 52