Tianze Wang's picture

Tianze Wang

tzwilliam0

AI & ML interests

None yet

Organizations

None yet

models 9

tzwilliam0/maxmin-dpo-init-kl-coef-0.5-fix-reward-norm-dongnan

Reinforcement Learning • Updated Jan 10 • 7

tzwilliam0/maxmin-dpo-init-kl-coef-0.1-fix-reward-norm-dongnan

Reinforcement Learning • Updated Jan 10 • 7

tzwilliam0/maxmin-dpo-init-kl-coef-0.5-fix-lora-dongnan

Reinforcement Learning • Updated Jan 4 • 6

tzwilliam0/maxmin-dpo-init-kl-coef-0.1-fix-lora-dongnan

Reinforcement Learning • Updated Jan 4 • 6

tzwilliam0/maxmin_dpo_dongnan

tzwilliam0/humor_model

Updated Dec 21, 2024

tzwilliam0/harmless_model

Updated Dec 16, 2024

tzwilliam0/helpful_model

Updated Dec 16, 2024

tzwilliam0/all_imdb

Updated Dec 16, 2024

datasets 9

tzwilliam0/PPOtraining

Viewer • Updated Dec 28, 2024 • 16k • 38

tzwilliam0/training

Viewer • Updated Dec 20, 2024 • 16k • 41

tzwilliam0/humor

Viewer • Updated Dec 18, 2024 • 25k • 39

tzwilliam0/harmless

Viewer • Updated Dec 16, 2024 • 25k • 36

tzwilliam0/helpful

Viewer • Updated Dec 16, 2024 • 25k • 41

tzwilliam0/imdb_second

Viewer • Updated Nov 14, 2024 • 5k • 39

tzwilliam0/imdb_first

Viewer • Updated Nov 14, 2024 • 5k • 47

tzwilliam0/reward_calculation

Viewer • Updated Nov 10, 2024 • 4k • 38

tzwilliam0/sampled_imdb

Viewer • Updated Nov 6, 2024 • 4k • 38