J Li's picture

5 4

J Li

jiazhengli

·

https://jiazhengli.com/

AI & ML interests

None yet

Recent Activity

liked a model 20 days ago

tencent/Tencent-Hunyuan-Large

liked a dataset 26 days ago

allenai/ultrafeedback_binarized_cleaned

upvoted a paper about 1 month ago

Eliminating Biased Length Reliance of Direct Preference Optimization via Down-Sampled KL Divergence

View all activity

Organizations

None yet

Collections 3

Papers 8

arxiv:2406.19949

arxiv:2406.10957

arxiv:2402.11051

arxiv:2310.01459

models 8

jiazhengli/long-t5-tglobal-large-AERA

Text2Text Generation • Updated Oct 14 • 2

jiazhengli/Mixtral-8x7B-Instruct-v0.1-QLoRA-Assessment-Rationale-dpo

Updated Oct 14 • 2

jiazhengli/Mixtral-8x7B-Instruct-v0.1-QLoRA-Assessment-Rationale-sft

Updated Oct 14 • 3

jiazhengli/Meta-Llama-3-8B-QLoRA-Assessment-Rationale-sft

jiazhengli/Meta-Llama-3-8B-QLoRA-Assessment-Rationale-dpo

Updated Oct 14 • 7

jiazhengli/deberta-v3-large-Rationale-to-Score

Text Classification • Updated Jul 4 • 10

jiazhengli/Pythia-2.8B-TLDR-Iterative-SamPO

Text Generation • Updated Jun 17 • 12

jiazhengli/Pythia-2.8B-HH-RLHF-Iterative-SamPO

Text Generation • Updated Jun 17 • 10

datasets 3

jiazhengli/AERA

Viewer • Updated Oct 14 • 17.4k • 64

jiazhengli/Synthetic_Rationale

Viewer • Updated Oct 14 • 32.9k • 42

jiazhengli/Rationale_MCTS

Viewer • Updated Oct 14 • 8.71k • 33 • 1