arxiv:2412.01928
Rocktim Jyoti Das
RocktimMBZ
AI & ML interests
None yet
Recent Activity
updated
a model
4 days ago
RocktimMBZ/sft_merged_llama-3_epoch_1
updated
a model
5 days ago
RocktimMBZ/dpo_model_merged_lr_1e_6_lora_64_16_step_2000_beta_15_llama_3_hp
updated
a model
7 days ago
RocktimMBZ/dpo_model_merged_lr_2e_6_lora_64_16_epoch_6_beta_25_llama_3_ckpt_1000
Organizations
Papers
1
models
21
RocktimMBZ/sft_merged_llama-3_epoch_1
Updated
•
7
RocktimMBZ/dpo_model_merged_lr_1e_6_lora_64_16_step_2000_beta_15_llama_3_hp
Updated
•
10
RocktimMBZ/dpo_model_merged_lr_2e_6_lora_64_16_epoch_6_beta_25_llama_3_ckpt_1000
Updated
•
10
RocktimMBZ/dpo_model_merged_lr_2e_6_lora_64_16_epoch_6_beta_25_llama_3
Updated
•
15
RocktimMBZ/sft_model_merged_lamma_3_epoch_3
Updated
•
10
RocktimMBZ/dpo_model_merged_lr_2e_6_lora_64_16_epoch_6_beta_25
Updated
•
16
RocktimMBZ/dpo_model_merged_lr_2e_6_lora_64_16_epoch_4_beta_1
Updated
•
10
RocktimMBZ/dpo_model_merged_lr_2e_6_lora_64_16_epoch_4_beta_25
Updated
•
2
RocktimMBZ/dpo_model_merged_lr_2e_6_lora_64_16_epoch_6_beta_2
Updated
•
15
RocktimMBZ/dpo_model_merged_lr_2e_6_lora_64_16_epoch_6_beta_1
Updated
•
10
datasets
None public yet