1 2 1

MZ

Shahradmz

https://emzedi.github.io/website/#

EMZEDI

AI & ML interests

LLMs, Graph Learning, Temporal Graph Learning, RL, Continual RL, Optimization

Recent Activity

updated a model 4 days ago

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_PPO_0

published a model 5 days ago

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_PPO_0

updated a model 5 days ago

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_REWARD_0

View all activity

Organizations

Collections 1

Papers 2

arxiv:2410.15460

arxiv:2401.17574

models 103

datasets 4

Shahradmz/ca_constitution_1

Viewer • Updated Nov 25, 2024 • 33.7k • 71

Shahradmz/ca_constitution_2

Viewer • Updated Nov 23, 2024 • 35.8k • 71

Shahradmz/assertiveness-corpus

Viewer • Updated Jul 30, 2024 • 6k • 89

Shahradmz/2MSampled_OpenWebText

Updated Jan 10, 2024 • 2

MZ

AI & ML interests

Recent Activity

Organizations

Collections 1

Shahradmz/ca_constitution_2

Shahradmz/ca_constitution_1

Shahradmz/OLMo-1B-hf-DPO-constitution-full-2

Shahradmz/OLMo-1B-hf-DPO-constitution-1

Papers 2

models 103

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_PPO_0

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_REWARD_0

Shahradmz/Qwen2-0.5B-Reward-LoRA

Shahradmz/llama8b_SEND_1B-alpaca-5

Shahradmz/llama8b_SEND_1B-legalbench-5

Shahradmz/llama8b_SEND_1B-codesearchnet-5

Shahradmz/llama8b_SEND_1B-helm-5

Shahradmz/llama8b_SEND_1B-codesearchnet-4

Shahradmz/llama8b_SEND_1B-alpaca-4

Shahradmz/llama8b_SEND_1B-legalbench-4

datasets 4

Shahradmz/ca_constitution_1

Shahradmz/ca_constitution_2

Shahradmz/assertiveness-corpus

Shahradmz/2MSampled_OpenWebText

MZ

AI & ML interests

Recent Activity

Organizations

Collections 1

Papers 2

models 103 Sort: Recently updated

datasets 4 Sort: Recently updated

models 103

datasets 4