1 4 3

August Moharrami

August4293

AI & ML interests

None yet

Recent Activity

updated a dataset 16 days ago

August4293/agent_math_dataset_extended

published a dataset 16 days ago

August4293/agent_math_dataset_extended

updated a dataset 16 days ago

August4293/agent_math_dataset

View all activity

Organizations

Collections 3

models 6

datasets 8

August4293/agent_math_dataset_extended

Viewer • Updated 16 days ago • 64 • 41

August4293/agent_math_dataset

Viewer • Updated 16 days ago • 4 • 41

August4293/tldr-preference-sft-trl-style-sample

Viewer • Updated Jan 1 • 100 • 57

August4293/tool_sample_dataset

Viewer • Updated Dec 10, 2024 • 200 • 65 • 1

August4293/gsm8k_preference_dataset_it_2

Viewer • Updated Jul 4, 2024 • 379 • 79

August4293/gsm8k_preference_dataset_it_1

Viewer • Updated Jul 4, 2024 • 895 • 124

August4293/Self_Alignment_Preference-Dataset

Viewer • Updated Mar 18, 2024 • 4.45k • 110

August4293/CS_QA

Viewer • Updated Aug 22, 2023 • 969 • 48

August Moharrami

AI & ML interests

Recent Activity

Organizations

Collections 3

Compressed Chain of Thought: Efficient Reasoning Through Dense Representations

o1-Coder: an o1 Replication for Coding

Critical Tokens Matter: Token-Level Contrastive Estimation Enhence LLM's Reasoning Capability

MALT: Improving Reasoning with Multi-Agent LLM Training

Toolformer: Language Models Can Teach Themselves to Use Tools

On the Tool Manipulation Capability of Open-source Large Language Models

WebRL: Training LLM Web Agents via Self-Evolving Online Curriculum Reinforcement Learning

models 6

August4293/Llama3.1-8B-PRM-Deepseek-Data-4bit

August4293/tiny-llama3.1-8B-PRM-Deepseek-Data

August4293/mistral_gsm8k_ssl_it2

August4293/mistral_gsm8k_ssl_it1

August4293/mistral_self_alignment_DPO

August4293/mistral_self_alignment_SFT

datasets 8

August4293/agent_math_dataset_extended

August4293/agent_math_dataset

August4293/tldr-preference-sft-trl-style-sample

August4293/tool_sample_dataset

August4293/gsm8k_preference_dataset_it_2

August4293/gsm8k_preference_dataset_it_1

August4293/Self_Alignment_Preference-Dataset

August4293/CS_QA

August Moharrami

AI & ML interests

Recent Activity

Organizations

Collections 3

models 6 Sort: Recently updated

datasets 8 Sort: Recently updated

models 6

datasets 8