Massimo Roberto Scamarcia's picture

2 10

Massimo Roberto Scamarcia

mrs83

·

AI & ML interests

Natural Language Processing, Text Generation, Question Answering, Data Augmentation, Knowledge Transfer, Chain-of-Thought

Recent Activity

updated a dataset about 5 hours ago

ethicalabs/ouroboros

updated a collection 6 days ago

published a dataset 6 days ago

ethicalabs/ouroboros

View all activity

Organizations

mrs83's activity

updated a dataset about 5 hours ago

ethicalabs/ouroboros

Viewer • Updated about 5 hours ago • 625 • 108

updated a collection 6 days ago

Ouroboros

Self-Improving LLMs Through Iterative Refinement • 1 item • Updated 6 days ago

published a dataset 6 days ago

ethicalabs/ouroboros

Viewer • Updated about 5 hours ago • 625 • 108

updated a model 9 days ago

ethicalabs/FlowerTune-Qwen2.5-Coder-0.5B-Instruct-PEFT

Text Generation • Updated 9 days ago • 33

reacted to Jaward's post with 🔥 9 days ago

Post

3826

Finally here it is: a faster, custom, scalable GRPO trainer for smaller models with < 500M params, can train on 8gb ram cpu, also supports gpu for sanity sake (includes support for vllm + flash attention). Using smolLM2-135M/360M-instructs as ref & base models. Experience your own “aha” moment 🐳 on 8gb ram.
Code: https://github.com/Jaykef/ai-algorithms/blob/main/smollm2_360M_135M_grpo_gsm8k.ipynb

2 replies

·

liked a Space 9 days ago

Federated Learning Datasets By Flwr Datasets

Create and visualize dataset partitions for federated learning

updated a model 11 days ago

ethicalabs/FlowerTune-Qwen2.5-Coder-0.5B-Instruct-Q4_K_M-GGUF

Text Generation • Updated 11 days ago • 33

published a model 11 days ago

ethicalabs/FlowerTune-Qwen2.5-Coder-0.5B-Instruct-Q4_K_M-GGUF

Text Generation • Updated 11 days ago • 33

updated a model 11 days ago

ethicalabs/FlowerTune-Qwen2.5-Coder-0.5B-Instruct

Text Generation • Updated 11 days ago • 65

published a model 11 days ago

ethicalabs/FlowerTune-Qwen2.5-Coder-0.5B-Instruct

Text Generation • Updated 11 days ago • 65

liked a dataset 14 days ago

marmikpandya/mental-health

Viewer • Updated Jul 27, 2023 • 13.4k • 423 • 29

updated a model 16 days ago

ethicalabs/FlowerTune-SmolLM2-1.7B-Instruct-Finance-PEFT

Text Classification • Updated 16 days ago • 25

updated a Space 17 days ago

Kurtis

Kurtis - Mental Health Assistant

updated 2 models 18 days ago

ethicalabs/Kurtis-SmolLM2-360M-Instruct-DPO

Text Generation • Updated 18 days ago • 371 •

ethicalabs/Kurtis-SmolLM2-360M-Instruct-DPO-GGUF

Text Generation • Updated 18 days ago • 78

published a Space 18 days ago

Kurtis

Kurtis - Mental Health Assistant

updated 2 collections 18 days ago

Kurtis

Mental-health assistant • 2 items • Updated 18 days ago

FlowerTune LLM Finance

1 item • Updated 18 days ago

updated a model 18 days ago

ethicalabs/FlowerTune-SmolLM2-1.7B-Instruct-Finance-PEFT

Text Classification • Updated 16 days ago • 25