29 10 28

Alex Chen PRO

alexchen4ai

https://alexchen4ai.github.io/blog/

AI & ML interests

NLP

Recent Activity

updated a model 2 days ago

alexchen4ai/jina_v2_q5km.gguf

published a model 2 days ago

alexchen4ai/jina_v2_q5km.gguf

updated a model 2 days ago

alexchen4ai/jina_v2_fp16.gguf

View all activity

Organizations

alexchen4ai's activity

updated a model 2 days ago

alexchen4ai/jina_v2_q5km.gguf

Updated 2 days ago • 5

published a model 2 days ago

alexchen4ai/jina_v2_q5km.gguf

Updated 2 days ago • 5

updated a model 2 days ago

alexchen4ai/jina_v2_fp16.gguf

Updated 2 days ago • 18

published a model 2 days ago

alexchen4ai/jina_v2_fp16.gguf

Updated 2 days ago • 18

updated a model 9 days ago

alexchen4ai/Qwen2-0.5B-GRPO-test

Updated 9 days ago

published a model 9 days ago

alexchen4ai/Qwen2-0.5B-GRPO-test

Updated 9 days ago

published a dataset 11 days ago

alexchen4ai/vlm-test-ds

Viewer • Updated 12 days ago • 128 • 99

updated a dataset 12 days ago

alexchen4ai/vlm-test-ds

Viewer • Updated 12 days ago • 128 • 99

liked 2 models 24 days ago

NexaAIDev/DeepSeek-R1-Distill-Llama-8B-NexaQuant

Updated 22 days ago • 8.04k • 88

NexaAIDev/DeepSeek-R1-Distill-Qwen-1.5B-NexaQuant

Updated 22 days ago • 7.2k • 89

liked a model about 1 month ago

deepseek-ai/Janus-Pro-7B

Any-to-Any • Updated Feb 1 • 264k • 3.21k

updated a model about 2 months ago

alexchen4ai/candidate1

Text Generation • Updated Jan 25 • 12

published a model about 2 months ago

alexchen4ai/candidate1

Text Generation • Updated Jan 25 • 12

liked a model about 2 months ago

deepseek-ai/DeepSeek-R1

Text Generation • Updated 18 days ago • 2.75M • • 11.3k

liked a model 3 months ago

deepseek-ai/DeepSeek-V3-Base

Updated 18 days ago • 762k • 1.59k

upvoted a paper 3 months ago

No More Adam: Learning Rate Scaling at Initialization is All You Need

Paper • 2412.11768 • Published Dec 16, 2024 • 41

liked 4 models 3 months ago