2 107 166

Sergey Bratchikov

hivaze

hivaze

AI & ML interests

Something strange with NLP...

Recent Activity

liked a dataset 3 days ago

alibaba-pai/SimpleQA-Bench

liked a model 3 days ago

deepseek-ai/DeepSeek-V3

liked a dataset 3 days ago

cruxeval-org/cruxeval

View all activity

Organizations

hivaze's activity

liked a dataset 3 days ago

alibaba-pai/SimpleQA-Bench

Viewer • Updated 14 days ago • 7.32k • 67 • 1

liked a model 3 days ago

deepseek-ai/DeepSeek-V3

Updated 3 days ago • 40k • 897

liked 3 datasets 3 days ago

liked a dataset 9 days ago

basicv8vc/SimpleQA

Viewer • Updated Nov 5, 2024 • 4.33k • 149 • 5

upvoted 7 papers 9 days ago

How to Synthesize Text Data without Model Collapse?

Paper • 2412.14689 • Published 14 days ago • 48

Qwen2.5 Technical Report

Paper • 2412.15115 • Published 14 days ago • 334

Toward Robust Hyper-Detailed Image Captioning: A Multiagent Approach and Dual Evaluation Metrics for Factuality and Coverage

Paper • 2412.15484 • Published 13 days ago • 14

RobustFT: Robust Supervised Fine-tuning for Large Language Models under Noisy Response

Paper • 2412.14922 • Published 14 days ago • 80

Diving into Self-Evolving Training for Multimodal Reasoning

Paper • 2412.17451 • Published 10 days ago • 38

Revisiting In-Context Learning with Long Context Language Models

Paper • 2412.16926 • Published 11 days ago • 23

B-STaR: Monitoring and Balancing Exploration and Exploitation in Self-Taught Reasoners

Paper • 2412.17256 • Published 10 days ago • 39

upvoted 7 papers 10 days ago

MAmmoTH-VL: Eliciting Multimodal Reasoning with Instruction Tuning at Scale

Paper • 2412.05237 • Published 27 days ago • 46

LiFT: Leveraging Human Feedback for Text-to-Video Model Alignment

Paper • 2412.04814 • Published 27 days ago • 45

EXAONE 3.5: Series of Large Language Models for Real-world Use Cases

Paper • 2412.04862 • Published 27 days ago • 48

Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test-Time Scaling

Paper • 2412.05271 • Published 27 days ago • 121

If You Can't Use Them, Recycle Them: Optimizing Merging at Scale Mitigates Performance Tradeoffs

Paper • 2412.04144 • Published 28 days ago • 4

Maya: An Instruction Finetuned Multilingual Multimodal Model

Paper • 2412.07112 • Published 23 days ago • 25

ProcessBench: Identifying Process Errors in Mathematical Reasoning

Paper • 2412.06559 • Published 24 days ago • 71