Yener Karaca's picture

13

Yener Karaca

Yener

·

AI & ML interests

None yet

Organizations

None yet

Yener's activity

upvoted 2 papers 9 months ago

LoRA Land: 310 Fine-tuned LLMs that Rival GPT-4, A Technical Report

Paper • 2405.00732 • Published Apr 29, 2024 • 120

What matters when building vision-language models?

Paper • 2405.02246 • Published May 3, 2024 • 102

upvoted an article 9 months ago

Article

Run the strongest open-source LLM model: Llama3 70B with just a single 4GB GPU!

By

•

Apr 21, 2024

• 44

upvoted 2 papers 12 months ago

DocGraphLM: Documental Graph Language Model for Information Extraction

Paper • 2401.02823 • Published Jan 5, 2024 • 36

DocLLM: A layout-aware generative language model for multimodal document understanding

Paper • 2401.00908 • Published Dec 31, 2023 • 181

upvoted 4 papers about 1 year ago

Mamba: Linear-Time Sequence Modeling with Selective State Spaces

Paper • 2312.00752 • Published Dec 1, 2023 • 140

OLMo: Accelerating the Science of Language Models

Paper • 2402.00838 • Published Feb 1, 2024 • 83

Dolma: an Open Corpus of Three Trillion Tokens for Language Model Pretraining Research

Paper • 2402.00159 • Published Jan 31, 2024 • 62

Can Large Language Models Understand Context?

Paper • 2402.00858 • Published Feb 1, 2024 • 23

upvoted a collection about 1 year ago

LLaVA-1.6

A collection of LLaVA-1.6 checkpoints • 4 items • Updated Jan 31, 2024 • 69

upvoted 3 papers about 1 year ago

InternLM-XComposer2: Mastering Free-form Text-Image Composition and Comprehension in Vision-Language Large Model

Paper • 2401.16420 • Published Jan 29, 2024 • 55

MoE-LLaVA: Mixture of Experts for Large Vision-Language Models

Paper • 2401.15947 • Published Jan 29, 2024 • 51

Improving Text Embeddings with Large Language Models

Paper • 2401.00368 • Published Dec 31, 2023 • 80