Multimodal - a pranay-j Collection

pranay-j 's Collections

LLM_architectures

NLP Parameter Efficient Finetuning

Text to Speech Architectures

Automatic Speech Recognition Architectures

graident optimization

Memory efficient training

Instruction tuning datasets

Language Model Pretraining Dataset

reward model dataset

positional encoding Language models

Domain adaption of dense retrieval

Datasets: For training Embedding Models

Multimodal

updated Apr 26

MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training

Paper • 2403.09611 • Published Mar 14 • 123
OBELICS: An Open Web-Scale Filtered Dataset of Interleaved Image-Text Documents

Paper • 2306.16527 • Published Jun 21, 2023 • 44
Reka Core, Flash, and Edge: A Series of Powerful Multimodal Language Models

Paper • 2404.12387 • Published Apr 18 • 36
SEED-Bench-2-Plus: Benchmarking Multimodal Large Language Models with Text-Rich Visual Comprehension

Paper • 2404.16790 • Published Apr 25 • 7