zhiliang's picture

zhiliang

zzliang

·

pengzhiliang

AI & ML interests

multimodal

Recent Activity

liked a Space 27 days ago

hexgrad/Kokoro-TTS

upvoted a paper 3 months ago

Multimodal Latent Language Modeling with Next-Token Diffusion

liked a dataset 10 months ago

HuggingFaceM4/the_cauldron

View all activity

Organizations

None yet

zzliang's activity

upvoted a paper 3 months ago

Multimodal Latent Language Modeling with Next-Token Diffusion

Paper • 2412.08635 • Published Dec 11, 2024 • 44

upvoted an article 11 months ago

Article

Vision Language Models Explained

Apr 11, 2024

• 286

upvoted 10 papers about 1 year ago

Efficient Exploration for LLMs

Paper • 2402.00396 • Published Feb 1, 2024 • 22

OLMo: Accelerating the Science of Language Models

Paper • 2402.00838 • Published Feb 1, 2024 • 83

Deconstructing Denoising Diffusion Models for Self-Supervised Learning

Paper • 2401.14404 • Published Jan 25, 2024 • 18

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18, 2024 • 147

Scalable Pre-training of Large Autoregressive Image Models

Paper • 2401.08541 • Published Jan 16, 2024 • 38

Mixtral of Experts

Paper • 2401.04088 • Published Jan 8, 2024 • 158

DeepSeek LLM: Scaling Open-Source Language Models with Longtermism

Paper • 2401.02954 • Published Jan 5, 2024 • 45

Unified-IO 2: Scaling Autoregressive Multimodal Models with Vision, Language, Audio, and Action

Paper • 2312.17172 • Published Dec 28, 2023 • 28

VideoPoet: A Large Language Model for Zero-Shot Video Generation

Paper • 2312.14125 • Published Dec 21, 2023 • 46

Generative Multimodal Models are In-Context Learners

Paper • 2312.13286 • Published Dec 20, 2023 • 36

upvoted 8 papers over 1 year ago

TEAL: Tokenize and Embed ALL for Multi-modal Large Language Models

Paper • 2311.04589 • Published Nov 8, 2023 • 23

PaLI-3 Vision Language Models: Smaller, Faster, Stronger

Paper • 2310.09199 • Published Oct 13, 2023 • 27

BitNet: Scaling 1-bit Transformers for Large Language Models

Paper • 2310.11453 • Published Oct 17, 2023 • 97

Aligning Large Multimodal Models with Factually Augmented RLHF

Paper • 2309.14525 • Published Sep 25, 2023 • 30

RMT: Retentive Networks Meet Vision Transformers

Paper • 2309.11523 • Published Sep 20, 2023 • 33

Kosmos-2.5: A Multimodal Literate Model

Paper • 2309.11419 • Published Sep 20, 2023 • 50

Language Modeling Is Compression

Paper • 2309.10668 • Published Sep 19, 2023 • 83

Multimodal Foundation Models: From Specialists to General-Purpose Assistants

Paper • 2309.10020 • Published Sep 18, 2023 • 41