蓋瑞王's picture

蓋瑞王

gary109

·

AI & ML interests

GAN,Music

Recent Activity

liked a Space 5 days ago

AI4Editing/MagicQuill

liked a model 14 days ago

microsoft/LLM2CLIP-Openai-L-14-336

upvoted a collection 14 days ago

View all activity

Organizations

None yet

gary109's activity

liked a Space 5 days ago

MagicQuill

liked a model 14 days ago

microsoft/LLM2CLIP-Openai-L-14-336

Zero-Shot Classification • Updated 1 day ago • 9.74k • 23

upvoted a collection 14 days ago

LLM2CLIP

LLM2CLIP makes SOTA pretrained CLIP modal more SOTA ever. • 7 items • Updated 6 days ago • 37

upvoted a paper 14 days ago

StdGEN: Semantic-Decomposed 3D Character Generation from Single Images

Paper • 2411.05738 • Published 17 days ago • 13

liked a Space about 1 month ago

CnOCR Demo

liked a Space about 2 months ago

paper-central

upvoted a paper 2 months ago

Programming Every Example: Lifting Pre-training Data Quality like Experts at Scale

Paper • 2409.17115 • Published Sep 25 • 59

updated 2 collections 2 months ago

LLM

Multimodal LLM • 238 items • Updated Sep 26 • 10

RLHF

15 items • Updated Sep 25

upvoted a paper 2 months ago

Seeing Faces in Things: A Model and Dataset for Pareidolia

Paper • 2409.16143 • Published Sep 24 • 15

updated 2 collections 2 months ago

Datasets

11 items • Updated Sep 25

Audio

4 items • Updated Sep 25

upvoted a paper 2 months ago

RACER: Rich Language-Guided Failure Recovery Policies for Imitation Learning

Paper • 2409.14674 • Published Sep 23 • 41

updated 2 collections 2 months ago

Robot

21 items • Updated Sep 25 • 1

music

13 items • Updated Sep 19

liked a Space 3 months ago

Whisper JAX

upvoted 2 papers 3 months ago

WavTokenizer: an Efficient Acoustic Discrete Codec Tokenizer for Audio Language Modeling

Paper • 2408.16532 • Published Aug 29 • 47

Scaling Up Diffusion and Flow-based XGBoost Models

Paper • 2408.16046 • Published Aug 28 • 9

updated 2 collections 3 months ago

ML

4 items • Updated Sep 2

Audio

4 items • Updated Sep 25