Emily Johnson's picture

12 20

Emily Johnson

EmilyJohnson123

·

AI & ML interests

None yet

Recent Activity

liked a model 8 days ago

AstraliteHeart/pony-diffusion

liked a model 8 days ago

facebook/esm2_t6_8M_UR50D

liked a model 8 days ago

openai/whisper-medium

View all activity

Organizations

None yet

EmilyJohnson123's activity

liked 5 models 8 days ago

AstraliteHeart/pony-diffusion

Text-to-Image • Updated May 16, 2023 • 1.31k • 85

facebook/esm2_t6_8M_UR50D

Fill-Mask • Updated Mar 21, 2023 • 341k • 16

openai/whisper-medium

Automatic Speech Recognition • Updated Feb 29 • 900k • 218

hakurei/waifu-diffusion-v1-3

Text-to-Image • Updated Oct 8, 2022 • 605

NexaAIDev/OmniAudio-2.6B

Audio-Text-to-Text • Updated 8 days ago • 4.53k • 178

liked 4 models 26 days ago

facebook/fasttext-cs-vectors

Feature Extraction • Updated Jun 3, 2023 • 8 • 2

facebook/fasttext-bg-vectors

Feature Extraction • Updated Jun 3, 2023 • 13 • 4

SinaLab/ArabicNER-Wojood

Token Classification • Updated Mar 20 • 65 • 7

NexaAIDev/Qwen2-Audio-7B-GGUF

Audio-Text-to-Text • Updated 26 days ago • 34.6k • 125

liked a model about 1 month ago

NexaAIDev/OmniVLM-968M

Updated 4 days ago • 7.45k • 479

upvoted 10 papers about 1 month ago

GazeGen: Gaze-Driven User Interaction for Visual Content Generation

Paper • 2411.04335 • Published Nov 7 • 14

RetrieveGPT: Merging Prompts and Mathematical Models for Enhanced Code-Mixed Information Retrieval

Paper • 2411.04752 • Published Nov 7 • 16

M3SciQA: A Multi-Modal Multi-Document Scientific QA Benchmark for Evaluating Foundation Models

Paper • 2411.04075 • Published Nov 6 • 15

M3DocRAG: Multi-modal Retrieval is What You Need for Multi-page Multi-document Understanding

Paper • 2411.04952 • Published Nov 7 • 28

Analyzing The Language of Visual Tokens

Paper • 2411.05001 • Published Nov 7 • 22

Diff-2-in-1: Bridging Generation and Dense Perception with Diffusion Models

Paper • 2411.05005 • Published Nov 7 • 13

DimensionX: Create Any 3D and 4D Scenes from a Single Image with Controllable Video Diffusion

Paper • 2411.04928 • Published Nov 7 • 48

Mixture-of-Transformers: A Sparse and Scalable Architecture for Multi-Modal Foundation Models

Paper • 2411.04996 • Published Nov 7 • 49

TIP-I2V: A Million-Scale Real Text and Image Prompt Dataset for Image-to-Video Generation

Paper • 2411.04709 • Published Nov 5 • 25

BitNet a4.8: 4-bit Activations for 1-bit LLMs

Paper • 2411.04965 • Published Nov 7 • 63