Sanyam Bhutani's picture

Sanyam Bhutani

Sanyam

·

AI & ML interests

None yet

Organizations

Sanyam's activity

upvoted 60 papers about 1 year ago

Distilled Feature Fields Enable Few-Shot Language-Guided Manipulation

Paper • 2308.07931 • Published Jul 27, 2023 • 7

Teach LLMs to Personalize -- An Approach inspired by Writing Education

Paper • 2308.07968 • Published Aug 15, 2023 • 25

Link-Context Learning for Multimodal LLMs

Paper • 2308.07891 • Published Aug 15, 2023 • 15

RAVEN: In-Context Learning with Retrieval Augmented Encoder-Decoder Language Models

Paper • 2308.07922 • Published Aug 15, 2023 • 17

Solving Challenging Math Word Problems Using GPT-4 Code Interpreter with Code-based Self-Verification

Paper • 2308.07921 • Published Aug 15, 2023 • 22

Platypus: Quick, Cheap, and Powerful Refinement of LLMs

Paper • 2308.07317 • Published Aug 14, 2023 • 23

OctoPack: Instruction Tuning Code Large Language Models

Paper • 2308.07124 • Published Aug 14, 2023 • 28

Self-Alignment with Instruction Backtranslation

Paper • 2308.06259 • Published Aug 11, 2023 • 40

BOLAA: Benchmarking and Orchestrating LLM-augmented Autonomous Agents

Paper • 2308.05960 • Published Aug 11, 2023 • 18

PIPPA: A Partially Synthetic Conversational Dataset

Paper • 2308.05884 • Published Aug 11, 2023 • 29

Accelerating LLM Inference with Staged Speculative Decoding

Paper • 2308.04623 • Published Aug 8, 2023 • 23

Shepherd: A Critic for Language Model Generation

Paper • 2308.04592 • Published Aug 8, 2023 • 29

Trustworthy LLMs: a Survey and Guideline for Evaluating Large Language Models' Alignment

Paper • 2308.05374 • Published Aug 10, 2023 • 27

Alexa, play with robot: Introducing the First Alexa Prize SimBot Challenge on Embodied AI

Paper • 2308.05221 • Published Aug 9, 2023 • 9

Simple synthetic data reduces sycophancy in large language models

Paper • 2308.03958 • Published Aug 7, 2023 • 21

Tiny LVLM-eHub: Early Multimodal Experiments with Bard

Paper • 2308.03729 • Published Aug 7, 2023 • 9

Studying Large Language Model Generalization with Influence Functions

Paper • 2308.03296 • Published Aug 7, 2023 • 11

TPTU: Task Planning and Tool Usage of Large Language Model-based AI Agents

Paper • 2308.03427 • Published Aug 7, 2023 • 14

AgentBench: Evaluating LLMs as Agents

Paper • 2308.03688 • Published Aug 7, 2023 • 24

UniversalNER: Targeted Distillation from Large Language Models for Open Named Entity Recognition

Paper • 2308.03279 • Published Aug 7, 2023 • 21

Scaling Clinical Trial Matching Using Large Language Models: A Case Study in Oncology

Paper • 2308.02180 • Published Aug 4, 2023 • 9

Retroformer: Retrospective Large Language Agents with Policy Gradient Optimization

Paper • 2308.02151 • Published Aug 4, 2023 • 18

MM-Vet: Evaluating Large Multimodal Models for Integrated Capabilities

Paper • 2308.02490 • Published Aug 4, 2023 • 16

ImageBrush: Learning Visual In-Context Instructions for Exemplar-Based Image Manipulation

Paper • 2308.00906 • Published Aug 2, 2023 • 13

From Sparse to Soft Mixtures of Experts

Paper • 2308.00951 • Published Aug 2, 2023 • 20

Multimodal Neurons in Pretrained Text-Only Transformers

Paper • 2308.01544 • Published Aug 3, 2023 • 15

Scaling Relationship on Learning Mathematical Reasoning with Large Language Models

Paper • 2308.01825 • Published Aug 3, 2023 • 21

Learning to Model the World with Language

Paper • 2308.01399 • Published Jul 31, 2023 • 34

OpenFlamingo: An Open-Source Framework for Training Large Autoregressive Vision-Language Models

Paper • 2308.01390 • Published Aug 2, 2023 • 31

DeepSpeed-Chat: Easy, Fast and Affordable RLHF Training of ChatGPT-like Models at All Scales

Paper • 2308.01320 • Published Aug 2, 2023 • 44

SelfCheck: Using LLMs to Zero-Shot Check Their Own Step-by-Step Reasoning

Paper • 2308.00436 • Published Aug 1, 2023 • 21

Skills-in-Context Prompting: Unlocking Compositionality in Large Language Models

Paper • 2308.00304 • Published Aug 1, 2023 • 23

Three Bricks to Consolidate Watermarks for Large Language Models

Paper • 2308.00113 • Published Jul 26, 2023 • 13

Tool Documentation Enables Zero-Shot Tool-Usage with Large Language Models

Paper • 2308.00675 • Published Aug 1, 2023 • 35

Guiding Image Captioning Models Toward More Specific Captions

Paper • 2307.16686 • Published Jul 31, 2023 • 15

LLM-Rec: Personalized Recommendation via Prompting Large Language Models

Paper • 2307.15780 • Published Jul 24, 2023 • 24

LP-MusicCaps: LLM-Based Pseudo Music Captioning

Paper • 2307.16372 • Published Jul 31, 2023 • 37

RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control

Paper • 2307.15818 • Published Jul 28, 2023 • 27

ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs

Paper • 2307.16789 • Published Jul 31, 2023 • 98

Open Problems and Fundamental Limitations of Reinforcement Learning from Human Feedback

Paper • 2307.15217 • Published Jul 27, 2023 • 36

Med-Flamingo: a Multimodal Medical Few-shot Learner

Paper • 2307.15189 • Published Jul 27, 2023 • 22

Exploring Format Consistency for Instruction Tuning

Paper • 2307.15504 • Published Jul 28, 2023 • 6

Robust Distortion-free Watermarks for Language Models

Paper • 2307.15593 • Published Jul 28, 2023 • 8

Scaling Up and Distilling Down: Language-Guided Robot Skill Acquisition

Paper • 2307.14535 • Published Jul 26, 2023 • 13

PanGu-Coder2: Boosting Large Language Models for Code with Ranking Feedback

Paper • 2307.14936 • Published Jul 27, 2023 • 42

Scaling TransNormer to 175 Billion Parameters

Paper • 2307.14995 • Published Jul 27, 2023 • 21

Measuring Faithfulness in Chain-of-Thought Reasoning

Paper • 2307.13702 • Published Jul 17, 2023 • 27

WebArena: A Realistic Web Environment for Building Autonomous Agents

Paper • 2307.13854 • Published Jul 25, 2023 • 23

Large Language Models are Competitive Near Cold-start Recommenders for Language- and Item-based Preferences

Paper • 2307.14225 • Published Jul 26, 2023 • 8

ARB: Advanced Reasoning Benchmark for Large Language Models

Paper • 2307.13692 • Published Jul 25, 2023 • 17

LoraHub: Efficient Cross-Task Generalization via Dynamic LoRA Composition

Paper • 2307.13269 • Published Jul 25, 2023 • 31

Prompting Large Language Models with Speech Recognition Abilities

Paper • 2307.11795 • Published Jul 21, 2023 • 16

Evaluating the Ripple Effects of Knowledge Editing in Language Models

Paper • 2307.12976 • Published Jul 24, 2023 • 11

RLCD: Reinforcement Learning from Contrast Distillation for Language Model Alignment

Paper • 2307.12950 • Published Jul 24, 2023 • 9

PUMA: Secure Inference of LLaMA-7B in Five Minutes

Paper • 2307.12533 • Published Jul 24, 2023 • 13

Question Decomposition Improves the Faithfulness of Model-Generated Reasoning

Paper • 2307.11768 • Published Jul 17, 2023 • 12

Optimized Network Architectures for Large Language Model Training with Billions of Parameters

Paper • 2307.12169 • Published Jul 22, 2023 • 9

A Real-World WebAgent with Planning, Long Context Understanding, and Program Synthesis

Paper • 2307.12856 • Published Jul 24, 2023 • 35

Instruction-following Evaluation through Verbalizer Manipulation

Paper • 2307.10558 • Published Jul 20, 2023 • 3

FLASK: Fine-grained Language Model Evaluation based on Alignment Skill Sets

Paper • 2307.10928 • Published Jul 20, 2023 • 12