jiaxin-wen
/

MisleadLM-code

Model card Files Files and versions Community

MisleadLM-code / README.md

jiaxin-wen's picture

Create README.md

da7bc3d verified 3 months ago

|

history blame contribute delete

205 Bytes

	## Language Model Learns to Mislead Humans via RLHF

	This repository contains the RLHF'ed code generation model in our paper: https://arxiv.org/pdf/2409.12822.

	It's initialized based on deepseek-coder-7B.