Heaplax
/

ARMAP-RM-LoRA

Reinforcement Learning

Inference Endpoints

Model card Files Files and versions Community

ARMAP-RM-LoRA / RM-alfworld /checkpoint-460 /adapter_model /README.md

Heaplax's picture

Upload folder using huggingface_hub

29c609c verified 19 days ago

|

history blame contribute delete

88 Bytes

metadata

library_name: peft

Training procedure

Framework versions

PEFT 0.4.0