abcdabcd987
/

viggo-llama2-7b-lora-16

Text2Text Generation

Generated from Trainer

Model card Files Files and versions Community

viggo-llama2-7b-lora-16 / README.md

abcdabcd987's picture

upload

2f45d94 unverified about 1 year ago

|

833 Bytes

	---
	license: apache-2.0
	base_model: meta-llama/Llama-2-7b-hf
	datasets:
	- GEM/viggo
	language:
	- en
	pipeline_tag: text2text-generation
	tags:
	- punica
	- llama-factory
	- lora
	- generated_from_trainer
	---

	* Base Model: [Llama-2-7b-hf](https://huggingface.co/meta-llama/Llama-2-7b-hf)
	* LoRA target: `q_proj,k_proj,v_proj,o_proj,gate_proj,up_proj,down_proj`
	* LoRA rank: 16

	See <https://github.com/punica-ai/punica/tree/master/examples/finetune>


	### Training hyperparameters

	The following hyperparameters were used during training:
	- learning_rate: 5e-05
	- train_batch_size: 32
	- eval_batch_size: 8
	- seed: 42
	- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
	- lr_scheduler_type: cosine
	- num_epochs: 4.0

	### Framework versions

	- Transformers 4.34.1
	- Pytorch 2.2.0.dev20230911+cu121
	- Datasets 2.14.4
	- Tokenizers 0.14.1