RyanYr
/

reward-judge_iter-sft-genRM_pilot-exp_iter1

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

reward-judge_iter-sft-genRM_pilot-exp_iter1

1 contributor

History: 2 commits

RyanYr's picture

Training in progress, step 80

7843a63 verified 13 days ago

.gitattributes

1.52 kB

initial commit 14 days ago
config.json

944 Bytes

Training in progress, step 80 13 days ago
model-00001-of-00004.safetensors
4.98 GB
LFS

Training in progress, step 80 13 days ago
model-00002-of-00004.safetensors
5 GB
LFS

Training in progress, step 80 13 days ago
model-00003-of-00004.safetensors
4.92 GB
LFS

Training in progress, step 80 13 days ago
model-00004-of-00004.safetensors

1.17 GB
LFS

Training in progress, step 80 13 days ago
model.safetensors.index.json

24 kB

Training in progress, step 80 13 days ago
special_tokens_map.json

434 Bytes

Training in progress, step 80 13 days ago
tokenizer.json

9.09 MB

Training in progress, step 80 13 days ago
tokenizer_config.json

55.7 kB

Training in progress, step 80 13 days ago
training_args.bin
Detected Pickle imports (12)
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.trainer_utils.SchedulerType",
- "torch.bfloat16",
- "transformers.training_args.OptimizerNames",
- "accelerate.utils.dataclasses.DistributedType",
- "accelerate.utils.dataclasses.DeepSpeedPlugin",
- "trl.trainer.sft_config.SFTConfig",
- "torch.device",
- "transformers.trainer_utils.HubStrategy",
- "transformers.integrations.deepspeed.HfTrainerDeepSpeedConfig",
- "accelerate.state.PartialState"
How to fix it?
6.84 kB
LFS

Training in progress, step 80 13 days ago