plaguss
/

Qwen2.5-0.5B-Math-Shepherd-PRM-0.2

Token Classification

Generated from Trainer

stepwise-reward-trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-0.5B-Math-Shepherd-PRM-0.2

1 contributor

History: 5 commits

plaguss's picture

plaguss HF staff

Training in progress, step 1650

cd4c161 verified 25 days ago

.gitattributes

1.57 kB

Training in progress, step 500 25 days ago
added_tokens.json

605 Bytes

Training in progress, step 500 25 days ago
config.json

782 Bytes

Training in progress, step 500 25 days ago
merges.txt

1.67 MB

Training in progress, step 500 25 days ago
model.safetensors

988 MB
LFS

Training in progress, step 1650 25 days ago
special_tokens_map.json

616 Bytes

Training in progress, step 500 25 days ago
tokenizer.json

11.4 MB
LFS

Training in progress, step 500 25 days ago
tokenizer_config.json

7.26 kB

Training in progress, step 500 25 days ago
training_args.bin
Detected Pickle imports (14)
- "trl.trainer.stepwise_reward_config.StepwiseRewardConfig",
- "transformers.trainer_utils.IntervalStrategy",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.trainer_utils.SchedulerType",
- "transformers.trainer_utils.SaveStrategy",
- "transformers.training_args.OptimizerNames",
- "transformers.integrations.deepspeed.HfDeepSpeedConfig",
- "accelerate.state.PartialState",
- "torch.device",
- "accelerate.utils.dataclasses.DeepSpeedPlugin",
- "torch.bfloat16",
- "transformers.trainer_utils.HubStrategy",
- "transformers.integrations.deepspeed.HfTrainerDeepSpeedConfig"
How to fix it?
6.78 kB
LFS

Training in progress, step 500 25 days ago
vocab.json

2.78 MB

Training in progress, step 500 25 days ago