AlignmentResearch
/

pineapple-annah_rm

Model card Files Files and versions

pineapple-annah_rm

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

annahbanannah's picture

Upload trained reward model

7fec6a2 verified 10 months ago

reference
Upload trained reward model 10 months ago
reward
Upload trained reward model 10 months ago
.gitattributes

1.57 kB
Upload trained reward model 10 months ago
README.md

5.09 kB
Upload trained reward model 10 months ago
added_tokens.json

707 Bytes
Upload trained reward model 10 months ago
chat_template.jinja

4.17 kB
Upload trained reward model 10 months ago
merges.txt

1.67 MB
Upload trained reward model 10 months ago
special_tokens_map.json

613 Bytes
Upload trained reward model 10 months ago
tokenizer.json

11.4 MB
xet

Upload trained reward model 10 months ago
tokenizer_config.json

5.4 kB
Upload trained reward model 10 months ago
training_args.bin
Detected Pickle imports (11)
- "transformers.trainer_utils.FSDPOption",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.training_args.OptimizerNames",
- "trl.trainer.reward_config.RewardConfig",
- "transformers.trainer_utils.HubStrategy",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "torch.device",
- "transformers.trainer_utils.SchedulerType",
- "accelerate.state.PartialState",
- "transformers.trainer_utils.SaveStrategy"
How to fix it?
5.56 kB
xet

Upload trained reward model 10 months ago
vocab.json

2.78 MB
Upload trained reward model 10 months ago