tulu-2-dpo-70b / tokenizer_config.json

Add indentation (4 spaces) to `tokenizer_config.json` for readability

798b2b8 11 months ago

783 Bytes

	{
	"add_bos_token":true,
	"add_eos_token":false,
	"model_max_length":2048,
	"pad_token":null,
	"sp_model_kwargs":{

	},
	"tokenizer_class":"LlamaTokenizer",
	"clean_up_tokenization_spaces":false,
	"bos_token":{
	"__type":"AddedToken",
	"content":"<s>",
	"lstrip":false,
	"normalized":true,
	"rstrip":false,
	"single_word":false
	},
	"eos_token":{
	"__type":"AddedToken",
	"content":"</s>",
	"lstrip":false,
	"normalized":true,
	"rstrip":false,
	"single_word":false
	},
	"unk_token":{
	"__type":"AddedToken",
	"content":"<unk>",
	"lstrip":false,
	"normalized":true,
	"rstrip":false,
	"single_word":false
	}
	}