mesolitica
/

mallam-1.1B-4096

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

huseinzol05 commited on Nov 28, 2023

Commit

9a220aa

•

1 Parent(s): f3a6a81

Update README.md

Files changed (1) hide show

README.md +3 -2

README.md CHANGED Viewed

@@ -12,6 +12,8 @@ README at https://github.com/mesolitica/malaya/tree/5.1/pretrained-model/mistral
 WandB, https://wandb.ai/mesolitica/pretrain-mistral-1.1b?workspace=user-husein-mesolitica
 ## how-to
 ```python
@@ -26,7 +28,7 @@ nf4_config = BitsAndBytesConfig(
     bnb_4bit_compute_dtype=getattr(torch, TORCH_DTYPE)
 )
-tokenizer = AutoTokenizer.from_pretrained('mesolitica/malaysian-mistral-1.1B-4096')
 model = AutoModelForCausalLM.from_pretrained(
     'mesolitica/malaysian-mistral-1.1B-4096',
     use_flash_attention_2 = True,
@@ -34,7 +36,6 @@ model = AutoModelForCausalLM.from_pretrained(
 )
 prompt = '<s>nama saya'
 inputs = tokenizer([prompt], return_tensors='pt', add_special_tokens=False).to('cuda')
-inputs.pop('token_type_ids')
 generate_kwargs = dict(
     inputs,

 WandB, https://wandb.ai/mesolitica/pretrain-mistral-1.1b?workspace=user-husein-mesolitica
+WandB report, https://wandb.ai/mesolitica/pretrain-mistral-3b/reports/Pretrain-Larger-Malaysian-Mistral--Vmlldzo2MDkyOTgz
 ## how-to
 ```python
     bnb_4bit_compute_dtype=getattr(torch, TORCH_DTYPE)
 )
+tokenizer = AutoTokenizer.from_pretrained('mesolitica/malaysian-mistral-1.1B-4096', model_input_names = ['input_ids'])
 model = AutoModelForCausalLM.from_pretrained(
     'mesolitica/malaysian-mistral-1.1B-4096',
     use_flash_attention_2 = True,
 )
 prompt = '<s>nama saya'
 inputs = tokenizer([prompt], return_tensors='pt', add_special_tokens=False).to('cuda')
 generate_kwargs = dict(
     inputs,