hestenettetLM / README.md
mhenrichsen's picture
Update README.md
22df361
|
raw
history blame
808 Bytes
metadata
license: mit
datasets:
  - mhenrichsen/hestenettet
language:
  - da

HestenettetLM

En dansk LLM trænet på hele hestenettet over 3 epoker.

Modellen er baseret på Mistral 7b, og har et kontekstvindue på 8k.

from transformers import AutoTokenizer, TextStreamer, AutoModelForCausalLM

model = AutoModelForCausalLM.from_pretrained("mhenrichsen/hestenettetLM")
tokenizer = AutoTokenizer.from_pretrained("mhenrichsen/hestenettetLM")
streamer = TextStreamer(tokenizer, skip_special_tokens=True)


tokens = tokenizer(
    "Den bedste hest er en ", 
    return_tensors='pt'
)['input_ids']

# Generate output
generation_output = model.generate(
    tokens,
    streamer=streamer,
    max_length = 8194,
)

Eksempel: "Den bedste hest er en " bliver til: "Den bedste hest er en veltrænet hest."