asrใฎๆ–‡ๅญ—่ตทใ“ใ—็ตๆžœใ‚’็”จใ„ใฆ่ชคๅญ—ใ‚’ไฟฎๆญฃใ™ใ‚‹ใŸใ‚ใซไฝœๆˆใ—ใŸใƒขใƒ‡ใƒซใงใ™ใ€‚
ไธปใซใƒ‡ใƒผใ‚ฟใ‚ปใƒƒใƒˆๆ•ดๅฝขใซ็‰นๅŒ–ใ•ใ›ใŸใƒขใƒ‡ใƒซใงใ™ใ€‚
ใƒซใƒผใƒซใƒ™ใƒผใ‚นใงใฏใชใ„่ชคๅญ—ไฟฎๆญฃใ‚’่กŒใ†ใ“ใจใŒใงใใ‚‹ใ“ใจใ‚’็›ฎๆŒ‡ใ—ใฆใ„ใพใ™ใ€‚

ไฝฟใ„ๆ–นใฏไธ‹่จ˜ใ‚ณใƒผใƒ‰ใ‚’ๅ‚็…งใ—ใฆใใ ใ•ใ„ใ€‚

# ๅ‡บๅŠ›ใฎใ‚นใ‚ณใ‚ขใ‚’ๅซใ‚ใฆ็”Ÿๆˆใ™ใ‚‹
import os
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, TextStreamer


# CUDAใƒ‡ใƒใ‚คใ‚นใฎ่จญๅฎš
os.environ["CUDA_VISIBLE_DEVICES"] = "0"

# ใƒขใƒ‡ใƒซใจใƒˆใƒผใ‚ฏใƒŠใ‚คใ‚ถใƒผใฎใƒ‡ใ‚ฃใƒฌใ‚ฏใƒˆใƒช
MODEL_DIRECTORY = ("swdq/ASR-Fixer")


def load_model_and_tokenizer():
    tokenizer = AutoTokenizer.from_pretrained(MODEL_DIRECTORY)
    model = AutoModelForCausalLM.from_pretrained(
        MODEL_DIRECTORY,
        device_map="auto",
        use_auth_token=True,
        torch_dtype=torch.float16,
    )
    return tokenizer, model


def generate_text(prompt, tokenizer, model):
    streamer = TextStreamer(tokenizer, skip_prompt=False)
    inputs = tokenizer(prompt, return_tensors="pt").to("cuda")

    # ๅ‡บๅŠ›ใฎใ‚นใ‚ณใ‚ขใ‚’ๅซใ‚ใฆ็”Ÿๆˆใ™ใ‚‹
    outputs = model.generate(
        input_ids=inputs["input_ids"],
        attention_mask=inputs["attention_mask"],
        max_new_tokens=500,
        min_new_tokens=1,
        do_sample=True,
        top_k=1,
        repetition_penalty=1.0,
        temperature=0.1,
        use_cache=True,
        bos_token_id=tokenizer.bos_token_id,
        eos_token_id=tokenizer.eos_token_id,
        streamer=streamer,
    )

    return tokenizer.decode(outputs[0], skip_special_tokens=True)


"""ใƒกใ‚คใƒณใƒซใƒผใƒ—้–ขๆ•ฐ"""
tokenizer, model = load_model_and_tokenizer()

text = "ใ‚Œใ‚ใ‚Œใ‚โ€ฆใ˜ใ‚…ใ‚‹ใ‚‹โ€ฆใ“ใฎใŠใกใ‚“ใกใ‚“ใชใ‚‰โ€ฆใกใ‚…ใฑใ€ใกใ‚…ใ‚‹โ€ฆใกใ‚ƒใ‚“ใจใƒžใƒžใฎ่จ€ใ†ใ“ใจ่žใ‘ใพใกใ‚…ใ‚ˆโ€ฆ"
initial_prompt = f"ASR: {text} ๆญฃ่งฃ: "
generated_text = generate_text(initial_prompt, tokenizer, model)
result = generated_text.split("ๆญฃ่งฃ: ", 1)[-1].strip()
print(text)
print(result)

ไพ‹(ใƒ‡ใƒผใ‚ฟใ‚ปใƒƒใƒˆใซใชใ„ใƒ†ใ‚ญใ‚นใƒˆ)
asr ใ‚Œใ‚ใ‚Œใ‚โ€ฆใ˜ใ‚…ใ‚‹ใ‚‹โ€ฆใ“ใฎใŠใกใ‚“ใกใ‚“ใชใ‚‰โ€ฆใกใ‚…ใฑใ€ใกใ‚…ใ‚‹โ€ฆใกใ‚ƒใ‚“ใจใƒžใƒžใฎ่จ€ใ†ใ“ใจ่žใ‘ใพใกใ‚…ใ‚ˆโ€ฆ
true ใ‚Œใ‚ใ‚Œใ‚โ€ฆใกใ‚…ใ‚‹ใ‚‹โ€ฆใ“ใฎใŠใกใ‚“ใกใ‚“ใชใ‚‰โ€ฆใกใ‚…ใฑใ€ใกใ‚…ใ‚‹โ€ฆใกใ‚ƒใ‚“ใจใƒžใƒžใฎ่จ€ใ†ใ“ใจใ€่žใ‘ใพใกใ‚…ใ‚ˆโ€ฆ
asr ่งฆใ‚‰ใ‚Œใ‚‹ใจใดใใฃใจใ™ใ‚‹ๆฐ—ๆŒใกใŒใ‚ใ‹ใ‚Šใพใ—ใŸ ใใ™ใใฃใŸใ„ใ‚ˆใ†ใชโ€ฆๆฐ—ๆŒใกใ„ใ„ใ‚ˆใ†ใชโ€ฆใ‚“ใฃโ€ฆ
true ่งฆใ‚‰ใ‚Œใ‚‹ใจใ€ใดใใฃใจใ™ใ‚‹ๆฐ—ๆŒใกใŒใ‚ใ‹ใ‚Šใพใ—ใŸโ€ฆใใ™ใใฃใŸใ„ใ‚ˆใ†ใชโ€ฆๆฐ—ๆŒใกใ„ใ„ใ‚ˆใ†ใชโ€ฆใ‚“ใฃโ€ฆ
asr ใˆใธใธโ€ฆ็งใฎใŠๅฃใงใ€ใงใ™ใ‘ใฉโ€ฆ ใ‚ใฏใฏโ€ฆใฃใฆใ‹ใ€ใ‚ใฏโ€ฆใ‚„ใฃใฑใ‚Šใ€็ตๆง‹ๅ‹ƒใฃใกใ‚ƒใฃใฆใพใ™ใ‚ˆใญใ€ใ“ใ‚Œใ€‚
true ใˆใธใธโ€ฆ็งใฎใŠๅฃใงใ€ใงใ™ใ‘ใฉโ€ฆใ‚ใฏใฏโ€ฆใฃใฆใ‹ใ€ใ‚ใฏใฏโ€ฆใ‚„ใฃใฑใ‚Šใ€็ตๆง‹ๅ‹ƒใฃใกใ‚ƒใฃใฆใพใ™ใ‚ˆใญใ€ใ“ใ‚Œใ€‚
asr ๅŠใกใ‚ƒใพใ€ใŠใฃใ€ใŠใฃใ€ใŠใ‚›ใฃใ€ใŠใฃใ€ใŠใŠใฃใ€ใ‚คใ‚ฐโ€ฆใƒƒใ€ใŠใ‰ใ€ใŠใŠใ‚›ใŠใ‚›ใŠใ‰ใ‰ใƒƒใƒƒ!
true ๅŠใกใ‚ƒใพใ€ใŠใฃใ€ใŠใฃใ€ใŠใ‰ใฃใ€ใŠใŠใฃใ€ใ‚คใ‚ฐโ€ฆใƒƒใ€ใŠใ‰ใ€ใŠใ‰ใ€ใŠใ‰ใ‰ใŠใŠใ‰ใ‰ใŠใŠใ‰ใ‰ใŠใŠใ‰ใ‰ใŠใŠใ‰ใŠใŠใƒƒใƒƒ!
asr ใ•ใ‚ใ•ใ‚ใ€ใŠใกใ‚“ใฝๅ‡บใ—ใŸใ‚“ใ ใ‹ใ‚‰ใ€ๆฌกใฏไพฟๅ™จใซๅ‰ฅใ„ใฆใ€ใŠใ—ใฃใ“ใ‚ทใƒฃใƒผใฃใฆใ—ใกใ‚ƒใŠ
true ใ•ใ‚ใ•ใ‚ใ€ใŠใกใ‚“ใฝๅ‡บใ—ใŸใ‚“ใ ใ‹ใ‚‰ใ€ๆฌกใฏไพฟๅ™จใซๅ‰ฅใ„ใฆใ€ใŠใ—ใฃใ“ใ—ใ‚ƒใƒผใฃใฆใ—ใกใ‚ƒใŠ
asr ๅ‡บใ—ใฆๅ‡บใ—ใฆใ€ใ‚ถใƒผใƒกใƒณๅ‡บใ—ใฆใ€ใ–ใƒผใ‚ใ‚“ๅ‡บใ—ใฆใ€‚
true ๅ‡บใ—ใฆๅ‡บใ—ใฆใ€ใ‚ถใƒผใƒกใƒณๅ‡บใ—ใฆใ€ใ‚ถใƒผใƒกใƒณๅ‡บใ—ใฆใ€‚
asr ใ–ใƒผใ‚ใƒผใ‚“ใ€ใ›ใƒผใˆใ ็ฒพๅญใ€ใพใฃใ—ใ‚ใ‚’็Ž‰ใ•ใใ—โ€ฆใ„ใฃใฑใ„็œ‰ใฎ่ถณใซใถใฃใ‹ใ‘ใฆใใ ใ•ใ„ใ€‚
true ใ–ใƒผใ‚ใƒผใ‚“ใ€ใ›ใƒผใˆใ

modelใฏLocal-Novel-LLM-project/Vecteus-v1ใ‚’sftใง็‹ฌ่‡ชใƒ‡ใƒผใ‚ฟใ‚ปใƒƒใƒˆใ‚’็”จใ„ใฆ่จ“็ทดใ—ใพใ—ใŸใ€‚

image/png

Downloads last month
18
Safetensors
Model size
7.24B params
Tensor type
FP16
ยท
Inference Examples
Unable to determine this model's library. Check the docs .

Model tree for swdq/ASR-Fixer

Finetuned
(2)
this model
Quantizations
1 model

Dataset used to train swdq/ASR-Fixer