File size: 1,402 Bytes
6c5fea7 f66be42 6c5fea7 f66be42 cfd62d2 f66be42 6c5fea7 f66be42 6c5fea7 f66be42 cfd62d2 f66be42 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 |
---
datasets:
- kuznetsoffandrey/sberquad
language:
- ru
- en
base_model:
- ai-forever/ruT5-base
---
## Описание:
Данный проект представляет собой русскоязычную модель для задач "question-answer" (QA), которая генерирует ответы на вопросы, исходя из контекста. В основе модели лежит дообученная версия ruT5-base — трансформера T5, адаптированного для русского языка. Модель была дополнительно обучена на русскоязычном датасете SberQUAD, что позволяет ей эффективно решать задачи извлечения информации из текста.
## Пример использования:
```python
from transformers import T5ForConditionalGeneration, T5Tokenizer
model = T5ForConditionalGeneration.from_pretrained("path_to_folder", use_safetensors=True)
tokenizer = T5Tokenizer.from_pretrained("path_to_folder")
def generate_answer(question: str, context: str) -> str:
input_text = f"question: {question} context: {context}"
input_ids = tokenizer.encode(input_text, return_tensors='pt')
outputs = model.generate(input_ids)
answer = tokenizer.decode(outputs[0], skip_special_tokens=True)
return answer
``` |