---
language: [ru, tyv]
tags:
- language-classification
- russian
- tuvan
license: mit
datasets:
- custom
metrics:
- accuracy
widget:
  - text: "В Туве приступили к разработке проектно-сметной документации новой котельной Шагонара"
  - text: "Тываның Баштыңы часкы тарылга ажылдарын дүргедедирин негээн"
---

# Language Classifier

## Описание

Данная модель обучена для классификации текста на русский или тувинский язык. Модель основана на логистической регрессии и использует TF-IDF векторизацию для преобразования текста в числовые признаки. Она может быть использована для определения языка текста, что особенно полезно для многоязычных приложений.

## Архитектура модели

Модель состоит из следующих компонентов:
- **TF-IDF Vectorizer**: Преобразует текстовые данные в векторные представления.
- **Logistic Regression**: Классификатор, обученный на данных, размеченных по языкам.

## Использование

Вы можете использовать эту модель для определения языка текста. Пример использования:

```python
from transformers import pipeline

# Загрузка модели и пайплайна
classifier = pipeline("text-classification", model="tuva/turu")

# Пример текстов для классификации
texts = ["В Туве приступили к разработке проектно-сметной документации новой котельной Шагонара", "Тываның Баштыңы часкы тарылга ажылдарын дүргедедирин негээн"]

# Получение предсказаний
predictions = classifier(texts)
print(predictions)