--- license: mit widget: # 来自 2023年3月23日 百度首页的新闻 - text: 从北京到莫斯科 example_title: 从北京到莫斯科 - text: 色卡里的春天 example_title: 色卡里的春天 - text: 中俄联合声明 释放了几个信号 example_title: 中俄联合声明 释放了几个信号 - text: 鸡鸣寺游客爆满设反悔门引导离寺 example_title: 鸡鸣寺游客爆满设反悔门引导离寺 datasets: - fourteenBDr/toutiao language: - zh pipeline_tag: text-classification --- # 中文新闻分类模型 ## 介绍 基于 pytorch 使用[今日头条数据集](https://huggingface.co/datasets/fourteenBDr/toutiao)训练的中文新闻分类模型,用于学习中文文本分类使用,python 源码见 [main.py](./main.py) ## 使用 ```python from transformers import pipeline classifier = pipeline("text-classification", model="myml/toutiao") classifier("只要关羽不捣乱,峡谷4V5也不怕?") # echo [{'label': 'LABEL_16', 'score': 0.9958072900772095}] ``` ## 结果映射 ```txt LABEL_0 民生 故事 LABEL_1 文化 文化 LABEL_2 娱乐 娱乐 LABEL_3 体育 体育 LABEL_4 财经 财经 LABEL_6 房产 房产 LABEL_7 汽车 汽车 LABEL_8 教育 教育 LABEL_9 科技 科技 LABEL_10 军事 军事 LABEL_12 旅游 旅游 LABEL_13 国际 国际 LABEL_14 证券 股票 LABEL_15 农业 三农 LABEL_16 电竞 游戏 ```