Spaces:

HugoHE
/

xinwen-classifier

Running

Update app.py

97ebb40 about 1 year ago

1.44 kB

	import gradio as gr
	import transformers
	from transformers import pipeline, BertForSequenceClassification, BertTokenizer

	def classify(input_text):
	tokenizer = BertTokenizer.from_pretrained('bert-base-chinese')
	model = BertForSequenceClassification.from_pretrained('./bert-cls')
	classifier = pipeline("text-classification", model=model, tokenizer=tokenizer, top_k=3)
	class_dict = {0:'story',
	1:'culture',
	2:'entertainment',
	3:'sports',
	4:'finance',
	6:'house',
	7:'car',
	8:'edu',
	9:'tech',
	10:'military',
	12:'travel',
	13:'world',
	14:'stock',
	15:'argriculture',
	16:'game'}
	output = classifier([input_text])
	idx_list = [output[0][i]['label'].split('_')[1] for i in range(len(output[0]))]
	label_list = [class_dict[int(idx)] for idx in idx_list]
	score_list = [output[0][i]['score'] for i in range(len(output[0]))]
	return dict(zip(label_list, score_list))
	examples = ["习近平驾崩", "吴亦凡出狱"]
	label = gr.Label()
	iface = gr.Interface(fn = classify,
	inputs = "text",
	outputs = label,
	title = 'chinese news classification',
	examples = examples)

	iface.launch(inline = False)