agent-comment

Sleeping

App Files Files Community

agent-comment / app.py

BugZoid

Update app.py

aeb2715 verified 3 months ago

raw

history blame

6.24 kB

	import streamlit as st
	from transformers import T5ForConditionalGeneration, T5Tokenizer
	import torch
	from torch.utils.data import Dataset, DataLoader
	import json
	import os
	from datetime import datetime

	# Custom dataset for fine-tuning
	class TextHumanizerDataset(Dataset):
	def __init__(self, data, tokenizer, max_length=512):
	self.data = data
	self.tokenizer = tokenizer
	self.max_length = max_length

	def __len__(self):
	return len(self.data)

	def __getitem__(self, idx):
	item = self.data[idx]
	input_encoding = self.tokenizer(
	f"reescreva em português natural, mantendo todas as informações: {item['input_text']}",
	max_length=self.max_length,
	padding='max_length',
	truncation=True,
	return_tensors='pt'
	)

	target_encoding = self.tokenizer(
	item['output_text'],
	max_length=self.max_length,
	padding='max_length',
	truncation=True,
	return_tensors='pt'
	)

	return {
	'input_ids': input_encoding['input_ids'].squeeze(),
	'attention_mask': input_encoding['attention_mask'].squeeze(),
	'labels': target_encoding['input_ids'].squeeze()
	}

	def save_feedback(input_text, output_text, rating):
	"""Salva o feedback do usuário para futuro treinamento"""
	feedback_data = {
	'input_text': input_text,
	'output_text': output_text,
	'rating': rating,
	'timestamp': datetime.now().isoformat()
	}

	# Cria diretório se não existir
	os.makedirs('feedback_data', exist_ok=True)

	# Salva em arquivo JSON
	with open('feedback_data/feedback.json', 'a') as f:
	f.write(json.dumps(feedback_data) + '\n')

	def fine_tune_model():
	"""Realiza fine-tuning do modelo com dados de feedback positivo"""
	if not os.path.exists('feedback_data/feedback.json'):
	return

	# Carrega dados de feedback
	positive_examples = []
	with open('feedback_data/feedback.json', 'r') as f:
	for line in f:
	feedback = json.loads(line)
	if feedback['rating'] >= 4: # Usa apenas feedback positivo
	positive_examples.append({
	'input_text': feedback['input_text'],
	'output_text': feedback['output_text']
	})

	if not positive_examples:
	return

	# Cria dataset e dataloader
	dataset = TextHumanizerDataset(positive_examples, st.session_state.tokenizer)
	dataloader = DataLoader(dataset, batch_size=4, shuffle=True)

	# Configura otimizador
	optimizer = torch.optim.AdamW(st.session_state.model.parameters(), lr=1e-5)

	# Fine-tuning
	st.session_state.model.train()
	for batch in dataloader:
	optimizer.zero_grad()
	outputs = st.session_state.model(
	input_ids=batch['input_ids'],
	attention_mask=batch['attention_mask'],
	labels=batch['labels']
	)
	loss = outputs.loss
	loss.backward()
	optimizer.step()

	st.session_state.model.eval()

	# Initialize session state
	if 'model_loaded' not in st.session_state:
	st.session_state.tokenizer = T5Tokenizer.from_pretrained("t5-base")
	st.session_state.model = T5ForConditionalGeneration.from_pretrained("t5-base")
	st.session_state.model_loaded = True

	# Rest of your existing functions (clean_generated_text and humanize_text remain the same)
	[Previous clean_generated_text and humanize_text functions remain unchanged]

	# UI Components
	st.set_page_config(page_title="Advanced Text Humanizer", page_icon="🤖")

	st.title("🤖 → 🧑 Humanizador de Texto Avançado")
	st.markdown("""
	Este aplicativo transforma textos robotizados em linguagem mais natural e humana,
	mantendo todas as informações originais e incluindo sistema de feedback para melhoria contínua.
	""")

	# Input area
	input_text = st.text_area(
	"Cole seu texto de robô aqui:",
	height=150,
	help="Cole seu texto aqui para transformá-lo em uma versão mais natural e humana."
	)

	# Process button and results
	if st.button("Humanizar", type="primary"):
	if not input_text:
	st.warning("⚠️ Por favor, cole um texto primeiro!")
	else:
	with st.spinner("Processando o texto..."):
	try:
	final_text = humanize_text(input_text)

	# Display results
	st.success("✨ Texto humanizado:")
	col1, col2 = st.columns(2)

	with col1:
	st.text("Original:")
	st.info(input_text)
	st.write(f"Palavras: {len(input_text.split())}")

	with col2:
	st.text("Resultado:")
	st.info(final_text)
	st.write(f"Palavras: {len(final_text.split())}")

	# Feedback section
	st.markdown("### Feedback")
	rating = st.slider(
	"Como você avalia a qualidade do texto humanizado?",
	min_value=1,
	max_value=5,
	value=3,
	help="1 = Muito ruim, 5 = Excelente"
	)

	if st.button("Enviar Feedback"):
	save_feedback(input_text, final_text, rating)
	st.success("Feedback salvo com sucesso! Obrigado pela contribuição.")

	# Trigger fine-tuning if we have enough positive feedback
	if rating >= 4:
	with st.spinner("Atualizando modelo com seu feedback..."):
	fine_tune_model()
	st.success("Modelo atualizado com sucesso!")

	except Exception as e:
	st.error(f"❌ Erro no processamento: {str(e)}")

	# Footer
	st.markdown("---")
	st.markdown(
	"""
	<div style='text-align: center'>
	<small>Desenvolvido com ❤️ usando Streamlit e Transformers</small>
	</div>
	""",
	unsafe_allow_html=True
	)