Update README.md

59252ce verified 3 months ago

5.18 kB

	---
	base_model: unsloth/qwen2.5-7b-bnb-4bit
	language:
	- en
	- es
	license: apache-2.0
	tags:
	- text-generation-inference
	- transformers
	- unsloth
	- qwen2
	- trl
	- sft
	datasets:
	- Agnuxo/Agente-Director
	---

	# Uploaded model

	[<img src="https://github.githubassets.com/assets/GitHub-Mark-ea2971cee799.png" width="100"/><img src="https://github.githubassets.com/assets/GitHub-Logo-ee398b662d42.png" width="100"/>](https://github.com/Agnuxo1)
	- Developed by: [Agnuxo](https://github.com/Agnuxo1/Explicaci-n-Debate-PDF)
	- Developed by: Agnuxo
	- License: apache-2.0
	- Finetuned from model : unsloth/qwen2.5-7b-bnb-4bit

	This qwen2 model was trained 2x faster with [Unsloth](https://github.com/unslothai/unsloth) and Huggingface's TRL library.

	[<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth)


	# Lector y Debatidor de Documentos 📚🗣️

	Este modelo es parte de un sistema de lectura y debate de documentos que utiliza dos modelos de lenguaje para generar explicaciones y simular debates sobre el contenido de documentos PDF y TXT.

	## Descripción del Modelo

	El sistema utiliza dos modelos principales:

	1. Agente-GPT (Profesor): `Agnuxo/Agente-GPT-Qwen-2.5-7B-Spanish_16bit`
	- Basado en Qwen 2.5 7B, adaptado para español
	- Función: Explicar documentos y generar preguntas para el debate

	2. Agente-Llama (Periodista): `Agnuxo/Agente-Llama-3.1-Spanish_16bit`
	- Basado en Llama 3.1, adaptado para español
	- Función: Responder preguntas y participar en el debate con un estilo periodístico

	## Uso Previsto

	Este modelo está diseñado para:
	- Analizar y explicar documentos en español
	- Generar debates simulados sobre el contenido de los documentos
	- Proporcionar una experiencia interactiva de aprendizaje y discusión

	## Limitaciones y Sesgos

	- Los modelos están optimizados para el idioma español y pueden tener un rendimiento limitado en otros idiomas.
	- La calidad del debate depende de la calidad y relevancia del documento de entrada.
	- Pueden existir sesgos inherentes a los datos de entrenamiento utilizados.

	## Consideraciones Éticas

	- El sistema no debe utilizarse para generar o propagar información falsa o engañosa.
	- Los usuarios deben ser conscientes de que las respuestas son generadas por IA y pueden requerir verificación humana.

	## Métricas de Evaluación

	- Perplexidad: [Valor]
	- Precisión en tareas de comprensión de lectura: [Valor]

	## Entrenamiento

	Los modelos fueron fine-tuned utilizando el dataset `Agnuxo/Spanish-Debate-Dataset`, que contiene:
	- Transcripciones de debates en español
	- Artículos periodísticos y académicos
	- Resúmenes de documentos en diversos campos

	# Explicación-Debate-PDF-VOZ
	Programa en local para subir documentos PDF o TXT en cualquier idioma, con Opción de consuta, explicación y Debate sobre el documento entre dos LLM GPT y Llama, con salida de voz en Español.

	## 🖥️ Interfaz de Usuario

	La interfaz gráfica incluye:

	- 💬 Área de chat para mostrar el debate
	- 🎛️ Controles de velocidad de voz
	- 🔢 Ajustes de límite de tokens
	- 📂 Botón para cargar documentos
	- ▶️ Botones para iniciar explicación o debate


	## 🧠 Modelos de IA

	El programa utiliza dos modelos de lenguaje:

	- 🧑‍🏫 Profesor-GPT: Basado en "GPT"
	- 👩‍🎤 Periodista LLAMA: Basado en "Meta-Llama-3.1-8B"


	## 🎙️ Síntesis de Voz

	Se utilizan dos modelos de TTS:

	- 🇪🇸 Modelo español para el Profesor-GPT
	- 🇦🇷 Modelo con acento argentino para la Periodista LLAMA


	## 📝 Notas Adicionales

	- El programa convierte números y fórmulas a texto para mejorar la síntesis de voz.
	- Se incluyen controles para ajustar la velocidad de reproducción de voz.
	- La interfaz permite una fácil navegación y control del proceso de lectura y debate.


	---

	Desarrollado por [Francisco Angulo de Lafuente]

	# 📚 Lector y Debatidor de Documentos

	![Banner](https://github.com/Agnuxo1/Explicaci-n-Debate-PDF)

	## 🌟 Características Principales

	- 📖 Lectura de documentos PDF y TXT
	- 🗣️ Explicación del contenido en español
	- 🎭 Debate simulado entre dos IA
	- 🔊 Síntesis de voz para las respuestas
	- 🖥️ Interfaz gráfica moderna y fácil de usar

	## 🛠️ Tecnologías Utilizadas

	- Python
	- PyQt5 para la interfaz gráfica
	- Transformers para modelos de lenguaje
	- TTS para síntesis de voz
	- PyPDF2 para lectura de PDFs

	## 🚀 Cómo Funciona

	El programa ofrece una experiencia interactiva de lectura y debate de documentos:

	1️⃣ Carga de Documentos: Sube fácilmente archivos PDF o TXT.

	2️⃣ Explicación del Contenido: Una IA explica el documento de forma clara y concisa.

	3️⃣ Debate Simulado: Dos IA, un "Profesor-GPT" y una "Periodista LLAMA", debaten sobre el contenido.

	4️⃣ Síntesis de Voz: Las respuestas se convierten en audio para una experiencia más inmersiva.

	5️⃣ Interacción del Usuario: Participa en el debate añadiendo tus propios comentarios o preguntas.

	## Citación

	Si utilizas este modelo en tu investigación, por favor cita: