Agnuxo's picture
Update README.md
73856b1 verified
|
raw
history blame
5.19 kB
---
base_model: unsloth/qwen2.5-3b-instruct-bnb-4bit
language:
- en
- es
license: apache-2.0
tags:
- text-generation-inference
- transformers
- unsloth
- qwen2
- trl
- sft
datasets:
- Agnuxo/Agente-Director
---
# Uploaded model
[<img src="https://github.githubassets.com/assets/GitHub-Mark-ea2971cee799.png" width="100"/><img src="https://github.githubassets.com/assets/GitHub-Logo-ee398b662d42.png" width="100"/>](https://github.com/Agnuxo1)
- **Developed by:** [Agnuxo](https://github.com/Agnuxo1/Explicaci-n-Debate-PDF)
- **Developed by:** Agnuxo
- **License:** apache-2.0
- **Finetuned from model :** unsloth/qwen2.5-7b-bnb-4bit
This qwen2 model was trained 2x faster with [Unsloth](https://github.com/unslothai/unsloth) and Huggingface's TRL library.
[<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth)
# Lector y Debatidor de Documentos 📚🗣️
Este modelo es parte de un sistema de lectura y debate de documentos que utiliza dos modelos de lenguaje para generar explicaciones y simular debates sobre el contenido de documentos PDF y TXT.
## Descripción del Modelo
El sistema utiliza dos modelos principales:
1. **Agente-GPT (Profesor)**: `Agnuxo/Agente-GPT-Qwen-2.5-7B-Spanish_16bit`
- Basado en Qwen 2.5 7B, adaptado para español
- Función: Explicar documentos y generar preguntas para el debate
2. **Agente-Llama (Periodista)**: `Agnuxo/Agente-Llama-3.1-Spanish_16bit`
- Basado en Llama 3.1, adaptado para español
- Función: Responder preguntas y participar en el debate con un estilo periodístico
## Uso Previsto
Este modelo está diseñado para:
- Analizar y explicar documentos en español
- Generar debates simulados sobre el contenido de los documentos
- Proporcionar una experiencia interactiva de aprendizaje y discusión
## Limitaciones y Sesgos
- Los modelos están optimizados para el idioma español y pueden tener un rendimiento limitado en otros idiomas.
- La calidad del debate depende de la calidad y relevancia del documento de entrada.
- Pueden existir sesgos inherentes a los datos de entrenamiento utilizados.
## Consideraciones Éticas
- El sistema no debe utilizarse para generar o propagar información falsa o engañosa.
- Los usuarios deben ser conscientes de que las respuestas son generadas por IA y pueden requerir verificación humana.
## Métricas de Evaluación
- Perplexidad: [Valor]
- Precisión en tareas de comprensión de lectura: [Valor]
## Entrenamiento
Los modelos fueron fine-tuned utilizando el dataset `Agnuxo/Spanish-Debate-Dataset`, que contiene:
- Transcripciones de debates en español
- Artículos periodísticos y académicos
- Resúmenes de documentos en diversos campos
# Explicación-Debate-PDF-VOZ
Programa en local para subir documentos PDF o TXT en cualquier idioma, con Opción de consuta, explicación y Debate sobre el documento entre dos LLM GPT y Llama, con salida de voz en Español.
## 🖥️ Interfaz de Usuario
La interfaz gráfica incluye:
- 💬 Área de chat para mostrar el debate
- 🎛️ Controles de velocidad de voz
- 🔢 Ajustes de límite de tokens
- 📂 Botón para cargar documentos
- ▶️ Botones para iniciar explicación o debate
## 🧠 Modelos de IA
El programa utiliza dos modelos de lenguaje:
- 🧑‍🏫 **Profesor-GPT**: Basado en "GPT"
- 👩‍🎤 **Periodista LLAMA**: Basado en "Meta-Llama-3.1-8B"
## 🎙️ Síntesis de Voz
Se utilizan dos modelos de TTS:
- 🇪🇸 Modelo español para el Profesor-GPT
- 🇦🇷 Modelo con acento argentino para la Periodista LLAMA
## 📝 Notas Adicionales
- El programa convierte números y fórmulas a texto para mejorar la síntesis de voz.
- Se incluyen controles para ajustar la velocidad de reproducción de voz.
- La interfaz permite una fácil navegación y control del proceso de lectura y debate.
---
Desarrollado por [Francisco Angulo de Lafuente]
# 📚 Lector y Debatidor de Documentos
![Banner](https://github.com/Agnuxo1/Explicaci-n-Debate-PDF)
## 🌟 Características Principales
- 📖 Lectura de documentos PDF y TXT
- 🗣️ Explicación del contenido en español
- 🎭 Debate simulado entre dos IA
- 🔊 Síntesis de voz para las respuestas
- 🖥️ Interfaz gráfica moderna y fácil de usar
## 🛠️ Tecnologías Utilizadas
- Python
- PyQt5 para la interfaz gráfica
- Transformers para modelos de lenguaje
- TTS para síntesis de voz
- PyPDF2 para lectura de PDFs
## 🚀 Cómo Funciona
El programa ofrece una experiencia interactiva de lectura y debate de documentos:
1️⃣ **Carga de Documentos**: Sube fácilmente archivos PDF o TXT.
2️⃣ **Explicación del Contenido**: Una IA explica el documento de forma clara y concisa.
3️⃣ **Debate Simulado**: Dos IA, un "Profesor-GPT" y una "Periodista LLAMA", debaten sobre el contenido.
4️⃣ **Síntesis de Voz**: Las respuestas se convierten en audio para una experiencia más inmersiva.
5️⃣ **Interacción del Usuario**: Participa en el debate añadiendo tus propios comentarios o preguntas.
## Citación
Si utilizas este modelo en tu investigación, por favor cita: