File size: 5,182 Bytes
0569f0a 03b95e4 0569f0a 03b95e4 0569f0a 03b95e4 0569f0a 03b95e4 0569f0a 03b95e4 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 |
---
base_model: unsloth/qwen2.5-7b-bnb-4bit
language:
- en
- es
license: apache-2.0
tags:
- text-generation-inference
- transformers
- unsloth
- qwen2
- trl
- sft
datasets:
- Agnuxo/Agente-Director
---
# Uploaded model
[<img src="https://github.githubassets.com/assets/GitHub-Mark-ea2971cee799.png" width="100"/><img src="https://github.githubassets.com/assets/GitHub-Logo-ee398b662d42.png" width="100"/>](https://github.com/Agnuxo1)
- **Developed by:** [Agnuxo](https://github.com/Agnuxo1/Explicaci-n-Debate-PDF)
- **Developed by:** Agnuxo
- **License:** apache-2.0
- **Finetuned from model :** unsloth/qwen2.5-7b-bnb-4bit
This qwen2 model was trained 2x faster with [Unsloth](https://github.com/unslothai/unsloth) and Huggingface's TRL library.
[<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth)
# Lector y Debatidor de Documentos 📚🗣️
Este modelo es parte de un sistema de lectura y debate de documentos que utiliza dos modelos de lenguaje para generar explicaciones y simular debates sobre el contenido de documentos PDF y TXT.
## Descripción del Modelo
El sistema utiliza dos modelos principales:
1. **Agente-GPT (Profesor)**: `Agnuxo/Agente-GPT-Qwen-2.5-7B-Spanish_16bit`
- Basado en Qwen 2.5 7B, adaptado para español
- Función: Explicar documentos y generar preguntas para el debate
2. **Agente-Llama (Periodista)**: `Agnuxo/Agente-Llama-3.1-Spanish_16bit`
- Basado en Llama 3.1, adaptado para español
- Función: Responder preguntas y participar en el debate con un estilo periodístico
## Uso Previsto
Este modelo está diseñado para:
- Analizar y explicar documentos en español
- Generar debates simulados sobre el contenido de los documentos
- Proporcionar una experiencia interactiva de aprendizaje y discusión
## Limitaciones y Sesgos
- Los modelos están optimizados para el idioma español y pueden tener un rendimiento limitado en otros idiomas.
- La calidad del debate depende de la calidad y relevancia del documento de entrada.
- Pueden existir sesgos inherentes a los datos de entrenamiento utilizados.
## Consideraciones Éticas
- El sistema no debe utilizarse para generar o propagar información falsa o engañosa.
- Los usuarios deben ser conscientes de que las respuestas son generadas por IA y pueden requerir verificación humana.
## Métricas de Evaluación
- Perplexidad: [Valor]
- Precisión en tareas de comprensión de lectura: [Valor]
## Entrenamiento
Los modelos fueron fine-tuned utilizando el dataset `Agnuxo/Spanish-Debate-Dataset`, que contiene:
- Transcripciones de debates en español
- Artículos periodísticos y académicos
- Resúmenes de documentos en diversos campos
# Explicación-Debate-PDF-VOZ
Programa en local para subir documentos PDF o TXT en cualquier idioma, con Opción de consuta, explicación y Debate sobre el documento entre dos LLM GPT y Llama, con salida de voz en Español.
## 🖥️ Interfaz de Usuario
La interfaz gráfica incluye:
- 💬 Área de chat para mostrar el debate
- 🎛️ Controles de velocidad de voz
- 🔢 Ajustes de límite de tokens
- 📂 Botón para cargar documentos
- ▶️ Botones para iniciar explicación o debate
## 🧠 Modelos de IA
El programa utiliza dos modelos de lenguaje:
- 🧑🏫 **Profesor-GPT**: Basado en "GPT"
- 👩🎤 **Periodista LLAMA**: Basado en "Meta-Llama-3.1-8B"
## 🎙️ Síntesis de Voz
Se utilizan dos modelos de TTS:
- 🇪🇸 Modelo español para el Profesor-GPT
- 🇦🇷 Modelo con acento argentino para la Periodista LLAMA
## 📝 Notas Adicionales
- El programa convierte números y fórmulas a texto para mejorar la síntesis de voz.
- Se incluyen controles para ajustar la velocidad de reproducción de voz.
- La interfaz permite una fácil navegación y control del proceso de lectura y debate.
---
Desarrollado por [Francisco Angulo de Lafuente]
# 📚 Lector y Debatidor de Documentos
![Banner](https://github.com/Agnuxo1/Explicaci-n-Debate-PDF)
## 🌟 Características Principales
- 📖 Lectura de documentos PDF y TXT
- 🗣️ Explicación del contenido en español
- 🎭 Debate simulado entre dos IA
- 🔊 Síntesis de voz para las respuestas
- 🖥️ Interfaz gráfica moderna y fácil de usar
## 🛠️ Tecnologías Utilizadas
- Python
- PyQt5 para la interfaz gráfica
- Transformers para modelos de lenguaje
- TTS para síntesis de voz
- PyPDF2 para lectura de PDFs
## 🚀 Cómo Funciona
El programa ofrece una experiencia interactiva de lectura y debate de documentos:
1️⃣ **Carga de Documentos**: Sube fácilmente archivos PDF o TXT.
2️⃣ **Explicación del Contenido**: Una IA explica el documento de forma clara y concisa.
3️⃣ **Debate Simulado**: Dos IA, un "Profesor-GPT" y una "Periodista LLAMA", debaten sobre el contenido.
4️⃣ **Síntesis de Voz**: Las respuestas se convierten en audio para una experiencia más inmersiva.
5️⃣ **Interacción del Usuario**: Participa en el debate añadiendo tus propios comentarios o preguntas.
## Citación
Si utilizas este modelo en tu investigación, por favor cita:
|