Edit model card

Uploaded model

  • Developed by: Agnuxo
  • Developed by: Agnuxo
  • License: apache-2.0
  • Finetuned from model : unsloth/qwen2.5-7b-bnb-4bit

This qwen2 model was trained 2x faster with Unsloth and Huggingface's TRL library.

Lector y Debatidor de Documentos 📚🗣️

Este modelo es parte de un sistema de lectura y debate de documentos que utiliza dos modelos de lenguaje para generar explicaciones y simular debates sobre el contenido de documentos PDF y TXT.

Descripción del Modelo

El sistema utiliza dos modelos principales:

  1. Agente-GPT (Profesor): Agnuxo/Agente-GPT-Qwen-2.5-7B-Spanish_16bit

    • Basado en Qwen 2.5 7B, adaptado para español
    • Función: Explicar documentos y generar preguntas para el debate
  2. Agente-Llama (Periodista): Agnuxo/Agente-Llama-3.1-Spanish_16bit

    • Basado en Llama 3.1, adaptado para español
    • Función: Responder preguntas y participar en el debate con un estilo periodístico

Uso Previsto

Este modelo está diseñado para:

  • Analizar y explicar documentos en español
  • Generar debates simulados sobre el contenido de los documentos
  • Proporcionar una experiencia interactiva de aprendizaje y discusión

Limitaciones y Sesgos

  • Los modelos están optimizados para el idioma español y pueden tener un rendimiento limitado en otros idiomas.
  • La calidad del debate depende de la calidad y relevancia del documento de entrada.
  • Pueden existir sesgos inherentes a los datos de entrenamiento utilizados.

Consideraciones Éticas

  • El sistema no debe utilizarse para generar o propagar información falsa o engañosa.
  • Los usuarios deben ser conscientes de que las respuestas son generadas por IA y pueden requerir verificación humana.

Métricas de Evaluación

  • Perplexidad: [Valor]
  • Precisión en tareas de comprensión de lectura: [Valor]

Entrenamiento

Los modelos fueron fine-tuned utilizando el dataset Agnuxo/Spanish-Debate-Dataset, que contiene:

  • Transcripciones de debates en español
  • Artículos periodísticos y académicos
  • Resúmenes de documentos en diversos campos

Explicación-Debate-PDF-VOZ

Programa en local para subir documentos PDF o TXT en cualquier idioma, con Opción de consuta, explicación y Debate sobre el documento entre dos LLM GPT y Llama, con salida de voz en Español.

🖥️ Interfaz de Usuario

La interfaz gráfica incluye:

  • 💬 Área de chat para mostrar el debate
  • 🎛️ Controles de velocidad de voz
  • 🔢 Ajustes de límite de tokens
  • 📂 Botón para cargar documentos
  • ▶️ Botones para iniciar explicación o debate

🧠 Modelos de IA

El programa utiliza dos modelos de lenguaje:

  • 🧑‍🏫 Profesor-GPT: Basado en "GPT"
  • 👩‍🎤 Periodista LLAMA: Basado en "Meta-Llama-3.1-8B"

🎙️ Síntesis de Voz

Se utilizan dos modelos de TTS:

  • 🇪🇸 Modelo español para el Profesor-GPT
  • 🇦🇷 Modelo con acento argentino para la Periodista LLAMA

📝 Notas Adicionales

  • El programa convierte números y fórmulas a texto para mejorar la síntesis de voz.
  • Se incluyen controles para ajustar la velocidad de reproducción de voz.
  • La interfaz permite una fácil navegación y control del proceso de lectura y debate.

Desarrollado por [Francisco Angulo de Lafuente]

📚 Lector y Debatidor de Documentos

Banner

🌟 Características Principales

  • 📖 Lectura de documentos PDF y TXT
  • 🗣️ Explicación del contenido en español
  • 🎭 Debate simulado entre dos IA
  • 🔊 Síntesis de voz para las respuestas
  • 🖥️ Interfaz gráfica moderna y fácil de usar

🛠️ Tecnologías Utilizadas

  • Python
  • PyQt5 para la interfaz gráfica
  • Transformers para modelos de lenguaje
  • TTS para síntesis de voz
  • PyPDF2 para lectura de PDFs

🚀 Cómo Funciona

El programa ofrece una experiencia interactiva de lectura y debate de documentos:

1️⃣ Carga de Documentos: Sube fácilmente archivos PDF o TXT.

2️⃣ Explicación del Contenido: Una IA explica el documento de forma clara y concisa.

3️⃣ Debate Simulado: Dos IA, un "Profesor-GPT" y una "Periodista LLAMA", debaten sobre el contenido.

4️⃣ Síntesis de Voz: Las respuestas se convierten en audio para una experiencia más inmersiva.

5️⃣ Interacción del Usuario: Participa en el debate añadiendo tus propios comentarios o preguntas.

Citación

Si utilizas este modelo en tu investigación, por favor cita:

Downloads last month
11
Safetensors
Model size
3.4B params
Tensor type
BF16
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Dataset used to train Agnuxo/Agente-GPT-Qwen2.5-3B-Instruct-Spanish_16bit