Update README.md
Browse files
README.md
CHANGED
@@ -11,4 +11,24 @@ tags:
|
|
11 |
- cabra
|
12 |
- llama-3
|
13 |
---
|
14 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
11 |
- cabra
|
12 |
- llama-3
|
13 |
---
|
14 |
+
# Cabra Llama-3 70B
|
15 |
+
|
16 |
+
O Cabra Llama-3 70B é uma versão aprimorada do Meta-Llama-3-70B-Instruct, refinado com o uso do dataset Cabra 30k. Este modelo foi especialmente otimizado para compreender e responder em português (PT-br).
|
17 |
+
|
18 |
+
**Conheça os nossos outros modelos e datasets [modelos e datasets](https://huggingface.co/collections/botbot-ai/models-6604c2069ceef04f834ba99b).**
|
19 |
+
|
20 |
+
## Detalhes do modelo base
|
21 |
+
|
22 |
+
### Modelo: Meta-Llama-3-70B-Instruct
|
23 |
+
|
24 |
+
A Meta desenvolveu e lançou a família de modelos Llama 3, uma coleção de modelos de texto generativos pré-treinados e ajustados por instruções nos tamanhos de 8B e 70B. Os modelos Llama 3 ajustados por instruções são otimizados para casos de uso em diálogos e superam muitos dos modelos de chat de código aberto disponíveis em benchmarks comuns da indústria. Além disso, ao desenvolver esses modelos, tomamos grande cuidado para otimizar a utilidade e a segurança.
|
25 |
+
|
26 |
+
Arquitetura do Modelo: Llama 3 é um modelo de linguagem auto-regressivo que usa uma arquitetura de transformador otimizada. As versões ajustadas utilizam o aprimoramento supervisionado (SFT) e aprendizado por reforço com feedback humano (RLHF) para se alinhar às preferências humanas quanto à utilidade e segurança.
|
27 |
+
|
28 |
+
### Dataset: Cabra 30k
|
29 |
+
|
30 |
+
Dataset interno para fine-tuning. Vamos lançar em breve.
|
31 |
+
|
32 |
+
### Quantização / GGUF
|
33 |
+
|
34 |
+
Colocamos diversas versões (GGUF) quantanizadas no branch "quantanization".
|