Edit model card

Cabra Llama-3 70B

O Cabra Llama-3 70B é uma versão aprimorada do Meta-Llama-3-70B-Instruct, refinado com o uso do dataset Cabra 30k. Este modelo foi especialmente otimizado para compreender e responder em português (PT-br).

Conheça os nossos outros modelos e datasets modelos e datasets.

Detalhes do modelo base

Modelo: Meta-Llama-3-70B-Instruct

A Meta desenvolveu e lançou a família de modelos Llama 3, uma coleção de modelos de texto generativos pré-treinados e ajustados por instruções nos tamanhos de 8B e 70B. Os modelos Llama 3 ajustados por instruções são otimizados para casos de uso em diálogos e superam muitos dos modelos de chat de código aberto disponíveis em benchmarks comuns da indústria. Além disso, ao desenvolver esses modelos, tomamos grande cuidado para otimizar a utilidade e a segurança.

Arquitetura do Modelo: Llama 3 é um modelo de linguagem auto-regressivo que usa uma arquitetura de transformador otimizada. As versões ajustadas utilizam o aprimoramento supervisionado (SFT) e aprendizado por reforço com feedback humano (RLHF) para se alinhar às preferências humanas quanto à utilidade e segurança.

Dataset: Cabra 30k

Dataset interno para fine-tuning. Vamos lançar em breve.

Quantização / GGUF

Colocamos diversas versões (GGUF) quantanizadas no branch "quantanization".

Downloads last month
83
Safetensors
Model size
70.6B params
Tensor type
BF16
·
Inference API
Input a message to start chatting with botbot-ai/CabraLlama3-70b.
Model is too large to load in Inference API (serverless). To try the model, launch it on Inference Endpoints (dedicated) instead.

Dataset used to train botbot-ai/CabraLlama3-70b

Collection including botbot-ai/CabraLlama3-70b