aixsatoshi commited on
Commit
bd9219f
·
verified ·
1 Parent(s): 62e48e5

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +2 -2
README.md CHANGED
@@ -1,8 +1,8 @@
1
  ---
2
  license: llama3
3
  ---
4
- ** モデル概要 **
5
  Llama-3-8b-Cosmopedia-japaneseモデルは、優れた性能を認められているLlama-3-8bモデルの日本語ドメインへの適応を目的として設計されました。Llama-3-8bはその高い能力にも関わらず、英語と日本語の推論結果には顕著な差があり、日本語のパフォーマンスが劣っていました。私たちの目標は、Llama-3-8bの高度な論理的推論能力を損なうことなく、このモデルを日本語に適応させることでした。
6
 
7
- ** 外部翻訳システムを利用したトレーニングと開発 **
8
  適応戦略として、Mixtralの推論能力の中核を凝縮したcosmopediaデータを外部の翻訳システムを通じて日本語に翻訳し、この日本語のcosmopediaデータを使用してLlama-3-8bモデルの追加トレーニングを行い、日本語ドメインへの適応を図りました。Llama-3-8bの論理的推論能力を日本語のコンテキストに円滑に移行させ、日本語でのパフォーマンス向上を目標としました。
 
1
  ---
2
  license: llama3
3
  ---
4
+ **モデル概要**
5
  Llama-3-8b-Cosmopedia-japaneseモデルは、優れた性能を認められているLlama-3-8bモデルの日本語ドメインへの適応を目的として設計されました。Llama-3-8bはその高い能力にも関わらず、英語と日本語の推論結果には顕著な差があり、日本語のパフォーマンスが劣っていました。私たちの目標は、Llama-3-8bの高度な論理的推論能力を損なうことなく、このモデルを日本語に適応させることでした。
6
 
7
+ **外部翻訳システムを利用したトレーニングと開発**
8
  適応戦略として、Mixtralの推論能力の中核を凝縮したcosmopediaデータを外部の翻訳システムを通じて日本語に翻訳し、この日本語のcosmopediaデータを使用してLlama-3-8bモデルの追加トレーニングを行い、日本語ドメインへの適応を図りました。Llama-3-8bの論理的推論能力を日本語のコンテキストに円滑に移行させ、日本語でのパフォーマンス向上を目標としました。