nvidia
/

Nemotron-4-340B-Reward

Model card Files Files and versions Community

zhilinw commited on 22 days ago

Commit

9acabd8

•

1 Parent(s): fc6281e

Update README.md

Files changed (1) hide show

README.md +14 -2

README.md CHANGED Viewed

@@ -2,8 +2,20 @@
 license: other
 license_name: nvidia-open-model-license
 license_link: LICENSE
 ---
 ## Nemotron-4-340B-Reward
 [![Model architecture](https://img.shields.io/badge/Model%20Arch-Transformer%20Decoder-green)](#model-architecture)[![Model size](https://img.shields.io/badge/Params-340B-green)](#model-architecture)[![Language](https://img.shields.io/badge/Language-Multilingual-green)](#datasets)
@@ -55,8 +67,8 @@ Nemotron-4 340B-Reward can be used in the alignment stage to align pretrained mo
 ### Required Hardware
 BF16 Inference:
-- 32x H100 (4x H100 Nodes)
-- 32x A100 (4x A100 80GB Nodes)
 ### Usage:

 license: other
 license_name: nvidia-open-model-license
 license_link: LICENSE
+library_name: nemo
+language:
+- en
+inference: false
+fine-tuning: false
+tags:
+- nvidia
+- steerlm
+- reward model
+datasets:
+- nvidia/HelpSteer2
 ---
 ## Nemotron-4-340B-Reward
 [![Model architecture](https://img.shields.io/badge/Model%20Arch-Transformer%20Decoder-green)](#model-architecture)[![Model size](https://img.shields.io/badge/Params-340B-green)](#model-architecture)[![Language](https://img.shields.io/badge/Language-Multilingual-green)](#datasets)
 ### Required Hardware
 BF16 Inference:
+- 16x H100 (2x H100 Nodes)
+- 16x A100 (2x A100 80GB Nodes)
 ### Usage: