mightbe
/

Better-PairRM

Inference Endpoints

Model card Files Files and versions Community

maywell commited on Apr 4

Commit

69f3ec1

•

1 Parent(s): 2fc8ad5

Update README.md

Files changed (1) hide show

README.md +21 -0

README.md CHANGED Viewed

@@ -1,5 +1,26 @@
 ---
 license: apache-2.0
 ---
 # Better Implementation for [*PairRM*](https://huggingface.co/llm-blender/PairRM)

 ---
 license: apache-2.0
+datasets:
+- openai/summarize_from_feedback
+- openai/webgpt_comparisons
+- berkeley-nest/Nectar
+- Dahoas/instruct-synthetic-prompt-responses
+- Anthropic/hh-rlhf
+- lmsys/chatbot_arena_conversations
+- openbmb/UltraFeedback
+- argilla/ultrafeedback-binarized-preferences-cleaned
+metrics:
+- accuracy
+tags:
+- reward_model
+- reward-model
+- RLHF
+- evaluation
+- llm
+- instruction
+- reranking
+language:
+- en
 ---
 # Better Implementation for [*PairRM*](https://huggingface.co/llm-blender/PairRM)