FAR AI

non-profit

https://far.ai/

FARAIResearch

AlignmentResearch

Activity Feed Request to join this org

AI & ML interests

Frontier alignment research to ensure the safe development and deployment of advanced AI systems.

Recent Activity

tomtseng updated a dataset 8 days ago

AlignmentResearch/StrongREJECT

skar0 updated a model 9 days ago

AlignmentResearch/robust_llm_oskar-076a_clf_jailbreak_completions_Llama3.1-8B-Instruct_s-0

skar0 updated a model 9 days ago

AlignmentResearch/robust_llm_oskar-075a_clf_jailbreak_inputs_Llama3.1-8B-Instruct_s-0

View all activity

spaces 1

Running

Tuned Lens

🔎

Analyze text using tuned lens and visualize predictions

models 3752

AlignmentResearch/robust_llm_oskar-076a_clf_jailbreak_completions_Llama3.1-8B-Instruct_s-0

Updated 9 days ago • 250

AlignmentResearch/robust_llm_oskar-075a_clf_jailbreak_inputs_Llama3.1-8B-Instruct_s-0

Updated 9 days ago • 255

AlignmentResearch/gemma-2-9b-it-orthogonalized

Updated 14 days ago • 5

AlignmentResearch/Llama-3.1-8B-Instruct-orthogonalized

Updated 15 days ago • 7

AlignmentResearch/robust_llm_oskar-059e_clf_jailbreak_inputs_Qwen2.5-7B-Instruct_s-0

Updated 20 days ago • 621

AlignmentResearch/robust_llm_oskar-066a_clf_jailbreak_completions_Qwen2.5-7B-Instruct_s-0

Updated 20 days ago • 572

AlignmentResearch/robust_llm_oskar-059d_clf_jailbreak_inputs_Qwen2.5-7B-Instruct_s-0

Updated 23 days ago • 15

AlignmentResearch/robust_llm_oskar-058d_clf_jailbreak_inputs_Qwen2.5-7B_s-0

Updated 23 days ago • 67

AlignmentResearch/robust_llm_oskar-060d_clf_jailbreak_inputs_Qwen2.5-7B-Instruct_s-0

Updated 23 days ago • 61

AlignmentResearch/robust_llm_oskar-057g_clf_jailbreak_inputs_Qwen2.5-7B_s-0

Updated 26 days ago • 60

datasets 25

AI & ML interests

Recent Activity

Team members 12

spaces 1

Tuned Lens

models 3752 Sort: Recently updated

datasets 25 Sort: Recently updated

models 3752

datasets 25