bigcode
/

octocoder

Text Generation

Transformers

PyTorch

Safetensors

code

Eval Results

Model card Files Files and versions Community

rootacess commited on Aug 5, 2023

Commit

f1611a1

1 Parent(s): b9c92c5

updated metadata (results from table 2)

Browse files

Files changed (1) hide show

README.md +190 -0

README.md CHANGED Viewed

@@ -37,6 +37,196 @@ model-index:
       type: pass@1
       value: 39.2
       verified: false
 ---
 ![Octopack](https://github.com/bigcode-project/octopack/blob/31f3320f098703c7910e43492c39366eeea68d83/banner.png?raw=true)

       type: pass@1
       value: 39.2
       verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: bigcode/humanevalpack
+      name: HumanEvalSynthesize Java
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 38.2
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: bigcode/humanevalpack
+      name: HumanEvalSynthesize Go
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 30.4
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: bigcode/humanevalpack
+      name: HumanEvalSynthesize C++
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 35.6
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: bigcode/humanevalpack
+      name: HumanEvalSynthesize Rust
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 23.4
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: bigcode/humanevalpack
+      name: HumanEvalSynthesize Avg.
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 35.5
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: bigcode/humanevalpack
+      name: HumanEvalExplain Python
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 35.1
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: bigcode/humanevalpack
+      name: HumanEvalExplain JavaScript
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 24.5
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: bigcode/humanevalpack
+      name: HumanEvalExplain Java
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 27.3
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: bigcode/humanevalpack
+      name: HumanEvalExplain Go
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 21.1
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: bigcode/humanevalpack
+      name: HumanEvalExplain C++
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 24.1
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: bigcode/humanevalpack
+      name: HumanEvalExplain Rust
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 14.8
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: bigcode/humanevalpack
+      name: HumanEvalExplain Avg.
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 24.5
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: bigcode/humanevalpack
+      name: HumanEvalFix Python
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 30.2
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: bigcode/humanevalpack
+      name: HumanEvalFix JavaScript
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 28.4
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: bigcode/humanevalpack
+      name: HumanEvalFix Java
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 30.6
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: bigcode/humanevalpack
+      name: HumanEvalFix Go
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 30.2
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: bigcode/humanevalpack
+      name: HumanEvalFix C++
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 26.1
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: bigcode/humanevalpack
+      name: HumanEvalFix Rust
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 16.5
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: bigcode/humanevalpack
+      name: HumanEvalFix Avg.
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 27.0
+      verified: false
 ---
 ![Octopack](https://github.com/bigcode-project/octopack/blob/31f3320f098703c7910e43492c39366eeea68d83/banner.png?raw=true)