jhsmith commited on
Commit
b7dd5cf
1 Parent(s): 33d2e65

Upload folder using huggingface_hub

Browse files
README.md CHANGED
@@ -46,9 +46,9 @@ The model was trained with the parameters:
46
 
47
  **DataLoader**:
48
 
49
- `torch.utils.data.dataloader.DataLoader` of length 2688 with parameters:
50
  ```
51
- {'batch_size': 5, 'sampler': 'torch.utils.data.sampler.RandomSampler', 'batch_sampler': 'torch.utils.data.sampler.BatchSampler'}
52
  ```
53
 
54
  **Loss**:
@@ -62,16 +62,16 @@ Parameters of the fit()-Method:
62
  ```
63
  {
64
  "epochs": 1,
65
- "evaluation_steps": 0,
66
- "evaluator": "NoneType",
67
  "max_grad_norm": 1,
68
  "optimizer_class": "<class 'torch.optim.adamw.AdamW'>",
69
  "optimizer_params": {
70
- "lr": 0.0001
71
  },
72
- "scheduler": "WarmupLinear",
73
  "steps_per_epoch": null,
74
- "warmup_steps": 268,
75
  "weight_decay": 0.01
76
  }
77
  ```
 
46
 
47
  **DataLoader**:
48
 
49
+ `torch.utils.data.dataloader.DataLoader` of length 60 with parameters:
50
  ```
51
+ {'batch_size': 10, 'sampler': 'torch.utils.data.sampler.RandomSampler', 'batch_sampler': 'torch.utils.data.sampler.BatchSampler'}
52
  ```
53
 
54
  **Loss**:
 
62
  ```
63
  {
64
  "epochs": 1,
65
+ "evaluation_steps": 10,
66
+ "evaluator": "sentence_transformers.evaluation.TripletEvaluator.TripletEvaluator",
67
  "max_grad_norm": 1,
68
  "optimizer_class": "<class 'torch.optim.adamw.AdamW'>",
69
  "optimizer_params": {
70
+ "lr": 2e-05
71
  },
72
+ "scheduler": "warmuplinear",
73
  "steps_per_epoch": null,
74
+ "warmup_steps": 6,
75
  "weight_decay": 0.01
76
  }
77
  ```
eval/triplet_evaluation_results_results.csv ADDED
@@ -0,0 +1,13 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ epoch,steps,accuracy_cosinus,accuracy_manhattan,accuracy_euclidean
2
+ 0,-1,0.7666666666666667,0.77,0.7666666666666667
3
+ 0,2,0.7933333333333333,0.7866666666666666,0.7933333333333333
4
+ 0,4,0.795,0.7933333333333333,0.795
5
+ 0,6,0.7916666666666666,0.8016666666666666,0.7916666666666666
6
+ 0,8,0.8,0.8033333333333333,0.8
7
+ 0,10,0.7833333333333333,0.7783333333333333,0.7833333333333333
8
+ 0,20,0.7783333333333333,0.7766666666666666,0.7783333333333333
9
+ 0,30,0.7666666666666667,0.7683333333333333,0.7666666666666667
10
+ 0,40,0.7716666666666666,0.7716666666666666,0.7716666666666666
11
+ 0,50,0.76,0.7666666666666667,0.76
12
+ 0,60,0.7633333333333333,0.7633333333333333,0.7633333333333333
13
+ 0,-1,0.7633333333333333,0.7633333333333333,0.7633333333333333
model.safetensors CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:9d07d1f017c515a1260f3c19c65802b673b1e2b94782a7b2183b2a00b61c5af3
3
  size 437967672
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:b66466f68ab6d5171c30bf48a0f736bd6fadfba7b88b2c01a748f7e04c0bedfd
3
  size 437967672
vocab.txt CHANGED
The diff for this file is too large to render. See raw diff