comet24082002 commited on
Commit
86fe5ed
1 Parent(s): 59a2817

Add new SentenceTransformer model.

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 1024,
3
+ "pooling_mode_cls_token": true,
4
+ "pooling_mode_mean_tokens": false,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,1204 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language: []
3
+ library_name: sentence-transformers
4
+ tags:
5
+ - sentence-transformers
6
+ - sentence-similarity
7
+ - feature-extraction
8
+ - generated_from_trainer
9
+ - dataset_size:21048
10
+ - loss:ContrastiveLoss
11
+ base_model: BAAI/bge-m3
12
+ datasets: []
13
+ widget:
14
+ - source_sentence: Tem bưu chính hết thời hạn cung ứng theo quy định có phải hủy tem
15
+ bưu chính đó không?
16
+ sentences:
17
+ - 'Đối tượng phát hành giấy tờ có giá
18
+
19
+ Tổ chức tín dụng, chi nhánh ngân hàng nước ngoài phát hành giấy tờ có giá theo
20
+ Giấy phép thành lập, hoạt động của tổ chức tín dụng, chi nhánh ngân
21
+ hàng nước ngoài, bao gồm:
22
+
23
+ 1. Ngân hàng thương mại.
24
+
25
+ 2. Ngân hàng hợp tác xã.
26
+
27
+ 3. Chi nhánh ngân hàng nước ngoài.
28
+
29
+ 4. Công ty tài chính, công ty cho thuê tài chính.'
30
+ - 'Công bố và sử dụng chứng cứ
31
+
32
+ 1. Mọi chứng cứ được công bố và sử dụng công khai, trừ trường hợp quy định tại
33
+ khoản 2 và 3 Điều này.
34
+
35
+ 2. Chủ tịch Ủy ban Cạnh tranh Quốc gia, Cơ quan điều tra vụ việc cạnh tranh, Hội
36
+ đồng xử lý vụ việc hạn chế cạnh tranh không công bố và sử dụng công khai các chứng
37
+ cứ sau đây:
38
+
39
+ a) Chứng cứ thuộc bí mật nhà nước theo quy định của pháp luật;
40
+
41
+ b) Chứng cứ liên quan tới thuần phong mỹ tục, bí mật nghề nghiệp, bí mật kinh
42
+ doanh, bí mật cá nhân theo yêu cầu chính đáng của người tham gia tố tụng cạnh
43
+ tranh.
44
+
45
+ 3. Trường hợp cần thiết, Chủ tịch Ủy ban Cạnh tranh Quốc gia, Cơ quan điều tra
46
+ vụ việc cạnh tranh, Hội đồng xử lý vụ việc hạn chế cạnh tranh có quyền công bố
47
+ và sử dụng công khai một số, một phần hoặc toàn bộ chứng cứ vào thời điểm thích
48
+ hợp cho việc điều tra và xử lý vụ việc cạnh tranh.
49
+
50
+ 4. Cơ quan, người tiến hành tố tụng, người tham gia tố tụng phải giữ bí mật những
51
+ chứng cứ thuộc trường hợp không công bố và sử dụng công khai quy định tại khoản
52
+ 2 Điều này theo quy định của pháp luật.'
53
+ - '"Điều 48. Thời hạn cấp Phiếu lý lịch tư pháp
54
+
55
+ 1. Thời hạn cấp Phiếu lý lịch tư pháp không quá 10 ngày, kể từ ngày nhận được
56
+ yêu cầu hợp lệ. Trường hợp người được cấp Phiếu lý lịch tư pháp là công dân Việt
57
+ Nam đã cư trú ở nhiều nơi hoặc có thời gian cư trú ở nước ngoài, người nước ngoài
58
+ quy định tại khoản 2 và khoản 3 Điều 47 của Luật này, trường hợp phải xác minh
59
+ về điều kiện đương nhiên được xóa án tích quy định tại khoản 3 Điều 44 của Luật
60
+ này thì thời hạn không quá 15 ngày.
61
+
62
+ 2. Trường hợp khẩn cấp quy định tại khoản 1 Điều 46 của Luật này thì thời hạn
63
+ không quá 24 giờ, kể từ thời điểm nhận được yêu cầu."'
64
+ - source_sentence: Ban quản lý các dự án Lâm nghiệp cần phải đề xuất các chương trình
65
+ dự án mới về phát triển lâm nghiệp không?
66
+ sentences:
67
+ - '"Điều 40. Hình thức đấu giá, phương thức đấu giá
68
+
69
+ 1. Tổ chức đấu giá tài sản thỏa thuận với người có tài sản đấu giá lựa chọn một
70
+ trong các hình thức sau đây để tiến hành cuộc đấu giá:
71
+
72
+ a) Đấu giá trực tiếp bằng lời nói tại cuộc đấu giá;
73
+
74
+ b) Đấu giá bằng bỏ phiếu trực tiếp tại cuộc đấu giá;
75
+
76
+ c) Đấu giá bằng bỏ phiếu gián tiếp;
77
+
78
+ d) Đấu giá trực tuyến.
79
+
80
+ 2. Phương thức đấu giá bao gồm:
81
+
82
+ a) Phương thức trả giá lên;
83
+
84
+ b) Phương thức đặt giá xuống.
85
+
86
+ 3. Hình thức đấu giá, phương thức đấu giá phải được quy định trong Quy chế cuộc
87
+ đấu giá và công bố công khai cho người tham gia đấu giá biết.
88
+
89
+ 4. Chính phủ quy định chi tiết điểm d khoản 1 Điều này."'
90
+ - 'Khóa, mở khóa tài khoản định danh điện tử
91
+
92
+ ...
93
+
94
+ 5. Hình thức yêu cầu khóa, mở khóa tài khoản định danh điện tử:
95
+
96
+ a) Chủ thể danh tính điện tử thực hiện theo các bước hướng dẫn trên ứng dụng VNelD
97
+ để yêu cầu khóa tài khoản định danh điện tử;
98
+
99
+ b) Chủ thể danh tính điện tử liên hệ với tổng đài tiếp nhận và giải quyết các
100
+ yêu cầu về định danh và xác thực điện tử, cung cấp thông tin xác thực chủ tài
101
+ khoản định danh điện tử để yêu cầu khóa, mở khóa tài khoản định danh điện tử;
102
+
103
+ c) Chủ thể danh tính điện tử đến cơ quan quản lý định danh và xác thực điện tử,
104
+ cung cấp thông tin xác thực chủ tài khoản định danh điện tử để yêu cầu khóa, mở
105
+ khóa tài khoản định danh điện tử.
106
+
107
+ 6. Khóa, mở khóa tài khoản định danh điện tử khi có yêu cầu của cơ quan tiến hành
108
+ tố tụng, cơ quan chức năng có thẩm quyền
109
+
110
+ Cơ quan tiến hành tố tụng, cơ quan chức năng có thẩm quyền có văn bản gửi cơ quan
111
+ quản lý định danh và xác thực điện tử cùng cấp đề nghị khóa, mở khóa tài khoản
112
+ định danh điện tử, trong đó nêu rõ lý do, thời hạn khóa.'
113
+ - 'Nhiệm vụ và quyền hạn
114
+
115
+
116
+
117
+ 13. Thực hiện chế độ báo cáo định kỳ và đột xuất với Bộ Nông nghiệp và Phát triển
118
+ nông thôn, các cơ quan có liên quan và nhà tài trợ về tình hình và kết quả hoạt
119
+ động của các chương trình, dự án. Tổng hợp, thống nhất với nhà tài trợ các nội
120
+ dung phát sinh trong quá trình thực hiện chương trình, dự án và đề xuất trình
121
+ Bộ quyết định.
122
+
123
+ 14. Được Bộ trưởng ủy quyền làm chủ dự án đối với chương trình, dự án thuộc nhiệm
124
+ vụ của Bộ do Chính phủ Việt Nam viện trợ ra nước ngoài theo quy định hiện hành
125
+ của Nhà nước Việt Nam và Văn kiện chương trình, dự án ký kết.
126
+
127
+ 15. Tổ chức thực hiện nhiệm vụ đối với việc nghiệm thu, bàn giao chương trình,
128
+ dự án theo quy định.
129
+
130
+ 16. Đề xuất các chương trình, dự án mới về phát triển lâm nghiệp và phát triển
131
+ nông thôn.
132
+
133
+ 17. Quản lý tổ chức, bộ máy, biên chế và tài sản của Ban theo quy định; thực hiện
134
+ chế độ tiền lương và các chế độ chính sách đãi ngộ, khen thưởng, kỷ luật đối với
135
+ cán bộ, viên chức thuộc phạm vi quản lý của Ban.
136
+
137
+ 18. Thực hiện các quyền và trách nhiệm khác của chủ dự án theo quy định của pháp
138
+ luật.
139
+
140
+ 19. Thực hiện nhiệm vụ khác do Bộ trưởng giao.'
141
+ - source_sentence: Người lao động nào được miễn đóng đoàn phí công đoàn?
142
+ sentences:
143
+ - 'PHẪU THUẬT ĐIỀU TRỊ HỞ MI
144
+
145
+ ...
146
+
147
+ V. CÁC BƯỚC TIẾN HÀNH
148
+
149
+ 1. Kiểm tra hồ sơ
150
+
151
+ 2. Kiểm tra người bệnh
152
+
153
+ 3. Thực hiện kỹ thuật
154
+
155
+ 3.1. Vô cảm
156
+
157
+ - Uống hay tiêm thuốc an thần, giảm đau.
158
+
159
+ - Gây mê nếu người bệnh kém hợp tác.
160
+
161
+ - Gây tê tại chỗ bằng.
162
+
163
+ 3.2. Kỹ thuật
164
+
165
+ Cách thức phẫu thuật điều trị hở mi tùy thuộc nguyên nhân gây hở mi. Trong bài
166
+ này chúng tôi mô tả những phương pháp thường được áp dụng là: Phẫu thuật hở mi
167
+ do sẹo, hở mi do liệt dây VII.
168
+
169
+ 3.2.1. Hở mi do sẹo gây lật mi
170
+
171
+ - Đánh dấu vùng có sẹo mi và vùng dự định lấy da hay làm vạt da.
172
+
173
+ - Gây tê tại chỗ.
174
+
175
+ - Rạch da, cắt bỏ sẹo mi hay giải phóng các chỗ dính sao cho bờ mi trở lại vị
176
+ trí giải phẫu bình thường của nó.
177
+
178
+ - Khâu cò mi tạm thời.
179
+
180
+ - Lấy dấu vùng bị khuyết da mi.
181
+
182
+ - Lấy da ghép (sau tai, trước tai, thượng đòn và mặt trong cánh tay) và ghép da.
183
+
184
+ - Dùng vạt da nếu vùng khuyết da mi nhỏ.
185
+
186
+ ...'
187
+ - 'Đối tượng được thăm gặp phạm nhân
188
+
189
+ 1. Đối tượng được thăm gặp phạm nhân gồm: Ông, bà nội; ông, bà ngoại; bố, mẹ đẻ;
190
+ bố, mẹ vợ (hoặc chồng); bố, mẹ nuôi hợp pháp; vợ hoặc chồng; con đẻ, con dâu,
191
+ con rể, con nuôi hợp pháp; anh, chị, em ruột; anh, chị, em dâu, rể; anh, chị em
192
+ vợ (hoặc chồng); cô, dì, chú, bác, cậu, cháu ruột, số lượng thân nhân mỗi lần
193
+ đến thăm gặp phạm nhân không quá 03 người.
194
+
195
+ 2. Đại diện cơ quan, tổ chức hoặc cá nhân khác ngoài những người được quy định
196
+ tại Khoản 1 Điều này được thăm gặp phạm nhân nếu Thủ trưởng cơ sở giam giữ xét
197
+ thấy phù hợp với yêu cầu công tác phòng, chống tội phạm và công tác quản lý, giáo
198
+ dục cải tạo phạm nhân.'
199
+ - '"Điều 23. Đối tượng, mức đóng, tiền lương làm căn cứ đóng đoàn phí
200
+
201
+ [...] 6. Đoàn viên công đoàn hưởng trợ cấp Bảo hiểm xã hội từ 01 tháng trở lên,
202
+ trong thời gian hưởng trợ cấp không phải đóng đoàn phí; đoàn viên công đoàn không
203
+ có việc làm, không có thu nhập, nghỉ việc riêng từ 01 tháng trở lên không hưởng
204
+ tiền lương, trong thời gian đó không phải đóng đoàn phí”.'
205
+ - source_sentence: Quá thời hạn mà doanh nghiệp chưa thanh toán đủ hợp đồng chuyển
206
+ nhượng có thời hạn quyền khai thác tài sản kết cấu hạ tầng hàng hải thì giải quyết
207
+ thế nào?
208
+ sentences:
209
+ - 'Cách tiến hành
210
+
211
+ 5.1. Chẩn đoán lâm sàng
212
+
213
+ 5.1.1. Bệnh viêm ruột hoại tử ở gà
214
+
215
+ 5.1.1.1. Đặc điểm dịch tễ
216
+
217
+ - Bệnh viêm ruột hoại tử thường xảy ra ở gà ít ngày tuổi từ 2 tuần đến 5 tuần
218
+ tuổi, gà tây từ 7 tuần đến 12 tuần tuổi nhưng cũng có thể xảy ra ở gà hậu bị và
219
+ gà đẻ.
220
+
221
+ - Bệnh lây lan qua đường thức ăn, nước uống do vi khuẩn C. perfringens có nhiều
222
+ trong môi trường đất, thức ăn, phân, chất độn chuồng, rác, chất chứa đường ruột,...
223
+
224
+ - Tỷ lệ nhiễm bệnh viêm ruột hoại tử ở gà con có thể lên tới 50 %, ở gà thịt khoảng
225
+ từ 13 % đến 37,3 %.
226
+
227
+ 5.1.1.2. Triệu chứng lâm sàng
228
+
229
+ - Trong trường hợp cấp tính gà chết nhanh (từ 1 h đến 2 h) khi chưa biểu hiện
230
+ triệu chứng của bệnh. Tỷ lệ chết cao, có thể lên tới 50 %.
231
+
232
+ - Gà thường chết đột ngột, các triệu chứng lâm sàng thấy được trong thời gian
233
+ ngắn.
234
+
235
+ - Triệu chứng thường thấy của bệnh là gà bị tiêu chảy, phân nhiều nước, có màu
236
+ đỏ, nâu đỏ, màu vàng hoặc lẫn thức ăn.
237
+
238
+ - Gà có biểu hiện ủ rũ, ăn ít, giảm tăng trọng, xác chết gầy và ướt.
239
+
240
+ 5.1.1.3. Bệnh tích đại thể
241
+
242
+ - Bệnh tích thường quan sát thấy ở phần ruột non chủ yếu là ở không tràng và hồi
243
+ tràng. Niêm mạc ruột bị xuất huyết, hoại tử. Lớp chất nhày ở ruột có màu xám nâu
244
+ đến vàng xanh lá cây hoặc có màng giả.
245
+
246
+ - Thành ruột non và thỉnh thoảng ở đoạn manh tràng mỏng, dễ nát, giãn to và tích
247
+ khí.
248
+
249
+ - Gan không to nhưng màu sắc thay đổi, có màu thẫm hoặc vàng hơn bình thường.
250
+ Trên bề mặt gan có lấm tấm điểm hoại tử màu vàng.
251
+
252
+ - Lách có thể sưng to, sưng huyết hoặc xuất huyết, có các điểm hoại tử.
253
+
254
+ - Thận có thể sưng to, biến màu có thể có các điểm hoại tử.
255
+
256
+ ...'
257
+ - 'Chuyển nhượng có thời hạn quyền khai thác tài sản kết cấu hạ tầng hàng không
258
+
259
+ ...
260
+
261
+ 8. Hợp đồng chuyển nhượng quyền khai thác tài sản kết cấu hạ tầng hàng không gồm
262
+ các nội dung chủ yếu sau:
263
+
264
+ a) Thông tin của bên chuyển nhượng;
265
+
266
+ b) Thông tin của doanh nghiệp nhận chuyển nhượng;
267
+
268
+ c) Danh mục tài sản được chuyển nhượng quyền khai thác;
269
+
270
+ d) Thời hạn chuyển nhượng; giá chuyển nhượng; phương thức và thời hạn thanh toán;
271
+ hạng mục công trình đầu tư, nâng cấp và các nội dung cần thiết khác;
272
+
273
+ đ) Quyền và nghĩa vụ của các bên;
274
+
275
+ e) Trách nhiệm tổ chức thực hiện.
276
+
277
+ g) Trong thời hạn 90 ngày, kể từ ngày ký Hợp đồng, doanh nghiệp nhận chuyển nhượng
278
+ có trách nhiệm thanh toán tiền chuyển nhượng cho cơ quan được giao quản lý tài
279
+ sản theo Hợp đồng, Cơ quan được giao quản lý tài sản có trách nhiệm nộp tiền vào
280
+ tài khoản tạm giữ trong thời hạn 03 ngày làm việc, kể từ ngày nhận được tiền chuyển
281
+ nhượng.
282
+
283
+ Trường hợp quá thời hạn quy định tại điểm này mà doanh nghiệp nhận chuyển nhượng
284
+ có thời hạn quyền khai thác tài sản kết cấu hạ tầng hàng không chưa thanh toán
285
+ hoặc chưa thanh toán đủ số tiền theo hợp đồng đã ký kết thì cơ quan được giao
286
+ quản lý tài sản có văn bản đề nghị kèm theo bản sao Hợp đồng chuyển nhượng và
287
+ chứng từ về việc nộp tiền của doanh nghiệp nhận chuyển nhượng (nếu có) gửi Cục
288
+ thuế (nơi có tài sản) để xác định và ra Thông báo về số tiền chậm nộp theo quy
289
+ định của pháp luật về quản lý thuế.
290
+
291
+ Thời hạn nộp tiền cụ thể và quy định việc nộp tiền chậm nộp phải được ghi rõ tại
292
+ Quy chế đấu giá, Hợp đồng chuyển nhượng có thời hạn quyền khai thác tài sản kết
293
+ cấu hạ tầng hàng không.
294
+
295
+ ...'
296
+ - '"Điều 9. Các giấy tờ, tài liệu được miễn chứng nhận lãnh sự, hợp pháp hóa lãnh
297
+ sự
298
+
299
+ 1. Giấy tờ, tài liệu được miễn chứng nhận lãnh sự, hợp pháp hóa lãnh sự theo điều
300
+ ước quốc tế mà Việt Nam và nước ngoài liên quan đều là thành viên, hoặc theo nguyên
301
+ tắc có đi có lại.
302
+
303
+ 2. Giấy tờ, tài liệu được chuyển giao trực tiếp hoặc qua đường ngoại giao giữa
304
+ cơ quan có thẩm quyền của Việt Nam và cơ quan có thẩm quyền của nước ngoài.
305
+
306
+ 3. Giấy tờ, tài liệu được miễn chứng nhận lãnh sự, hợp pháp hóa lãnh sự theo quy
307
+ định của pháp luật Việt Nam.
308
+
309
+ 4. Giấy tờ, tài liệu mà cơ quan tiếp nhận của Việt Nam hoặc của nước ngoài không
310
+ yêu cầu phải hợp pháp hóa lãnh sự, chứng nhận lãnh sự phù hợp với quy định pháp
311
+ luật tương ứng của Việt Nam hoặc của nước ngoài."'
312
+ - source_sentence: Cách ghi thông tin phiếu điều chỉnh thông tin căn cước công dân
313
+ được hướng dẫn thế nào?
314
+ sentences:
315
+ - 'Phạm nhân nhận, sử dụng thuốc chữa bệnh
316
+
317
+ 1. Thân nhân phạm nhân khi đến thăm gặp hoặc qua đường bưu chính, có thể gửi thuốc
318
+ chữa bệnh, thuốc bổ cho phạm nhân theo chỉ định của y sỹ, bác sỹ tại cơ sở giam
319
+ giữ hoặc tại cơ sở khám, chữa bệnh của Nhà nước nơi phạm nhân khám và điều trị.
320
+ Thuốc do thân nhân gửi cho phạm nhân phải có nhãn, mác ghi rõ hàm lượng, công
321
+ dụng, nơi sản xuất và còn thời hạn sử dụng.
322
+
323
+ ...'
324
+ - '“Điều 76. Trách nhiệm của Thẩm phán
325
+
326
+ 1. Trung thành với Tổ quốc, gương mẫu chấp hành Hiến pháp và pháp luật.
327
+
328
+ 2. Tôn trọng nhân dân, tận tụy phục vụ nhân dân, liên hệ chặt chẽ với nhân dân,
329
+ lắng nghe ý kiến và chịu sự giám sát của nhân dân.
330
+
331
+ 3. Độc lập, vô tư, khách quan, bảo vệ công lý trong xét xử; chấp hành quy tắc
332
+ ứng xử, đạo đức nghề nghiệp Thẩm phán, giữ gìn uy tín của Tòa án.
333
+
334
+ 4. Giữ bí mật nhà nước và bí mật công tác theo quy định của pháp luật.
335
+
336
+ 5. Học tập, nghiên cứu để nâng cao kiến thức, trình độ chính trị và chuyên môn
337
+ nghiệp vụ Tòa án.
338
+
339
+ 6. Chịu trách nhiệm trước pháp luật về việc thực hiện nhiệm vụ, quyền hạn và các
340
+ quyết định của mình; nếu có hành vi vi phạm pháp luật thì tùy theo tính chất,
341
+ mức độ vi phạm mà bị xử lý kỷ luật hoặc truy cứu trách nhiệm hình sự theo quy
342
+ định của luật. Thẩm phán trong khi thực hiện nhiệm vụ, quyền hạn của mình mà gây
343
+ thiệt hại thì Tòa án nơi Thẩm phán thực hiện nhiệm vụ xét xử có trách nhiệm bồi
344
+ thường và Thẩm phán đã gây thiệt hại có trách nhiệm bồi hoàn cho Tòa án theo quy
345
+ định của luật.”'
346
+ - 'Tờ khai Căn cước công dân (CC01)
347
+
348
+ ...
349
+
350
+ 2. Cách ghi thông tin
351
+
352
+ a) Mục “Họ, chữ đệm và tên”, “Họ và tên gọi khác”: ghi đầy đủ họ, chữ đệm và tên
353
+ theo giấy khai sinh; chữ in hoa đủ dấu. Chỉ ghi họ, tên gọi khác nếu trong giấy
354
+ khai sinh có họ và tên gọi khác;
355
+
356
+ b) Mục “Ngày, tháng, năm sinh”: ghi ngày, tháng, năm sinh của công dân được cấp,
357
+ đổi, cấp lại thẻ Căn cước công dân. Ngày sinh ghi 02 chữ số; năm sinh ghi đủ bốn
358
+ chữ số. Đối với tháng sinh từ tháng 3 đến tháng 9 ghi 01 chữ số, các tháng sinh
359
+ còn lại ghi 02 chữ số;
360
+
361
+ c) Mục “Giới tính”: nếu giới tính nam ghi là “Nam”, nếu giới tính nữ ghi là “Nữ”;
362
+
363
+ ...'
364
+ pipeline_tag: sentence-similarity
365
+ ---
366
+
367
+ # SentenceTransformer based on BAAI/bge-m3
368
+
369
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
370
+
371
+ ## Model Details
372
+
373
+ ### Model Description
374
+ - **Model Type:** Sentence Transformer
375
+ - **Base model:** [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3) <!-- at revision babcf60cae0a1f438d7ade582983d4ba462303c2 -->
376
+ - **Maximum Sequence Length:** 512 tokens
377
+ - **Output Dimensionality:** 1024 tokens
378
+ - **Similarity Function:** Cosine Similarity
379
+ <!-- - **Training Dataset:** Unknown -->
380
+ <!-- - **Language:** Unknown -->
381
+ <!-- - **License:** Unknown -->
382
+
383
+ ### Model Sources
384
+
385
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
386
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
387
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
388
+
389
+ ### Full Model Architecture
390
+
391
+ ```
392
+ SentenceTransformer(
393
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
394
+ (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
395
+ (2): Normalize()
396
+ )
397
+ ```
398
+
399
+ ## Usage
400
+
401
+ ### Direct Usage (Sentence Transformers)
402
+
403
+ First install the Sentence Transformers library:
404
+
405
+ ```bash
406
+ pip install -U sentence-transformers
407
+ ```
408
+
409
+ Then you can load this model and run inference.
410
+ ```python
411
+ from sentence_transformers import SentenceTransformer
412
+
413
+ # Download from the 🤗 Hub
414
+ model = SentenceTransformer("comet24082002/ft_bge_newLaw_ContrastiveLoss_V2_5epochs")
415
+ # Run inference
416
+ sentences = [
417
+ 'Cách ghi thông tin phiếu điều chỉnh thông tin căn cước công dân được hướng dẫn thế nào?',
418
+ 'Tờ khai Căn cước công dân (CC01)\n...\n2. Cách ghi thông tin\na) Mục “Họ, chữ đệm và tên”, “Họ và tên gọi khác”: ghi đầy đủ họ, chữ đệm và tên theo giấy khai sinh; chữ in hoa đủ dấu. Chỉ ghi họ, tên gọi khác nếu trong giấy khai sinh có họ và tên gọi khác;\nb) Mục “Ngày, tháng, năm sinh”: ghi ngày, tháng, năm sinh của công dân được cấp, đổi, cấp lại thẻ Căn cước công dân. Ngày sinh ghi 02 chữ số; năm sinh ghi đủ bốn chữ số. Đối với tháng sinh từ tháng 3 đến tháng 9 ghi 01 chữ số, các tháng sinh còn lại ghi 02 chữ số;\nc) Mục “Giới tính”: nếu giới tính nam ghi là “Nam”, nếu giới tính nữ ghi là “Nữ”;\n...',
419
+ '“Điều 76. Trách nhiệm của Thẩm phán\n1. Trung thành với Tổ quốc, gương mẫu chấp hành Hiến pháp và pháp luật.\n2. Tôn trọng nhân dân, tận tụy phục vụ nhân dân, liên hệ chặt chẽ với nhân dân, lắng nghe ý kiến và chịu sự giám sát của nhân dân.\n3. Độc lập, vô tư, khách quan, bảo vệ công lý trong xét xử; chấp hành quy tắc ứng xử, đạo đức nghề nghiệp Thẩm phán, giữ gìn uy tín của Tòa án.\n4. Giữ bí mật nhà nước và bí mật công tác theo quy định của pháp luật.\n5. Học tập, nghiên cứu để nâng cao kiến thức, trình độ chính trị và chuyên môn nghiệp vụ Tòa án.\n6. Chịu trách nhiệm trước pháp luật về việc thực hiện nhiệm vụ, quyền hạn và các quyết định của mình; nếu có hành vi vi phạm pháp luật thì tùy theo tính chất, mức độ vi phạm mà bị xử lý kỷ luật hoặc truy cứu trách nhiệm hình sự theo quy định của luật. Thẩm phán trong khi thực hiện nhiệm vụ, quyền hạn của mình mà gây thiệt hại thì Tòa án nơi Thẩm phán thực hiện nhiệm vụ xét xử có trách nhiệm bồi thường và Thẩm phán đã gây thiệt hại có trách nhiệm bồi hoàn cho Tòa án theo quy định của luật.”',
420
+ ]
421
+ embeddings = model.encode(sentences)
422
+ print(embeddings.shape)
423
+ # [3, 1024]
424
+
425
+ # Get the similarity scores for the embeddings
426
+ similarities = model.similarity(embeddings, embeddings)
427
+ print(similarities.shape)
428
+ # [3, 3]
429
+ ```
430
+
431
+ <!--
432
+ ### Direct Usage (Transformers)
433
+
434
+ <details><summary>Click to see the direct usage in Transformers</summary>
435
+
436
+ </details>
437
+ -->
438
+
439
+ <!--
440
+ ### Downstream Usage (Sentence Transformers)
441
+
442
+ You can finetune this model on your own dataset.
443
+
444
+ <details><summary>Click to expand</summary>
445
+
446
+ </details>
447
+ -->
448
+
449
+ <!--
450
+ ### Out-of-Scope Use
451
+
452
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
453
+ -->
454
+
455
+ <!--
456
+ ## Bias, Risks and Limitations
457
+
458
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
459
+ -->
460
+
461
+ <!--
462
+ ### Recommendations
463
+
464
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
465
+ -->
466
+
467
+ ## Training Details
468
+
469
+ ### Training Dataset
470
+
471
+ #### Unnamed Dataset
472
+
473
+
474
+ * Size: 21,048 training samples
475
+ * Columns: <code>sentence1</code>, <code>sentence2</code>, and <code>label</code>
476
+ * Approximate statistics based on the first 1000 samples:
477
+ | | sentence1 | sentence2 | label |
478
+ |:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:------------------------------------------------|
479
+ | type | string | string | int |
480
+ | details | <ul><li>min: 10 tokens</li><li>mean: 24.21 tokens</li><li>max: 43 tokens</li></ul> | <ul><li>min: 27 tokens</li><li>mean: 279.33 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>0: ~50.00%</li><li>1: ~50.00%</li></ul> |
481
+ * Samples:
482
+ | sentence1 | sentence2 | label |
483
+ |:---------------------------------------------------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
484
+ | <code>Về đảm bảo vệ sinh thực phẩm thì các hành vi cần tránh của người tham gia vào các hoạt động, thao tác chế biến thực phẩm là gì?</code> | <code>Vệ sinh cá nhân<br>Những người tiếp xúc với thực phẩm cần giữ vệ sinh cá nhân thật tốt và cần mặc quần áo bảo vệ, đội mũ, đi giầy, khi thích hợp. Các vết cắt hay vết thương, nếu người đó đã được người quản lý cho phép tiếp tục làm việc thì các vết thương đó phải được bao bọc bằng băng không thấm nước.<br>Các nhân viên luôn phải rửa tay sạch để không ảnh hưởng tới tính an toàn của thực phẩm, ví dụ:<br>- lúc bắt đầu các hoạt động xử lý hay tiếp xúc với thực phẩm;<br>- ngay sau khi đi vệ sinh; và<br>- sau khi xử lý thực phẩm tươi sống hay bất kỳ một nguyên liệu bị nhiễm bẩn nào mà có thể gây nhiễm cho thực phẩm khác, họ nên tránh xử lý các thực phẩm ăn sẵn.</code> | <code>1</code> |
485
+ | <code>Về đảm bảo vệ sinh thực phẩm thì các hành vi cần tránh của người tham gia vào các hoạt động, thao tác chế biến thực phẩm là gì?</code> | <code>Kiểm dịch viên thực vật<br>1. Chức trách<br>Là công chức chuyên môn, nghiệp vụ giúp lãnh đạo tổ chức thực hiện công tác kiểm dịch thực vật xuất khẩu, nhập khẩu, quá cảnh và nội địa tại các cơ quan, tổ chức nhà nước cấp tỉnh, vùng và Trung ương có nhiệm vụ kiểm dịch thực vật.<br>2. Nhiệm vụ<br>a) Xây dựng kế hoạch, đề xuất phương án, thực hiện và tổ chức thực hiện công tác kiểm dịch thực vật xuất khẩu, nhập khẩu, quá cảnh, nội địa của cơ quan thuộc lĩnh vực được giao.<br>b) Phát hiện dịch hại thuộc diện điều chỉnh và xác minh các trường hợp nghi ngờ nhiễm dịch hại thuộc đối tượng kiểm dịch thực vật thường gặp.<br>c) Thực hiện nhiều khâu hoặc toàn bộ quy trình kiểm tra vật thể thuộc diện kiểm dịch thực vật xuất khẩu, nhập khẩu và quá cảnh thực vật.<br>d) Quyết định, giám sát và xác nhận việc thực hiện các biện pháp xử lý đối với vật thể nhiễm dịch theo quy định và chịu trách nhiệm cá nhân về quyết định của mình.<br>đ) Tuyên truyền, phổ biến, hướng dẫn các quy định pháp luật về kiểm dịch thực vật; phát hiện, ngăn ngừa và xử lý theo thẩm quyền hoặc đề xuất xử lý những hành vi vi phạm pháp luật.<br>e) Chủ trì đề tài, khảo sát thực nghiệm của cơ quan; tham gia xây dựng văn bản quy phạm pháp luật, đề tài, đề án, dự án, chương trình nghiên cứu khoa học từ cấp cơ sở trở lên về kiểm dịch thực vật. Đề xuất các nội dung sửa đổi, bổ sung quy định trong lĩnh vực chuyên môn, nghiệp vụ, kỹ thuật kiểm dịch thực vật được giao.<br>g) Tham gia kiểm tra việc thực hiện các quy định của nhà nước về quản lý hoạt động khử trùng xông hơi và các biện pháp xử lý khác trong lĩnh vực bảo vệ và kiểm dịch thực vật.<br>h) Hướng dẫn, bồi dưỡng chuyên môn, nghiệp vụ kỹ thuật cho ngạch công chức thấp hơn.<br>i) Thực hiện nhiệm vụ khác theo quy định pháp luật hoặc lãnh đạo cơ quan giao.<br>3. Tiêu chuẩn về năng lực chuyên môn, nghiệp vụ<br>a) Nắm vững chủ trương, đường lối của Đảng, pháp luật của Nhà nước và định hướng phát triển, chiến lược, chính sách của ngành có liên quan đến nhiệm vụ được giao về bảo vệ và kiểm dịch thực vật.<br>b) Nắm vững những quy định của pháp luật về bảo vệ, kiểm dịch thực vật và quy định pháp luật khác có liên quan. Nắm được thông lệ và tiêu chuẩn quốc tế về kiểm dịch thực vật trong lĩnh vực được phân công.<br>c) Nắm được các quy trình, tiêu chuẩn, quy chuẩn kỹ thuật, quy phạm kiểm dịch thực vật và các thông tin khoa học kỹ thuật có liên quan.<br>d) Nắm được các thủ tục, nguyên tắc hành chính nhà nước có liên quan đến hoạt động kiểm dịch thực vật được giao.<br>đ) Nắm được tình hình kinh tế, xã hội, chính trị có liên quan đến hoạt động kiểm dịch thực vật được giao.<br>e) Có kỹ năng sử dụng công nghệ thông tin cơ bản và sử dụng ��ược ngoại ngữ hoặc sử dụng được tiếng dân tộc thiểu số đối với công chức công tác ở vùng dân tộc thiểu số theo yêu cầu của vị trí việc làm.<br>4. Tiêu chuẩn về trình độ đào tạo, bồi dưỡng<br>a) Có bằng tốt nghiệp đại học trở lên ngành, chuyên ngành phù hợp yêu cầu của vị trí việc làm.<br>b) Có chứng chỉ bồi dưỡng kiến thức, kỹ năng quản lý nhà nước đối với công chức ngạch chuyên viên hoặc tương đương.<br>5. Yêu cầu đối với công chức dự thi nâng ngạch lên ngạch kiểm dịch viên thực vật<br>Có thời gian giữ ngạch kỹ thuật viên kiểm dịch thực vật và tương đương từ đủ 03 năm trở lên (không kể thời gian tập sự). Trường hợp có thời gian tương đương với kỹ thuật viên kiểm dịch thực vật thì thời gian giữ ngạch kỹ thuật viên kiểm dịch thực vật tối thiểu 01 năm (đủ 12 tháng) tính đến ngày hết thời hạn nộp hồ sơ đăng ký dự thi nâng ngạch.</code> | <code>0</code> |
486
+ | <code>Điều kiện chuyển mục đích sử dụng đất trồng lúa để thực hiện dự án không do Quốc hội chấp thuận chủ trương đầu tư là gì?</code> | <code>"Điều 58. Điều kiện giao đất, cho thuê đất, cho phép chuyển mục đích sử dụng đất để thực hiện dự án đầu tư<br>1. Đối với dự án có sử dụng đất trồng lúa, đất rừng phòng hộ, đất rừng đặc dụng vào các mục đích khác mà không thuộc trường hợp được Quốc hội quyết định, Thủ tướng Chính phủ chấp thuận chủ trương đầu tư thì cơ quan nhà nước có thẩm quyền chỉ được quyết định giao đất, cho thuê đất, cho phép chuyển mục đích sử dụng đất khi có một trong các văn bản sau đây:<br>a) Văn bản chấp thuận của Thủ tướng Chính phủ đối với trường hợp chuyển mục đích sử dụng từ 10 héc ta đất trồng lúa trở lên; từ 20 héc ta đất rừng phòng hộ, đất rừng đặc dụng trở lên;<br>b) Nghị quyết của Hội đồng nhân dân cấp tỉnh đối với trường hợp chuyển mục đích sử dụng dưới 10 héc ta đất trồng lúa; dưới 20 héc ta đất rừng phòng hộ, đất rừng đặc dụng.<br>2. Đối với dự án sử dụng đất tại đảo và xã, phường, thị trấn biên giới, ven biển thì cơ quan nhà nước có thẩm quyền chỉ được quyết định giao đất, cho thuê đất, cho phép chuyển mục đích sử dụng đất khi được sự chấp thuận bằng văn bản của các bộ, ngành có liên quan.<br>3. Người được Nhà nước giao đất, cho thuê đất, cho phép chuyển mục đích sử dụng đất để thực hiện dự án đầu tư phải có các điều kiện sau đây:<br>a) Có năng lực tài chính để bảo đảm việc sử dụng đất theo tiến độ của dự án đầu tư;<br>b) Ký quỹ theo quy định của pháp luật về đầu tư;<br>c) Không vi phạm quy định của pháp luật về đất đai đối với trường hợp đang sử dụng đất do Nhà nước giao đất, cho thuê đất để thực hiện dự án đầu tư khác.<br>4. Chính phủ quy định chi tiết Điều này."</code> | <code>1</code> |
487
+ * Loss: [<code>ContrastiveLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#contrastiveloss) with these parameters:
488
+ ```json
489
+ {
490
+ "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
491
+ "margin": 0.5,
492
+ "size_average": true
493
+ }
494
+ ```
495
+
496
+ ### Training Hyperparameters
497
+ #### Non-Default Hyperparameters
498
+
499
+ - `per_device_train_batch_size`: 4
500
+ - `learning_rate`: 2e-05
501
+ - `num_train_epochs`: 5
502
+ - `warmup_ratio`: 0.1
503
+
504
+ #### All Hyperparameters
505
+ <details><summary>Click to expand</summary>
506
+
507
+ - `overwrite_output_dir`: False
508
+ - `do_predict`: False
509
+ - `prediction_loss_only`: True
510
+ - `per_device_train_batch_size`: 4
511
+ - `per_device_eval_batch_size`: 8
512
+ - `per_gpu_train_batch_size`: None
513
+ - `per_gpu_eval_batch_size`: None
514
+ - `gradient_accumulation_steps`: 1
515
+ - `eval_accumulation_steps`: None
516
+ - `learning_rate`: 2e-05
517
+ - `weight_decay`: 0.0
518
+ - `adam_beta1`: 0.9
519
+ - `adam_beta2`: 0.999
520
+ - `adam_epsilon`: 1e-08
521
+ - `max_grad_norm`: 1.0
522
+ - `num_train_epochs`: 5
523
+ - `max_steps`: -1
524
+ - `lr_scheduler_type`: linear
525
+ - `lr_scheduler_kwargs`: {}
526
+ - `warmup_ratio`: 0.1
527
+ - `warmup_steps`: 0
528
+ - `log_level`: passive
529
+ - `log_level_replica`: warning
530
+ - `log_on_each_node`: True
531
+ - `logging_nan_inf_filter`: True
532
+ - `save_safetensors`: True
533
+ - `save_on_each_node`: False
534
+ - `save_only_model`: False
535
+ - `no_cuda`: False
536
+ - `use_cpu`: False
537
+ - `use_mps_device`: False
538
+ - `seed`: 42
539
+ - `data_seed`: None
540
+ - `jit_mode_eval`: False
541
+ - `use_ipex`: False
542
+ - `bf16`: False
543
+ - `fp16`: False
544
+ - `fp16_opt_level`: O1
545
+ - `half_precision_backend`: auto
546
+ - `bf16_full_eval`: False
547
+ - `fp16_full_eval`: False
548
+ - `tf32`: None
549
+ - `local_rank`: 0
550
+ - `ddp_backend`: None
551
+ - `tpu_num_cores`: None
552
+ - `tpu_metrics_debug`: False
553
+ - `debug`: []
554
+ - `dataloader_drop_last`: False
555
+ - `dataloader_num_workers`: 0
556
+ - `dataloader_prefetch_factor`: None
557
+ - `past_index`: -1
558
+ - `disable_tqdm`: False
559
+ - `remove_unused_columns`: True
560
+ - `label_names`: None
561
+ - `load_best_model_at_end`: False
562
+ - `ignore_data_skip`: False
563
+ - `fsdp`: []
564
+ - `fsdp_min_num_params`: 0
565
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
566
+ - `fsdp_transformer_layer_cls_to_wrap`: None
567
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True}
568
+ - `deepspeed`: None
569
+ - `label_smoothing_factor`: 0.0
570
+ - `optim`: adamw_torch
571
+ - `optim_args`: None
572
+ - `adafactor`: False
573
+ - `group_by_length`: False
574
+ - `length_column_name`: length
575
+ - `ddp_find_unused_parameters`: None
576
+ - `ddp_bucket_cap_mb`: None
577
+ - `ddp_broadcast_buffers`: False
578
+ - `dataloader_pin_memory`: True
579
+ - `dataloader_persistent_workers`: False
580
+ - `skip_memory_metrics`: True
581
+ - `use_legacy_prediction_loop`: False
582
+ - `push_to_hub`: False
583
+ - `resume_from_checkpoint`: None
584
+ - `hub_model_id`: None
585
+ - `hub_strategy`: every_save
586
+ - `hub_private_repo`: False
587
+ - `hub_always_push`: False
588
+ - `gradient_checkpointing`: False
589
+ - `gradient_checkpointing_kwargs`: None
590
+ - `include_inputs_for_metrics`: False
591
+ - `fp16_backend`: auto
592
+ - `push_to_hub_model_id`: None
593
+ - `push_to_hub_organization`: None
594
+ - `mp_parameters`:
595
+ - `auto_find_batch_size`: False
596
+ - `full_determinism`: False
597
+ - `torchdynamo`: None
598
+ - `ray_scope`: last
599
+ - `ddp_timeout`: 1800
600
+ - `torch_compile`: False
601
+ - `torch_compile_backend`: None
602
+ - `torch_compile_mode`: None
603
+ - `dispatch_batches`: None
604
+ - `split_batches`: None
605
+ - `include_tokens_per_second`: False
606
+ - `include_num_input_tokens_seen`: False
607
+ - `neftune_noise_alpha`: None
608
+ - `optim_target_modules`: None
609
+ - `batch_sampler`: batch_sampler
610
+ - `multi_dataset_batch_sampler`: proportional
611
+
612
+ </details>
613
+
614
+ ### Training Logs
615
+ <details><summary>Click to expand</summary>
616
+
617
+ | Epoch | Step | Training Loss |
618
+ |:------:|:-----:|:-------------:|
619
+ | 0.0095 | 50 | 0.0322 |
620
+ | 0.0190 | 100 | 0.0323 |
621
+ | 0.0285 | 150 | 0.0222 |
622
+ | 0.0380 | 200 | 0.0201 |
623
+ | 0.0475 | 250 | 0.0185 |
624
+ | 0.0570 | 300 | 0.0169 |
625
+ | 0.0665 | 350 | 0.0148 |
626
+ | 0.0760 | 400 | 0.0146 |
627
+ | 0.0855 | 450 | 0.0173 |
628
+ | 0.0950 | 500 | 0.0145 |
629
+ | 0.1045 | 550 | 0.0121 |
630
+ | 0.1140 | 600 | 0.0131 |
631
+ | 0.1235 | 650 | 0.0131 |
632
+ | 0.1330 | 700 | 0.0147 |
633
+ | 0.1425 | 750 | 0.0147 |
634
+ | 0.1520 | 800 | 0.0123 |
635
+ | 0.1615 | 850 | 0.0132 |
636
+ | 0.1710 | 900 | 0.0133 |
637
+ | 0.1805 | 950 | 0.0149 |
638
+ | 0.1900 | 1000 | 0.0127 |
639
+ | 0.1995 | 1050 | 0.0136 |
640
+ | 0.2090 | 1100 | 0.0141 |
641
+ | 0.2185 | 1150 | 0.0121 |
642
+ | 0.2281 | 1200 | 0.0144 |
643
+ | 0.2376 | 1250 | 0.0141 |
644
+ | 0.2471 | 1300 | 0.0134 |
645
+ | 0.2566 | 1350 | 0.0121 |
646
+ | 0.2661 | 1400 | 0.0143 |
647
+ | 0.2756 | 1450 | 0.012 |
648
+ | 0.2851 | 1500 | 0.0109 |
649
+ | 0.2946 | 1550 | 0.0112 |
650
+ | 0.3041 | 1600 | 0.014 |
651
+ | 0.3136 | 1650 | 0.0134 |
652
+ | 0.3231 | 1700 | 0.0109 |
653
+ | 0.3326 | 1750 | 0.0117 |
654
+ | 0.3421 | 1800 | 0.0096 |
655
+ | 0.3516 | 1850 | 0.0115 |
656
+ | 0.3611 | 1900 | 0.0137 |
657
+ | 0.3706 | 1950 | 0.0151 |
658
+ | 0.3801 | 2000 | 0.0125 |
659
+ | 0.3896 | 2050 | 0.0141 |
660
+ | 0.3991 | 2100 | 0.0158 |
661
+ | 0.4086 | 2150 | 0.0142 |
662
+ | 0.4181 | 2200 | 0.0114 |
663
+ | 0.4276 | 2250 | 0.0133 |
664
+ | 0.4371 | 2300 | 0.0139 |
665
+ | 0.4466 | 2350 | 0.0137 |
666
+ | 0.4561 | 2400 | 0.0121 |
667
+ | 0.4656 | 2450 | 0.0148 |
668
+ | 0.4751 | 2500 | 0.015 |
669
+ | 0.4846 | 2550 | 0.0144 |
670
+ | 0.4941 | 2600 | 0.0121 |
671
+ | 0.5036 | 2650 | 0.0115 |
672
+ | 0.5131 | 2700 | 0.0164 |
673
+ | 0.5226 | 2750 | 0.0115 |
674
+ | 0.5321 | 2800 | 0.0127 |
675
+ | 0.5416 | 2850 | 0.0121 |
676
+ | 0.5511 | 2900 | 0.0116 |
677
+ | 0.5606 | 2950 | 0.0119 |
678
+ | 0.5701 | 3000 | 0.0133 |
679
+ | 0.5796 | 3050 | 0.0118 |
680
+ | 0.5891 | 3100 | 0.0114 |
681
+ | 0.5986 | 3150 | 0.0137 |
682
+ | 0.6081 | 3200 | 0.0139 |
683
+ | 0.6176 | 3250 | 0.0132 |
684
+ | 0.6271 | 3300 | 0.0144 |
685
+ | 0.6366 | 3350 | 0.0116 |
686
+ | 0.6461 | 3400 | 0.0123 |
687
+ | 0.6556 | 3450 | 0.0124 |
688
+ | 0.6651 | 3500 | 0.0116 |
689
+ | 0.6746 | 3550 | 0.0122 |
690
+ | 0.6842 | 3600 | 0.0149 |
691
+ | 0.6937 | 3650 | 0.0138 |
692
+ | 0.7032 | 3700 | 0.0125 |
693
+ | 0.7127 | 3750 | 0.0116 |
694
+ | 0.7222 | 3800 | 0.011 |
695
+ | 0.7317 | 3850 | 0.0108 |
696
+ | 0.7412 | 3900 | 0.0138 |
697
+ | 0.7507 | 3950 | 0.0123 |
698
+ | 0.7602 | 4000 | 0.0109 |
699
+ | 0.7697 | 4050 | 0.0122 |
700
+ | 0.7792 | 4100 | 0.0115 |
701
+ | 0.7887 | 4150 | 0.0121 |
702
+ | 0.7982 | 4200 | 0.012 |
703
+ | 0.8077 | 4250 | 0.0129 |
704
+ | 0.8172 | 4300 | 0.0129 |
705
+ | 0.8267 | 4350 | 0.0126 |
706
+ | 0.8362 | 4400 | 0.0126 |
707
+ | 0.8457 | 4450 | 0.0114 |
708
+ | 0.8552 | 4500 | 0.011 |
709
+ | 0.8647 | 4550 | 0.0127 |
710
+ | 0.8742 | 4600 | 0.0106 |
711
+ | 0.8837 | 4650 | 0.0113 |
712
+ | 0.8932 | 4700 | 0.0127 |
713
+ | 0.9027 | 4750 | 0.0133 |
714
+ | 0.9122 | 4800 | 0.013 |
715
+ | 0.9217 | 4850 | 0.0133 |
716
+ | 0.9312 | 4900 | 0.012 |
717
+ | 0.9407 | 4950 | 0.0121 |
718
+ | 0.9502 | 5000 | 0.0112 |
719
+ | 0.9597 | 5050 | 0.0115 |
720
+ | 0.9692 | 5100 | 0.0122 |
721
+ | 0.9787 | 5150 | 0.0126 |
722
+ | 0.9882 | 5200 | 0.0109 |
723
+ | 0.9977 | 5250 | 0.0121 |
724
+ | 1.0072 | 5300 | 0.0114 |
725
+ | 1.0167 | 5350 | 0.0076 |
726
+ | 1.0262 | 5400 | 0.0081 |
727
+ | 1.0357 | 5450 | 0.0083 |
728
+ | 1.0452 | 5500 | 0.0091 |
729
+ | 1.0547 | 5550 | 0.0087 |
730
+ | 1.0642 | 5600 | 0.0091 |
731
+ | 1.0737 | 5650 | 0.0095 |
732
+ | 1.0832 | 5700 | 0.0079 |
733
+ | 1.0927 | 5750 | 0.0116 |
734
+ | 1.1022 | 5800 | 0.0077 |
735
+ | 1.1117 | 5850 | 0.0071 |
736
+ | 1.1212 | 5900 | 0.0094 |
737
+ | 1.1307 | 5950 | 0.0091 |
738
+ | 1.1403 | 6000 | 0.0088 |
739
+ | 1.1498 | 6050 | 0.0094 |
740
+ | 1.1593 | 6100 | 0.0075 |
741
+ | 1.1688 | 6150 | 0.0103 |
742
+ | 1.1783 | 6200 | 0.0084 |
743
+ | 1.1878 | 6250 | 0.0074 |
744
+ | 1.1973 | 6300 | 0.0101 |
745
+ | 1.2068 | 6350 | 0.0088 |
746
+ | 1.2163 | 6400 | 0.0091 |
747
+ | 1.2258 | 6450 | 0.0072 |
748
+ | 1.2353 | 6500 | 0.0086 |
749
+ | 1.2448 | 6550 | 0.0075 |
750
+ | 1.2543 | 6600 | 0.0082 |
751
+ | 1.2638 | 6650 | 0.0063 |
752
+ | 1.2733 | 6700 | 0.0085 |
753
+ | 1.2828 | 6750 | 0.0088 |
754
+ | 1.2923 | 6800 | 0.0088 |
755
+ | 1.3018 | 6850 | 0.0091 |
756
+ | 1.3113 | 6900 | 0.0092 |
757
+ | 1.3208 | 6950 | 0.0088 |
758
+ | 1.3303 | 7000 | 0.0091 |
759
+ | 1.3398 | 7050 | 0.008 |
760
+ | 1.3493 | 7100 | 0.0088 |
761
+ | 1.3588 | 7150 | 0.0089 |
762
+ | 1.3683 | 7200 | 0.009 |
763
+ | 1.3778 | 7250 | 0.0086 |
764
+ | 1.3873 | 7300 | 0.0101 |
765
+ | 1.3968 | 7350 | 0.0086 |
766
+ | 1.4063 | 7400 | 0.0092 |
767
+ | 1.4158 | 7450 | 0.0088 |
768
+ | 1.4253 | 7500 | 0.0074 |
769
+ | 1.4348 | 7550 | 0.0083 |
770
+ | 1.4443 | 7600 | 0.0093 |
771
+ | 1.4538 | 7650 | 0.0073 |
772
+ | 1.4633 | 7700 | 0.0075 |
773
+ | 1.4728 | 7750 | 0.0082 |
774
+ | 1.4823 | 7800 | 0.0093 |
775
+ | 1.4918 | 7850 | 0.0078 |
776
+ | 1.5013 | 7900 | 0.0088 |
777
+ | 1.5108 | 7950 | 0.0068 |
778
+ | 1.5203 | 8000 | 0.0064 |
779
+ | 1.5298 | 8050 | 0.006 |
780
+ | 1.5393 | 8100 | 0.0073 |
781
+ | 1.5488 | 8150 | 0.0092 |
782
+ | 1.5583 | 8200 | 0.0099 |
783
+ | 1.5678 | 8250 | 0.0085 |
784
+ | 1.5773 | 8300 | 0.008 |
785
+ | 1.5868 | 8350 | 0.0104 |
786
+ | 1.5964 | 8400 | 0.0082 |
787
+ | 1.6059 | 8450 | 0.0094 |
788
+ | 1.6154 | 8500 | 0.0096 |
789
+ | 1.6249 | 8550 | 0.0095 |
790
+ | 1.6344 | 8600 | 0.0105 |
791
+ | 1.6439 | 8650 | 0.0092 |
792
+ | 1.6534 | 8700 | 0.0076 |
793
+ | 1.6629 | 8750 | 0.0108 |
794
+ | 1.6724 | 8800 | 0.008 |
795
+ | 1.6819 | 8850 | 0.0082 |
796
+ | 1.6914 | 8900 | 0.0091 |
797
+ | 1.7009 | 8950 | 0.0092 |
798
+ | 1.7104 | 9000 | 0.009 |
799
+ | 1.7199 | 9050 | 0.0098 |
800
+ | 1.7294 | 9100 | 0.0101 |
801
+ | 1.7389 | 9150 | 0.0072 |
802
+ | 1.7484 | 9200 | 0.0075 |
803
+ | 1.7579 | 9250 | 0.0085 |
804
+ | 1.7674 | 9300 | 0.0094 |
805
+ | 1.7769 | 9350 | 0.0092 |
806
+ | 1.7864 | 9400 | 0.0066 |
807
+ | 1.7959 | 9450 | 0.0061 |
808
+ | 1.8054 | 9500 | 0.0088 |
809
+ | 1.8149 | 9550 | 0.0056 |
810
+ | 1.8244 | 9600 | 0.0075 |
811
+ | 1.8339 | 9650 | 0.0089 |
812
+ | 1.8434 | 9700 | 0.0083 |
813
+ | 1.8529 | 9750 | 0.0082 |
814
+ | 1.8624 | 9800 | 0.0094 |
815
+ | 1.8719 | 9850 | 0.0086 |
816
+ | 1.8814 | 9900 | 0.0079 |
817
+ | 1.8909 | 9950 | 0.0087 |
818
+ | 1.9004 | 10000 | 0.0106 |
819
+ | 1.9099 | 10050 | 0.0073 |
820
+ | 1.9194 | 10100 | 0.0074 |
821
+ | 1.9289 | 10150 | 0.009 |
822
+ | 1.9384 | 10200 | 0.0112 |
823
+ | 1.9479 | 10250 | 0.0092 |
824
+ | 1.9574 | 10300 | 0.0081 |
825
+ | 1.9669 | 10350 | 0.0084 |
826
+ | 1.9764 | 10400 | 0.008 |
827
+ | 1.9859 | 10450 | 0.008 |
828
+ | 1.9954 | 10500 | 0.0071 |
829
+ | 2.0049 | 10550 | 0.0071 |
830
+ | 2.0144 | 10600 | 0.0046 |
831
+ | 2.0239 | 10650 | 0.0052 |
832
+ | 2.0334 | 10700 | 0.0047 |
833
+ | 2.0429 | 10750 | 0.005 |
834
+ | 2.0525 | 10800 | 0.0053 |
835
+ | 2.0620 | 10850 | 0.0032 |
836
+ | 2.0715 | 10900 | 0.0051 |
837
+ | 2.0810 | 10950 | 0.0045 |
838
+ | 2.0905 | 11000 | 0.0063 |
839
+ | 2.1000 | 11050 | 0.0042 |
840
+ | 2.1095 | 11100 | 0.004 |
841
+ | 2.1190 | 11150 | 0.0054 |
842
+ | 2.1285 | 11200 | 0.0052 |
843
+ | 2.1380 | 11250 | 0.0053 |
844
+ | 2.1475 | 11300 | 0.0054 |
845
+ | 2.1570 | 11350 | 0.0042 |
846
+ | 2.1665 | 11400 | 0.0038 |
847
+ | 2.1760 | 11450 | 0.0045 |
848
+ | 2.1855 | 11500 | 0.0041 |
849
+ | 2.1950 | 11550 | 0.0044 |
850
+ | 2.2045 | 11600 | 0.0045 |
851
+ | 2.2140 | 11650 | 0.005 |
852
+ | 2.2235 | 11700 | 0.0061 |
853
+ | 2.2330 | 11750 | 0.0044 |
854
+ | 2.2425 | 11800 | 0.0061 |
855
+ | 2.2520 | 11850 | 0.0046 |
856
+ | 2.2615 | 11900 | 0.0044 |
857
+ | 2.2710 | 11950 | 0.0041 |
858
+ | 2.2805 | 12000 | 0.0058 |
859
+ | 2.2900 | 12050 | 0.0057 |
860
+ | 2.2995 | 12100 | 0.0066 |
861
+ | 2.3090 | 12150 | 0.0046 |
862
+ | 2.3185 | 12200 | 0.0037 |
863
+ | 2.3280 | 12250 | 0.0061 |
864
+ | 2.3375 | 12300 | 0.0059 |
865
+ | 2.3470 | 12350 | 0.0058 |
866
+ | 2.3565 | 12400 | 0.0055 |
867
+ | 2.3660 | 12450 | 0.0045 |
868
+ | 2.3755 | 12500 | 0.0067 |
869
+ | 2.3850 | 12550 | 0.0048 |
870
+ | 2.3945 | 12600 | 0.0047 |
871
+ | 2.4040 | 12650 | 0.0041 |
872
+ | 2.4135 | 12700 | 0.0055 |
873
+ | 2.4230 | 12750 | 0.0044 |
874
+ | 2.4325 | 12800 | 0.0051 |
875
+ | 2.4420 | 12850 | 0.005 |
876
+ | 2.4515 | 12900 | 0.0053 |
877
+ | 2.4610 | 12950 | 0.005 |
878
+ | 2.4705 | 13000 | 0.0042 |
879
+ | 2.4800 | 13050 | 0.0047 |
880
+ | 2.4895 | 13100 | 0.0049 |
881
+ | 2.4990 | 13150 | 0.006 |
882
+ | 2.5086 | 13200 | 0.0047 |
883
+ | 2.5181 | 13250 | 0.0052 |
884
+ | 2.5276 | 13300 | 0.0052 |
885
+ | 2.5371 | 13350 | 0.0053 |
886
+ | 2.5466 | 13400 | 0.0059 |
887
+ | 2.5561 | 13450 | 0.0049 |
888
+ | 2.5656 | 13500 | 0.0047 |
889
+ | 2.5751 | 13550 | 0.0054 |
890
+ | 2.5846 | 13600 | 0.0048 |
891
+ | 2.5941 | 13650 | 0.007 |
892
+ | 2.6036 | 13700 | 0.0053 |
893
+ | 2.6131 | 13750 | 0.0062 |
894
+ | 2.6226 | 13800 | 0.0054 |
895
+ | 2.6321 | 13850 | 0.005 |
896
+ | 2.6416 | 13900 | 0.0047 |
897
+ | 2.6511 | 13950 | 0.007 |
898
+ | 2.6606 | 14000 | 0.0067 |
899
+ | 2.6701 | 14050 | 0.006 |
900
+ | 2.6796 | 14100 | 0.0065 |
901
+ | 2.6891 | 14150 | 0.0056 |
902
+ | 2.6986 | 14200 | 0.0057 |
903
+ | 2.7081 | 14250 | 0.0048 |
904
+ | 2.7176 | 14300 | 0.0053 |
905
+ | 2.7271 | 14350 | 0.0053 |
906
+ | 2.7366 | 14400 | 0.0047 |
907
+ | 2.7461 | 14450 | 0.0044 |
908
+ | 2.7556 | 14500 | 0.0054 |
909
+ | 2.7651 | 14550 | 0.0068 |
910
+ | 2.7746 | 14600 | 0.0064 |
911
+ | 2.7841 | 14650 | 0.0047 |
912
+ | 2.7936 | 14700 | 0.0044 |
913
+ | 2.8031 | 14750 | 0.0043 |
914
+ | 2.8126 | 14800 | 0.0048 |
915
+ | 2.8221 | 14850 | 0.0046 |
916
+ | 2.8316 | 14900 | 0.0062 |
917
+ | 2.8411 | 14950 | 0.0051 |
918
+ | 2.8506 | 15000 | 0.0051 |
919
+ | 2.8601 | 15050 | 0.0059 |
920
+ | 2.8696 | 15100 | 0.005 |
921
+ | 2.8791 | 15150 | 0.0046 |
922
+ | 2.8886 | 15200 | 0.0051 |
923
+ | 2.8981 | 15250 | 0.0046 |
924
+ | 2.9076 | 15300 | 0.0045 |
925
+ | 2.9171 | 15350 | 0.0065 |
926
+ | 2.9266 | 15400 | 0.0047 |
927
+ | 2.9361 | 15450 | 0.0052 |
928
+ | 2.9456 | 15500 | 0.0053 |
929
+ | 2.9552 | 15550 | 0.005 |
930
+ | 2.9647 | 15600 | 0.0049 |
931
+ | 2.9742 | 15650 | 0.0055 |
932
+ | 2.9837 | 15700 | 0.0047 |
933
+ | 2.9932 | 15750 | 0.0061 |
934
+ | 3.0027 | 15800 | 0.0055 |
935
+ | 3.0122 | 15850 | 0.0034 |
936
+ | 3.0217 | 15900 | 0.0029 |
937
+ | 3.0312 | 15950 | 0.0027 |
938
+ | 3.0407 | 16000 | 0.003 |
939
+ | 3.0502 | 16050 | 0.0023 |
940
+ | 3.0597 | 16100 | 0.0047 |
941
+ | 3.0692 | 16150 | 0.0026 |
942
+ | 3.0787 | 16200 | 0.0036 |
943
+ | 3.0882 | 16250 | 0.003 |
944
+ | 3.0977 | 16300 | 0.0028 |
945
+ | 3.1072 | 16350 | 0.0033 |
946
+ | 3.1167 | 16400 | 0.0025 |
947
+ | 3.1262 | 16450 | 0.0023 |
948
+ | 3.1357 | 16500 | 0.002 |
949
+ | 3.1452 | 16550 | 0.0025 |
950
+ | 3.1547 | 16600 | 0.0026 |
951
+ | 3.1642 | 16650 | 0.0023 |
952
+ | 3.1737 | 16700 | 0.0029 |
953
+ | 3.1832 | 16750 | 0.0038 |
954
+ | 3.1927 | 16800 | 0.0034 |
955
+ | 3.2022 | 16850 | 0.0028 |
956
+ | 3.2117 | 16900 | 0.0024 |
957
+ | 3.2212 | 16950 | 0.0023 |
958
+ | 3.2307 | 17000 | 0.0023 |
959
+ | 3.2402 | 17050 | 0.0027 |
960
+ | 3.2497 | 17100 | 0.0024 |
961
+ | 3.2592 | 17150 | 0.0027 |
962
+ | 3.2687 | 17200 | 0.0022 |
963
+ | 3.2782 | 17250 | 0.0033 |
964
+ | 3.2877 | 17300 | 0.0036 |
965
+ | 3.2972 | 17350 | 0.0029 |
966
+ | 3.3067 | 17400 | 0.0034 |
967
+ | 3.3162 | 17450 | 0.0026 |
968
+ | 3.3257 | 17500 | 0.0024 |
969
+ | 3.3352 | 17550 | 0.0033 |
970
+ | 3.3447 | 17600 | 0.0023 |
971
+ | 3.3542 | 17650 | 0.0027 |
972
+ | 3.3637 | 17700 | 0.0021 |
973
+ | 3.3732 | 17750 | 0.0021 |
974
+ | 3.3827 | 17800 | 0.003 |
975
+ | 3.3922 | 17850 | 0.0029 |
976
+ | 3.4017 | 17900 | 0.0031 |
977
+ | 3.4113 | 17950 | 0.003 |
978
+ | 3.4208 | 18000 | 0.0038 |
979
+ | 3.4303 | 18050 | 0.0037 |
980
+ | 3.4398 | 18100 | 0.0023 |
981
+ | 3.4493 | 18150 | 0.0023 |
982
+ | 3.4588 | 18200 | 0.0033 |
983
+ | 3.4683 | 18250 | 0.0031 |
984
+ | 3.4778 | 18300 | 0.0029 |
985
+ | 3.4873 | 18350 | 0.0031 |
986
+ | 3.4968 | 18400 | 0.0029 |
987
+ | 3.5063 | 18450 | 0.0029 |
988
+ | 3.5158 | 18500 | 0.0037 |
989
+ | 3.5253 | 18550 | 0.0031 |
990
+ | 3.5348 | 18600 | 0.0035 |
991
+ | 3.5443 | 18650 | 0.0041 |
992
+ | 3.5538 | 18700 | 0.0035 |
993
+ | 3.5633 | 18750 | 0.0023 |
994
+ | 3.5728 | 18800 | 0.0032 |
995
+ | 3.5823 | 18850 | 0.0025 |
996
+ | 3.5918 | 18900 | 0.0035 |
997
+ | 3.6013 | 18950 | 0.0038 |
998
+ | 3.6108 | 19000 | 0.0031 |
999
+ | 3.6203 | 19050 | 0.0024 |
1000
+ | 3.6298 | 19100 | 0.0033 |
1001
+ | 3.6393 | 19150 | 0.0026 |
1002
+ | 3.6488 | 19200 | 0.0033 |
1003
+ | 3.6583 | 19250 | 0.0028 |
1004
+ | 3.6678 | 19300 | 0.0036 |
1005
+ | 3.6773 | 19350 | 0.0041 |
1006
+ | 3.6868 | 19400 | 0.0037 |
1007
+ | 3.6963 | 19450 | 0.0036 |
1008
+ | 3.7058 | 19500 | 0.0046 |
1009
+ | 3.7153 | 19550 | 0.0023 |
1010
+ | 3.7248 | 19600 | 0.0026 |
1011
+ | 3.7343 | 19650 | 0.0032 |
1012
+ | 3.7438 | 19700 | 0.0029 |
1013
+ | 3.7533 | 19750 | 0.0029 |
1014
+ | 3.7628 | 19800 | 0.0027 |
1015
+ | 3.7723 | 19850 | 0.0036 |
1016
+ | 3.7818 | 19900 | 0.0035 |
1017
+ | 3.7913 | 19950 | 0.0028 |
1018
+ | 3.8008 | 20000 | 0.0035 |
1019
+ | 3.8103 | 20050 | 0.0036 |
1020
+ | 3.8198 | 20100 | 0.0034 |
1021
+ | 3.8293 | 20150 | 0.0037 |
1022
+ | 3.8388 | 20200 | 0.0024 |
1023
+ | 3.8483 | 20250 | 0.0031 |
1024
+ | 3.8578 | 20300 | 0.0038 |
1025
+ | 3.8674 | 20350 | 0.0033 |
1026
+ | 3.8769 | 20400 | 0.0032 |
1027
+ | 3.8864 | 20450 | 0.0036 |
1028
+ | 3.8959 | 20500 | 0.0031 |
1029
+ | 3.9054 | 20550 | 0.0028 |
1030
+ | 3.9149 | 20600 | 0.004 |
1031
+ | 3.9244 | 20650 | 0.0027 |
1032
+ | 3.9339 | 20700 | 0.0028 |
1033
+ | 3.9434 | 20750 | 0.0033 |
1034
+ | 3.9529 | 20800 | 0.0023 |
1035
+ | 3.9624 | 20850 | 0.0021 |
1036
+ | 3.9719 | 20900 | 0.003 |
1037
+ | 3.9814 | 20950 | 0.0029 |
1038
+ | 3.9909 | 21000 | 0.0024 |
1039
+ | 4.0004 | 21050 | 0.0027 |
1040
+ | 4.0099 | 21100 | 0.0017 |
1041
+ | 4.0194 | 21150 | 0.0017 |
1042
+ | 4.0289 | 21200 | 0.0018 |
1043
+ | 4.0384 | 21250 | 0.0016 |
1044
+ | 4.0479 | 21300 | 0.0012 |
1045
+ | 4.0574 | 21350 | 0.0018 |
1046
+ | 4.0669 | 21400 | 0.0018 |
1047
+ | 4.0764 | 21450 | 0.0021 |
1048
+ | 4.0859 | 21500 | 0.0015 |
1049
+ | 4.0954 | 21550 | 0.0015 |
1050
+ | 4.1049 | 21600 | 0.002 |
1051
+ | 4.1144 | 21650 | 0.0019 |
1052
+ | 4.1239 | 21700 | 0.0011 |
1053
+ | 4.1334 | 21750 | 0.0013 |
1054
+ | 4.1429 | 21800 | 0.0019 |
1055
+ | 4.1524 | 21850 | 0.0018 |
1056
+ | 4.1619 | 21900 | 0.0013 |
1057
+ | 4.1714 | 21950 | 0.0017 |
1058
+ | 4.1809 | 22000 | 0.0016 |
1059
+ | 4.1904 | 22050 | 0.002 |
1060
+ | 4.1999 | 22100 | 0.0016 |
1061
+ | 4.2094 | 22150 | 0.002 |
1062
+ | 4.2189 | 22200 | 0.0019 |
1063
+ | 4.2284 | 22250 | 0.0013 |
1064
+ | 4.2379 | 22300 | 0.0024 |
1065
+ | 4.2474 | 22350 | 0.0018 |
1066
+ | 4.2569 | 22400 | 0.0015 |
1067
+ | 4.2664 | 22450 | 0.0019 |
1068
+ | 4.2759 | 22500 | 0.0015 |
1069
+ | 4.2854 | 22550 | 0.0019 |
1070
+ | 4.2949 | 22600 | 0.002 |
1071
+ | 4.3044 | 22650 | 0.0017 |
1072
+ | 4.3139 | 22700 | 0.0018 |
1073
+ | 4.3235 | 22750 | 0.0014 |
1074
+ | 4.3330 | 22800 | 0.0024 |
1075
+ | 4.3425 | 22850 | 0.0016 |
1076
+ | 4.3520 | 22900 | 0.0018 |
1077
+ | 4.3615 | 22950 | 0.002 |
1078
+ | 4.3710 | 23000 | 0.0012 |
1079
+ | 4.3805 | 23050 | 0.0016 |
1080
+ | 4.3900 | 23100 | 0.0013 |
1081
+ | 4.3995 | 23150 | 0.0016 |
1082
+ | 4.4090 | 23200 | 0.0023 |
1083
+ | 4.4185 | 23250 | 0.0021 |
1084
+ | 4.4280 | 23300 | 0.0017 |
1085
+ | 4.4375 | 23350 | 0.0014 |
1086
+ | 4.4470 | 23400 | 0.0026 |
1087
+ | 4.4565 | 23450 | 0.0019 |
1088
+ | 4.4660 | 23500 | 0.0021 |
1089
+ | 4.4755 | 23550 | 0.0016 |
1090
+ | 4.4850 | 23600 | 0.0019 |
1091
+ | 4.4945 | 23650 | 0.0017 |
1092
+ | 4.5040 | 23700 | 0.0025 |
1093
+ | 4.5135 | 23750 | 0.0015 |
1094
+ | 4.5230 | 23800 | 0.002 |
1095
+ | 4.5325 | 23850 | 0.0026 |
1096
+ | 4.5420 | 23900 | 0.0024 |
1097
+ | 4.5515 | 23950 | 0.0022 |
1098
+ | 4.5610 | 24000 | 0.0018 |
1099
+ | 4.5705 | 24050 | 0.0018 |
1100
+ | 4.5800 | 24100 | 0.0021 |
1101
+ | 4.5895 | 24150 | 0.0014 |
1102
+ | 4.5990 | 24200 | 0.0016 |
1103
+ | 4.6085 | 24250 | 0.0014 |
1104
+ | 4.6180 | 24300 | 0.0022 |
1105
+ | 4.6275 | 24350 | 0.0017 |
1106
+ | 4.6370 | 24400 | 0.0016 |
1107
+ | 4.6465 | 24450 | 0.002 |
1108
+ | 4.6560 | 24500 | 0.0011 |
1109
+ | 4.6655 | 24550 | 0.0013 |
1110
+ | 4.6750 | 24600 | 0.0012 |
1111
+ | 4.6845 | 24650 | 0.0012 |
1112
+ | 4.6940 | 24700 | 0.0017 |
1113
+ | 4.7035 | 24750 | 0.0017 |
1114
+ | 4.7130 | 24800 | 0.0019 |
1115
+ | 4.7225 | 24850 | 0.0014 |
1116
+ | 4.7320 | 24900 | 0.0015 |
1117
+ | 4.7415 | 24950 | 0.0013 |
1118
+ | 4.7510 | 25000 | 0.0018 |
1119
+ | 4.7605 | 25050 | 0.0013 |
1120
+ | 4.7700 | 25100 | 0.0014 |
1121
+ | 4.7796 | 25150 | 0.0019 |
1122
+ | 4.7891 | 25200 | 0.0021 |
1123
+ | 4.7986 | 25250 | 0.0017 |
1124
+ | 4.8081 | 25300 | 0.002 |
1125
+ | 4.8176 | 25350 | 0.0025 |
1126
+ | 4.8271 | 25400 | 0.0016 |
1127
+ | 4.8366 | 25450 | 0.0014 |
1128
+ | 4.8461 | 25500 | 0.0018 |
1129
+ | 4.8556 | 25550 | 0.002 |
1130
+ | 4.8651 | 25600 | 0.001 |
1131
+ | 4.8746 | 25650 | 0.0017 |
1132
+ | 4.8841 | 25700 | 0.0015 |
1133
+ | 4.8936 | 25750 | 0.0018 |
1134
+ | 4.9031 | 25800 | 0.0013 |
1135
+ | 4.9126 | 25850 | 0.0014 |
1136
+ | 4.9221 | 25900 | 0.0013 |
1137
+ | 4.9316 | 25950 | 0.0014 |
1138
+ | 4.9411 | 26000 | 0.0014 |
1139
+ | 4.9506 | 26050 | 0.0015 |
1140
+ | 4.9601 | 26100 | 0.0019 |
1141
+ | 4.9696 | 26150 | 0.0015 |
1142
+ | 4.9791 | 26200 | 0.0019 |
1143
+ | 4.9886 | 26250 | 0.002 |
1144
+ | 4.9981 | 26300 | 0.0014 |
1145
+
1146
+ </details>
1147
+
1148
+ ### Framework Versions
1149
+ - Python: 3.10.13
1150
+ - Sentence Transformers: 3.0.1
1151
+ - Transformers: 4.39.3
1152
+ - PyTorch: 2.1.2
1153
+ - Accelerate: 0.29.3
1154
+ - Datasets: 2.18.0
1155
+ - Tokenizers: 0.15.2
1156
+
1157
+ ## Citation
1158
+
1159
+ ### BibTeX
1160
+
1161
+ #### Sentence Transformers
1162
+ ```bibtex
1163
+ @inproceedings{reimers-2019-sentence-bert,
1164
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
1165
+ author = "Reimers, Nils and Gurevych, Iryna",
1166
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
1167
+ month = "11",
1168
+ year = "2019",
1169
+ publisher = "Association for Computational Linguistics",
1170
+ url = "https://arxiv.org/abs/1908.10084",
1171
+ }
1172
+ ```
1173
+
1174
+ #### ContrastiveLoss
1175
+ ```bibtex
1176
+ @inproceedings{hadsell2006dimensionality,
1177
+ author={Hadsell, R. and Chopra, S. and LeCun, Y.},
1178
+ booktitle={2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06)},
1179
+ title={Dimensionality Reduction by Learning an Invariant Mapping},
1180
+ year={2006},
1181
+ volume={2},
1182
+ number={},
1183
+ pages={1735-1742},
1184
+ doi={10.1109/CVPR.2006.100}
1185
+ }
1186
+ ```
1187
+
1188
+ <!--
1189
+ ## Glossary
1190
+
1191
+ *Clearly define terms in order to be accessible across audiences.*
1192
+ -->
1193
+
1194
+ <!--
1195
+ ## Model Card Authors
1196
+
1197
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
1198
+ -->
1199
+
1200
+ <!--
1201
+ ## Model Card Contact
1202
+
1203
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
1204
+ -->
config.json ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "BAAI/bge-m3",
3
+ "architectures": [
4
+ "XLMRobertaModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "bos_token_id": 0,
8
+ "classifier_dropout": null,
9
+ "eos_token_id": 2,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 1024,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 4096,
15
+ "layer_norm_eps": 1e-05,
16
+ "max_position_embeddings": 8194,
17
+ "model_type": "xlm-roberta",
18
+ "num_attention_heads": 16,
19
+ "num_hidden_layers": 24,
20
+ "output_past": true,
21
+ "pad_token_id": 1,
22
+ "position_embedding_type": "absolute",
23
+ "torch_dtype": "float32",
24
+ "transformers_version": "4.39.3",
25
+ "type_vocab_size": 1,
26
+ "use_cache": true,
27
+ "vocab_size": 250002
28
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.0.1",
4
+ "transformers": "4.39.3",
5
+ "pytorch": "2.1.2"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": null
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:dbf57309de1587ea2fceab5c44a91ac03080e762a046875426a75812a6eeba6d
3
+ size 2271064456
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
3
+ size 5069051
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:39feb9863a378165ab9c5c689047203d789422966c0c58721c5309fd039a8edc
3
+ size 17083074
tokenizer_config.json ADDED
@@ -0,0 +1,55 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "mask_token": "<mask>",
49
+ "model_max_length": 512,
50
+ "pad_token": "<pad>",
51
+ "sep_token": "</s>",
52
+ "sp_model_kwargs": {},
53
+ "tokenizer_class": "XLMRobertaTokenizer",
54
+ "unk_token": "<unk>"
55
+ }