comet24082002 commited on
Commit
34fdc10
1 Parent(s): 751923f

Add new SentenceTransformer model.

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 1024,
3
+ "pooling_mode_cls_token": true,
4
+ "pooling_mode_mean_tokens": false,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,741 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language: []
3
+ library_name: sentence-transformers
4
+ tags:
5
+ - sentence-transformers
6
+ - sentence-similarity
7
+ - feature-extraction
8
+ - generated_from_trainer
9
+ - dataset_size:10524
10
+ - loss:CachedMultipleNegativesRankingLoss
11
+ base_model: comet24082002/finetune_bge_simsce_V1
12
+ datasets: []
13
+ widget:
14
+ - source_sentence: Cấp Giấy chứng nhận quyền sử dụng đất đối với trường hợp đất nông
15
+ nghiệp có diện tích nhỏ hơn diện tích tối thiểu được quy định như thế nào?
16
+ sentences:
17
+ - '"Điều 29. Cấp Giấy chứng nhận quyền sử dụng đất, quyền sở hữu nhà ở và tài sản
18
+ khác gắn liền với đất đối với trường hợp thửa đất có diện tích nhỏ hơn diện tích
19
+ tối thiểu
20
+
21
+ 1. Thửa đất đang sử dụng được hình thành từ trước ngày văn bản quy định của Ủy
22
+ ban nhân dân cấp tỉnh về diện tích tối thiểu được tách thửa có hiệu lực thi hành
23
+ mà diện tích thửa đất nhỏ hơn diện tích tối thiểu theo quy định của Ủy ban nhân
24
+ dân cấp tỉnh nhưng có đủ điều kiện cấp Giấy chứng nhận quyền sử dụng đất, quyền
25
+ sở hữu nhà ở và tài sản khác gắn liền với đất thì người đang sử dụng đất được
26
+ cấp Giấy chứng nhận quyền sử dụng đất, quyền sở hữu nhà ở và tài sản khác gắn
27
+ liền với đất.
28
+
29
+ 2. Không được công chứng, chứng thực, cấp Giấy chứng nhận quyền sử dụng đất, quyền
30
+ sở hữu nhà ở và tài sản khác gắn liền với đất và không được làm thủ tục thực hiện
31
+ các quyền của người sử dụng đất đối với trường hợp tự chia tách thửa đất đã đăng
32
+ ký, đã được cấp Giấy chứng nhận thành hai hoặc nhiều thửa đất mà trong đó có ít
33
+ nhất một thửa đất có diện tích nhỏ hơn diện tích tối thiểu theo quy định của Ủy
34
+ ban nhân dân cấp tỉnh.
35
+
36
+ 3. Trường hợp người sử dụng đất xin tách thửa đất thành thửa đất có diện tích
37
+ nhỏ hơn diện tích tối thiểu đồng thời với việc xin được hợp thửa đất đó với thửa
38
+ đất khác liền kề để tạo thành thửa đất mới có diện tích bằng hoặc lớn hơn diện
39
+ tích tối thiểu được tách thửa thì được phép tách thửa đồng thời với việc hợp thửa
40
+ và cấp Giấy chứng nhận quyền sử dụng đất, quyền sở hữu nhà ở và tài sản khác gắn
41
+ liền với đất cho thửa đất mới."'
42
+ - 'Trình tự, thủ tục chấp thuận hoạt động mua nợ
43
+
44
+ 1. Tổ chức tín dụng, chi nhánh ngân hàng nước ngoài có nhu cầu được chấp thuận
45
+ hoạt động mua nợ lập 01 (một) bộ hồ sơ theo quy định tại Điều 6 Thông tư này gửi
46
+ qua đường bưu điện hoặc nộp trực tiếp cho Ngân hàng Nhà nước (Cơ quan Thanh tra,
47
+ giám sát ngân hàng).
48
+
49
+ 2. Trong thời hạn 40 (bốn mươi) ngày kể từ ngày nhận đủ hồ sơ hợp lệ, Ngân hàng
50
+ Nhà nước xem xét chấp thuận hoạt động mua nợ cho tổ chức tín dụng, chi nhánh ngân
51
+ hàng nước ngoài bằng Quyết định sửa đổi, bổ sung Giấy phép. Văn bản này là một
52
+ bộ phận không tách rời của Giấy phép. Trường hợp từ chối, Ngân hàng Nhà nước thông
53
+ báo bằng văn bản cho tổ chức tín dụng, chi nhánh ngân hàng nước ngoài và nêu rõ
54
+ lý do.'
55
+ - Người có tài sản trưng mua là tổ chức, cá nhân, hộ gia đình trong nước, tổ chức,
56
+ cá nhân nước ngoài có quyền sở hữu tài sản thuộc đối tượng trưng mua.
57
+ - source_sentence: Xe ô tô kinh doanh vận tải hành khách bằng xe buýt phải đáp ứng
58
+ điều kiện nào?
59
+ sentences:
60
+ - 'Địa bàn quản lý
61
+
62
+ 1. Đội 1: Quản lý khu vực phía Bắc, từ địa bàn tỉnh Thanh Hóa trở ra phía Bắc.
63
+
64
+ 2. Đội 2: Quản lý khu vực miền Trung, từ địa bàn tỉnh Nghệ An trở vào đến hết
65
+ địa bàn tỉnh Ninh Thuận, Lâm Đồng và các tỉnh Tây Nguyên.
66
+
67
+ 3. Đội 3: Quản lý khu vực miền Nam, từ địa bàn tỉnh Bình Thuận trở vào phía Nam.
68
+
69
+ Địa bàn quản lý của các Đội không bao gồm địa bàn trên biển.'
70
+ - '"Điều 131. Các trường hợp chấm dứt hợp đồng thuê nhà ở
71
+
72
+ 1. Trường hợp thuê nhà ở thuộc sở hữu nhà nước thì việc chấm dứt hợp đồng thuê
73
+ nhà được thực hiện khi có một trong các trường hợp quy định tại khoản 1 Điều 84
74
+ của Luật này.
75
+
76
+ 2. Trường hợp thuê nhà ở không thuộc sở hữu nhà nước thì việc chấm dứt hợp đồng
77
+ thuê nhà ở được thực hiện khi có một trong các trường hợp sau đây:
78
+
79
+ a) Hợp đồng thuê nhà ở hết hạn; trường hợp trong hợp đồng không xác định thời
80
+ hạn thì hợp đồng chấm dứt sau 90 ngày, kể từ ngày bên cho thuê nhà ở thông báo
81
+ cho bên thuê nhà ở biết việc chấm dứt hợp đồng;
82
+
83
+ b) Hai bên thỏa thuận chấm dứt hợp đồng;
84
+
85
+ c) Nhà ở cho thuê không còn;
86
+
87
+ d) Bên thuê nhà ở chết hoặc có tuyên bố mất tích của Tòa án mà khi chết, mất tích
88
+ không có ai đang cùng chung sống;
89
+
90
+ đ) Nhà ở cho thuê bị hư hỏng nặng, có nguy cơ sập đổ hoặc thuộc khu vực đã có
91
+ quyết định thu hồi đất, giải tỏa nhà ở hoặc có quyết định phá dỡ của cơ quan nhà
92
+ nước có thẩm quyền; nhà ở cho thuê thuộc diện bị Nhà nước trưng mua, trưng dụng
93
+ để sử dụng vào các mục đích khác.
94
+
95
+ Bên cho thuê phải thông báo bằng văn bản cho bên thuê biết trước 30 ngày về việc
96
+ chấm dứt hợp đồng thuê nhà ở quy định tại điểm này, trừ trường hợp các bên có
97
+ thỏa thuận khác;
98
+
99
+ e) Chấm dứt theo quy định tại Điều 132 của Luật này."'
100
+ - 'Kinh doanh vận tải hành khách bằng xe buýt theo tuyến cố định
101
+
102
+ ...
103
+
104
+ 2. Xe ô tô kinh doanh vận tải hành khách bằng xe buýt
105
+
106
+ a) Phải có chỗ ưu tiên cho người khuyết tật, người cao tuổi và phụ nữ mang thai;
107
+
108
+ b) Phải có phù hiệu “XE BUÝT” và được dán cố định phía bên phải mặt trong kính
109
+ trước của xe; phải được niêm yết đầy đủ các thông tin trên xe;
110
+
111
+ c) Phải có sức chứa từ 17 chỗ trở lên. Vị trí, số chỗ ngồi, chỗ đứng cho hành
112
+ khách và các quy định kỹ thuật khác đối với xe buýt theo quy chuẩn kỹ thuật do
113
+ Bộ Giao thông vận tải ban hành. Đối với hoạt động kinh doanh vận tải hành khách
114
+ bằng xe buýt trên các tuyến có hành trình bắt buộc phải qua cầu có trọng tải cho
115
+ phép tham gia giao thông từ 05 tấn trở xuống hoặc trên 50% lộ trình tuyến là đường
116
+ từ cấp IV trở xuống (hoặc đường bộ đô thị có mặt cắt ngang từ 07 mét trở xuống)
117
+ được sử dụng xe ô tô có sức chứa từ 12 đến dưới 17 chỗ.
118
+
119
+ ...'
120
+ - source_sentence: Liên hiệp hợp tác xã phải gửi thông báo về việc tạm ngừng hoạt
121
+ động đến Phòng Đăng ký kinh doanh bao lâu trước khi tạm ngừng hoạt động?
122
+ sentences:
123
+ - "Cơ cấu tổ chức và biên chế\n1. Lãnh đạo\nChi nhánh Trung tâm Internet Việt Nam\
124
+ \ tại thành phố Hồ Chí Minh có Trưởng Chi nhánh và các Phó Trưởng Chi nhánh.\n\
125
+ Trưởng Chi nhánh chịu trách nhiệm trước Giám đốc Trung tâm Internet Việt Nam và\
126
+ \ trước pháp luật về kết quả thực hiện chức năng, nhiệm vụ, quyền hạn được giao.\n\
127
+ Các Phó Trưởng Chi nhánh giúp Trưởng Chi nhánh điều hành các mặt công tác của\
128
+ \ Chi nhánh, chịu trách nhiệm trước Trưởng Chi nhánh và trước pháp luật về nhiệm\
129
+ \ vụ được phân công.\n2. Tổ chức bộ máy\n- Phòng Tổng hợp và Dịch vụ.\n- Phòng\
130
+ \ Khai thác mạng. \nChức năng, nhiệm vụ và mối quan hệ công tác giữa các phòng\
131
+ \ của Chi nhánh do Trưởng Chi nhánh xây dựng trình Giám đốc Trung tâm Internet\
132
+ \ Việt Nam quyết định.\n3. Số lượng người làm việc, lao động của Chi nhánh do\
133
+ \ Trưởng Chi nhánh xây dựng, trình Giám đốc Trung tâm Internet Việt Nam quyết\
134
+ \ định."
135
+ - 'THỦ TỤC HÀNH CHÍNH CẤP TỈNH
136
+
137
+ ...
138
+
139
+ 13. Tạm ngừng hoạt động của liên hiệp hợp tác xã, chi nhánh, văn phòng đại diện,
140
+ địa điểm kinh doanh của liên hiệp hợp tác xã
141
+
142
+ a) Trình tự thực hiện:
143
+
144
+ + Trường hợp đăng ký trực tiếp:
145
+
146
+ Bước 1: Nộp hồ sơ
147
+
148
+ - Khi tạm ngừng hoạt động liên hiệp hợp tác xã, tạm ngừng hoạt động chi nhánh,
149
+ văn phòng đại diện, địa điểm kinh doanh của liên hiệp hợp tác xã, liên hiệp hợp
150
+ tác xã gửi thông báo bằng văn bản đến Phòng Đăng ký kinh doanh thuộc Sở Kế hoạch
151
+ và Đầu tư, nơi đã cấp Giấy chứng nhận đăng ký liên hiệp hợp tác xã, Giấy chứng
152
+ nhận đăng ký chi nhánh, văn phòng đại diện, địa điểm kinh doanh cho liên hiệp
153
+ hợp tác xã ít nhất 15 ngày trước khi tạm ngừng hoạt động.
154
+
155
+ Bước 2: Tiếp nhận hồ sơ
156
+
157
+ - Người đến làm thủ tục nộp bản sao hợp lệ giấy chứng minh nhân dân hoặc hộ chiếu
158
+ còn hiệu lực.
159
+
160
+ ...'
161
+ - '"Điều 6. Thời hiệu xử lý vi phạm hành chính
162
+
163
+ 1. Thời hiệu xử phạt vi phạm hành chính được quy định như sau:
164
+
165
+ a) Thời hiệu xử phạt vi phạm hành chính là 01 năm, trừ các trường hợp sau đây:
166
+
167
+ Vi phạm hành chính về kế toán; hóa đơn; phí, lệ phí; kinh doanh bảo hiểm; quản
168
+ lý giá; chứng khoán; sở hữu trí tuệ; xây dựng; thủy sản; lâm nghiệp; điều tra,
169
+ quy hoạch, thăm dò, khai thác, sử dụng nguồn tài nguyên nước; hoạt động dầu khí
170
+ và hoạt động khoáng sản khác; bảo vệ môi trường; năng lượng nguyên tử; quản lý,
171
+ phát triển nhà và công sở; đất đai; đê điều; báo chí; xuất bản; sản xuất, xuất
172
+ khẩu, nhập khẩu, kinh doanh hàng hóa; sản xuất, buôn bán hàng cấm, hàng giả; quản
173
+ lý lao động ngoài nước thì thời hiệu xử phạt vi phạm hành chính là 02 năm.
174
+
175
+ Vi phạm hành chính về thuế thì thời hiệu xử phạt vi phạm hành chính theo quy định
176
+ của pháp luật về quản lý thuế;
177
+
178
+ b) Thời điểm để tính thời hiệu xử phạt vi phạm hành chính quy định tại điểm a
179
+ khoản 1 Điều này được quy định như sau:
180
+
181
+ Đối với vi phạm hành chính đã kết thúc thì thời hiệu được tính từ thời điểm chấm
182
+ dứt hành vi vi phạm.
183
+
184
+ Đối với vi phạm hành chính đang được thực hiện thì thời hiệu được tính từ thời
185
+ điểm phát hiện hành vi vi phạm;
186
+
187
+ c) Trường hợp xử phạt vi phạm hành chính đối với cá nhân,tổ chức do cơ quan tiến
188
+ hành tố tụng chuyển đến thì thời hiệu được áp dụng theo quy định tại điểm a và
189
+ điểm b khoản này. Thời gian cơ quan tiến hành tố tụng thụ lý, xem xét được tính
190
+ vào thời hiệu xử phạt vi phạm hành chính.
191
+
192
+ d) Trong thời hạn được quy định tại điểm a và điểm b khoản này mà cá nhân, tổ
193
+ chức cố tình trốn tránh, cản trở việc xử phạt thì thời hiệu xử phạt vi phạm hành
194
+ chính được tính lại kể từ thời điểm chấm dứt hành vi trốn tránh, cản trở việc
195
+ xử phạt."'
196
+ - source_sentence: Thực hiện gia hạn tạm trú cho người đã được cấp giấy miễn thị thực
197
+ tại Cục Quản lý xuất nhập cảnh, Bộ Công an có phải nộp lệ phí?
198
+ sentences:
199
+ - 'Thủ tục: Gia hạn tạm trú cho người đã được cấp giấy miễn thị thực
200
+
201
+ ...
202
+
203
+ - Phí: 10USD/lần.
204
+
205
+ - Tên mẫu đơn, mẫu tờ khai: Tờ khai đề nghị cấp thị thực, gia hạn tạm trú (Mẫu
206
+ NA5) ban hành kèm theo Thông tư số 04/2015/TT-BCA ngày 05/01/2015.
207
+
208
+ - Yêu cầu, điều kiện thực hiện thủ tục hành chính:
209
+
210
+ + Có hộ chiếu hoặc giấy tờ có giá trị đi lại quốc tế còn giá trị ít nhất 01 năm.
211
+
212
+ + Người nhập cảnh bằng giấy miễn thị thực được cơ quan, tổ chức, cá nhân tại Việt
213
+ Nam bảo lãnh và có lý do chính đáng.
214
+
215
+ + Không thuộc các trường hợp chưa cho nhập cảnh và tạm hoãn xuất cảnh theo quy
216
+ định tại Điều 21 và Điều 28 của Luật Nhập cảnh, xuất cảnh, quá cảnh, cư trú của
217
+ người nước ngoài tại Việt Nam.
218
+
219
+ ...'
220
+ - 'Quy định nội bộ về cấp tín dụng, quản lý nợ, chính sách dự phòng rủi ro
221
+
222
+ ...
223
+
224
+ 2. Quy định nội bộ về cấp tín dụng, quản lý nợ tối thiểu phải đáp ứng các yêu
225
+ cầu sau:
226
+
227
+ a) Được xây dựng trên cơ sở thông tin, số liệu khách hàng đã thu thập được, kết
228
+ quả xếp hạng khách hàng theo hệ thống xếp hạng tín dụng nội bộ;
229
+
230
+ b) Được sử dụng thống nhất trong toàn hệ thống, làm cơ sở để thẩm định, phê duyệt
231
+ cấp tín dụng, quản lý nợ đối với khách hàng cụ thể;
232
+
233
+ c) Có quy định chính sách tín dụng đối với khách hàng, trong đó bao gồm quy định
234
+ về điều kiện cấp tín dụng, hạn mức cấp tín dụng, lãi suất, hồ sơ, trình tự, thủ
235
+ tục, quy trình thẩm định, phê duyệt cấp tín dụng, quản lý nợ;
236
+
237
+ d) Có quy định về quản lý nhằm đảm bảo tuân thủ quy định của Ngân hàng Nhà nước
238
+ về các tỷ lệ đảm bảo an toàn trong hoạt động của tổ chức tín dụng, chi nhánh ngân
239
+ hàng nước ngoài;
240
+
241
+ đ) Có quy định về trách nhiệm, quyền hạn của các đơn vị, cá nhân trong việc thẩm
242
+ định, phê duyệt cấp tín dụng, quản lý chất lượng tín dụng, quản lý tài sản bảo
243
+ đảm;
244
+
245
+ e) Có quy định về quy trình, nội dung kiểm tra, kiểm soát trước, trong và sau
246
+ khi cấp tín dụng;
247
+
248
+ g) Có quy định về biện pháp bảo đảm, thẩm định và quản lý tài sản bảo đảm;
249
+
250
+ h) Có quy định về định giá tài sản bảo đảm, bao gồm nguyên tắc, định kỳ, phương
251
+ pháp, quy trình và trách nhiệm của từng đơn vị, cá nhân có liên quan đến việc
252
+ định giá tài sản bảo đảm theo quy định của pháp luật để đảm bảo giá trị tài sản
253
+ bảo đảm phù hợp với giá trị thị trường khi tính số tiền trích lập dự phòng cụ
254
+ thể theo quy định tại Thông tư này;
255
+
256
+ i) Có quy định về các biện pháp thu hồi nợ.
257
+
258
+ ...'
259
+ - 'Bảo trì, bảo dưỡng, duy trì hoạt động, nâng cấp, chỉnh sửa Cổng thông tin điện
260
+ tử Viện kiểm sát nhân dân tối cao
261
+
262
+ 1. Cổng thông tin điện tử phải được thường xuyên kiểm tra, bảo dưỡng, sửa chữa,
263
+ giám sát hoạt động để đảm bảo hoạt động liên tục 24 giờ trong tất cả các ngày.
264
+
265
+ 2. Hằng năm, Văn phòng phối hợp với Cục Thống kê tội phạm và Công nghệ thông tin
266
+ rà soát và đề xuất phương án nâng cấp, chỉnh sửa Cổng thông tin điện tử cho phù
267
+ hợp với nhu cầu thực tế. Đồng thời xây dựng phương án trang bị đầy đủ trang thiết
268
+ bị cần thiết phục vụ cho việc thu thập, xử lý và cập nhật thông tin cho Cổng thông
269
+ tin điện tử, bảo đảm khai thác hiệu quả hạ tầng công nghệ hiện có.'
270
+ - source_sentence: Các tổ chức nào được phép kinh doanh ngoại hối ở Việt Nam?
271
+ sentences:
272
+ - '"Điều 2. Giải thích từ ngữ
273
+
274
+ Tại Thông tư này, các từ ngữ dưới đây được hiểu như sau:
275
+
276
+ 1. Tổ chức tín dụng được phép hoạt động ngoại hối là các ngân hàng, tổ chức tín
277
+ dụng phi ngân hàng và chi nhánh ngân hàng nước ngoài được kinh doanh, cung ứng
278
+ dịch vụ ngoại hối (sau đây gọi là tổ chức tín dụng được phép).
279
+
280
+ ..."'
281
+ - '"Điều 24. Mục đích sử dụng các quỹ
282
+
283
+ ...
284
+
285
+ 2. Mục đích sử dụng Quỹ:
286
+
287
+ ...
288
+
289
+ e) Quỹ phúc lợi tập trung được trích lập từ lợi nhuận sau thuế của Công ty mẹ
290
+ và nguồn đóng góp khác (nếu có). Quỹ phúc lợi được dùng để:
291
+
292
+ - Đầu tư xây dựng hoặc sửa chữa các công trình phúc lợi của Công ty mẹ;
293
+
294
+ - Chi cho các hoạt động phúc lợi của người lao động trong Công ty mẹ bao gồm cả
295
+ người quản lý, kiểm soát viên của Công ty mẹ làm việc theo hợp đồng lao động và
296
+ người quản lý, kiểm soát viên của Công ty mẹ do nhà nước bổ nhiệm;
297
+
298
+ - Góp một phần vốn để đầu tư xây dựng các công trình phúc lợi chung trong ngành
299
+ hoặc với các đơn vị khác theo hợp đồng;
300
+
301
+ - Sử dụng một phần quỹ phúc lợi để trợ cấp khó khăn đột xuất cho những người lao
302
+ động kể cả những trường hợp về hưu, về mất sức, lâm vào hoàn cảnh khó khăn, không
303
+ nơi nương tựa hoặc làm công tác từ thiện xã hội;
304
+
305
+ - Mức chi sử dụng quỹ do Tổng giám đốc Công ty mẹ quyết định được ghi trong quy
306
+ chế quản lý, sử dụng quỹ của Công ty mẹ."'
307
+ - '“1. Trong thời hạn 06 tháng, kể từ ngày nhận được bản án, quyết định dân sự đã
308
+ có hiệu lực pháp luật của Tòa án nước ngoài mà không có yêu cầu thi hành tại Việt
309
+ Nam, đương sự, người có quyền, lợi ích hợp pháp liên quan hoặc người đại diện
310
+ hợp pháp của họ có quyền gửi đơn đến Bộ Tư pháp Việt Nam theo quy định của điều
311
+ ước quốc tế mà Cộng hòa xã hội chủ nghĩa Việt Nam là thành viên hoặc Tòa án có
312
+ thẩm quyền của Việt Nam theo quy định của Bộ luật này trong trường hợp điều ước
313
+ quốc tế mà Cộng hòa xã hội chủ nghĩa Việt Nam là thành viên không quy định hoặc
314
+ không có điều ước quốc tế liên quan để yêu cầu Tòa án không công nhận bản án,
315
+ quyết định dân sự đó.
316
+
317
+ 2. Trường hợp người làm đơn chứng minh được vì sự kiện bất khả kháng hoặc trở
318
+ ngại khách quan mà không thể gửi đơn đúng thời hạn quy định tại khoản 1 Điều này
319
+ thì thời gian có sự kiện bất khả kháng hoặc trở ngại khách quan đó không tính
320
+ vào thời hạn gửi đơn.”'
321
+ pipeline_tag: sentence-similarity
322
+ ---
323
+
324
+ # SentenceTransformer based on comet24082002/finetune_bge_simsce_V1
325
+
326
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [comet24082002/finetune_bge_simsce_V1](https://huggingface.co/comet24082002/finetune_bge_simsce_V1). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
327
+
328
+ ## Model Details
329
+
330
+ ### Model Description
331
+ - **Model Type:** Sentence Transformer
332
+ - **Base model:** [comet24082002/finetune_bge_simsce_V1](https://huggingface.co/comet24082002/finetune_bge_simsce_V1) <!-- at revision af7a9066abe057bf5109dcd3d877747dcc61227c -->
333
+ - **Maximum Sequence Length:** 512 tokens
334
+ - **Output Dimensionality:** 1024 tokens
335
+ - **Similarity Function:** Cosine Similarity
336
+ <!-- - **Training Dataset:** Unknown -->
337
+ <!-- - **Language:** Unknown -->
338
+ <!-- - **License:** Unknown -->
339
+
340
+ ### Model Sources
341
+
342
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
343
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
344
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
345
+
346
+ ### Full Model Architecture
347
+
348
+ ```
349
+ SentenceTransformer(
350
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
351
+ (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
352
+ (2): Normalize()
353
+ )
354
+ ```
355
+
356
+ ## Usage
357
+
358
+ ### Direct Usage (Sentence Transformers)
359
+
360
+ First install the Sentence Transformers library:
361
+
362
+ ```bash
363
+ pip install -U sentence-transformers
364
+ ```
365
+
366
+ Then you can load this model and run inference.
367
+ ```python
368
+ from sentence_transformers import SentenceTransformer
369
+
370
+ # Download from the 🤗 Hub
371
+ model = SentenceTransformer("comet24082002/ft_bge_newLaw_CachedMultipleNegativeRankingLoss_SimSCE_V1_5epochs")
372
+ # Run inference
373
+ sentences = [
374
+ 'Các tổ chức nào được phép kinh doanh ngoại hối ở Việt Nam?',
375
+ '"Điều 2. Giải thích từ ngữ\nTại Thông tư này, các từ ngữ dưới đây được hiểu như sau:\n1. Tổ chức tín dụng được phép hoạt động ngoại hối là các ngân hàng, tổ chức tín dụng phi ngân hàng và chi nhánh ngân hàng nước ngoài được kinh doanh, cung ứng dịch vụ ngoại hối (sau đây gọi là tổ chức tín dụng được phép).\n..."',
376
+ '"Điều 24. Mục đích sử dụng các quỹ\n...\n2. Mục đích sử dụng Quỹ:\n...\ne) Quỹ phúc lợi tập trung được trích lập từ lợi nhuận sau thuế của Công ty mẹ và nguồn đóng góp khác (nếu có). Quỹ phúc lợi được dùng để:\n- Đầu tư xây dựng hoặc sửa chữa các công trình phúc lợi của Công ty mẹ;\n- Chi cho các hoạt động phúc lợi của người lao động trong Công ty mẹ bao gồm cả người quản lý, kiểm soát viên của Công ty mẹ làm việc theo hợp đồng lao động và người quản lý, kiểm soát viên của Công ty mẹ do nhà nước bổ nhiệm;\n- Góp một phần vốn để đầu tư xây dựng các công trình phúc lợi chung trong ngành hoặc với các đơn vị khác theo hợp đồng;\n- Sử dụng một phần quỹ phúc lợi để trợ cấp khó khăn đột xuất cho những người lao động kể cả những trường hợp về hưu, về mất sức, lâm vào hoàn cảnh khó khăn, không nơi nương tựa hoặc làm công tác từ thiện xã hội;\n- Mức chi sử dụng quỹ do Tổng giám đốc Công ty mẹ quyết định được ghi trong quy chế quản lý, sử dụng quỹ của Công ty mẹ."',
377
+ ]
378
+ embeddings = model.encode(sentences)
379
+ print(embeddings.shape)
380
+ # [3, 1024]
381
+
382
+ # Get the similarity scores for the embeddings
383
+ similarities = model.similarity(embeddings, embeddings)
384
+ print(similarities.shape)
385
+ # [3, 3]
386
+ ```
387
+
388
+ <!--
389
+ ### Direct Usage (Transformers)
390
+
391
+ <details><summary>Click to see the direct usage in Transformers</summary>
392
+
393
+ </details>
394
+ -->
395
+
396
+ <!--
397
+ ### Downstream Usage (Sentence Transformers)
398
+
399
+ You can finetune this model on your own dataset.
400
+
401
+ <details><summary>Click to expand</summary>
402
+
403
+ </details>
404
+ -->
405
+
406
+ <!--
407
+ ### Out-of-Scope Use
408
+
409
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
410
+ -->
411
+
412
+ <!--
413
+ ## Bias, Risks and Limitations
414
+
415
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
416
+ -->
417
+
418
+ <!--
419
+ ### Recommendations
420
+
421
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
422
+ -->
423
+
424
+ ## Training Details
425
+
426
+ ### Training Dataset
427
+
428
+ #### Unnamed Dataset
429
+
430
+
431
+ * Size: 10,524 training samples
432
+ * Columns: <code>anchor</code> and <code>positive</code>
433
+ * Approximate statistics based on the first 1000 samples:
434
+ | | anchor | positive |
435
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
436
+ | type | string | string |
437
+ | details | <ul><li>min: 8 tokens</li><li>mean: 24.54 tokens</li><li>max: 47 tokens</li></ul> | <ul><li>min: 16 tokens</li><li>mean: 267.58 tokens</li><li>max: 512 tokens</li></ul> |
438
+ * Samples:
439
+ | anchor | positive |
440
+ |:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
441
+ | <code>Hội viên Hội Văn nghệ dân gian Việt Nam có những quyền hạn gì?</code> | <code>Quyền của hội viên<br>1. Được cấp thẻ hội viên, được Hội giúp đỡ thực hiện các hoạt động sưu tầm, nghiên cứu văn hóa văn nghệ dân gian hợp pháp, được tham dự các giải thưởng hằng năm của Hội theo quy định của Điều lệ hội và quy định của pháp luật.<br>2. Được tham gia thảo luận, quyết định các chủ trương công tác của Hội theo quy định của Hội; được tham dự Đại hội, ứng cử, đề cử, bầu cử vào các cơ quan lãnh đạo và Ban Kiểm tra Hội theo quy định của Hội; được giới thiệu hội viên mới.<br>3. Được Hội bảo vệ quyền, lợi ích hợp pháp theo quy định của pháp luật, được hưởng các quyền lợi vật chất, tinh thần theo Quy chế về tổ chức và hoạt động của Hội. Được Hội cung cấp thông tin liên quan đến lĩnh vực hoạt động của Hội, được tham gia các hoạt động do Hội tổ chức.<br>4. Có quyền phê bình, chất vấn các cá nhân lãnh đạo và các cơ quan, tổ chức chuyên môn của Hội và yêu cầu được trả lời những nội dung liên quan đến tổ chức, hoạt động của Hội theo quy định của Điều lệ Hội.<br>5. Có quyền đề nghị bằng văn bản được ngừng sinh hoạt Hội theo quy định của Hội.<br>6. Được khen thưởng theo quy định của Hội.<br>7. Được ra khỏi Hội khi xét thấy không thể tiếp tục tham gia sinh hoạt Hội.</code> |
442
+ | <code>Giáo viên muốn xét thăng hạng giáo viên trung học cơ sở hạng I có cần được cấp chứng chỉ bồi dưỡng hay không?</code> | <code>Giáo viên trung học cơ sở hạng I - Mã số V.07.04.30<br>...<br>3. Tiêu chuẩn về trình độ đào tạo, bồi dưỡng<br>a) Có bằng thạc sĩ trở lên thuộc ngành đào tạo giáo viên đối với giáo viên trung học cơ sở hoặc có bằng thạc sĩ trở lên chuyên ngành phù hợp với môn học giảng dạy hoặc có bằng thạc sĩ quản lý giáo dục trở lên;<br>b) Có chứng chỉ bồi dưỡng theo tiêu chuẩn chức danh nghề nghiệp giáo viên trung học cơ sở hạng I.</code> |
443
+ | <code>Trong kinh doanh vận tải hành khách bằng xe buýt theo tuyến cố định, nhân viên xe buýt không giúp đỡ hành khách đi xe là người khuyết tật sẽ bị xử phạt thế nào?</code> | <code>Xử phạt nhân viên phục vụ trên xe buýt, xe vận chuyển hành khách theo tuyến cố định, xe vận chuyển hành khách theo hợp đồng, xe vận chuyển khách du lịch vi phạm quy định về trật tự an toàn giao thông<br>1. Phạt tiền từ 80.000 đồng đến 100.000 đồng đối với một trong các hành vi vi phạm sau đây:<br>a) Không hỗ trợ, giúp đỡ hành khách đi xe là người cao tuổi, trẻ em không tự lên xuống xe được, người khuyết tật vận động hoặc khuyết tật thị giác;<br>...</code> |
444
+ * Loss: [<code>CachedMultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cachedmultiplenegativesrankingloss) with these parameters:
445
+ ```json
446
+ {
447
+ "scale": 20.0,
448
+ "similarity_fct": "cos_sim"
449
+ }
450
+ ```
451
+
452
+ ### Training Hyperparameters
453
+ #### Non-Default Hyperparameters
454
+
455
+ - `per_device_train_batch_size`: 256
456
+ - `learning_rate`: 2e-05
457
+ - `num_train_epochs`: 5
458
+ - `warmup_ratio`: 0.1
459
+
460
+ #### All Hyperparameters
461
+ <details><summary>Click to expand</summary>
462
+
463
+ - `overwrite_output_dir`: False
464
+ - `do_predict`: False
465
+ - `eval_strategy`: no
466
+ - `prediction_loss_only`: True
467
+ - `per_device_train_batch_size`: 256
468
+ - `per_device_eval_batch_size`: 8
469
+ - `per_gpu_train_batch_size`: None
470
+ - `per_gpu_eval_batch_size`: None
471
+ - `gradient_accumulation_steps`: 1
472
+ - `eval_accumulation_steps`: None
473
+ - `learning_rate`: 2e-05
474
+ - `weight_decay`: 0.0
475
+ - `adam_beta1`: 0.9
476
+ - `adam_beta2`: 0.999
477
+ - `adam_epsilon`: 1e-08
478
+ - `max_grad_norm`: 1.0
479
+ - `num_train_epochs`: 5
480
+ - `max_steps`: -1
481
+ - `lr_scheduler_type`: linear
482
+ - `lr_scheduler_kwargs`: {}
483
+ - `warmup_ratio`: 0.1
484
+ - `warmup_steps`: 0
485
+ - `log_level`: passive
486
+ - `log_level_replica`: warning
487
+ - `log_on_each_node`: True
488
+ - `logging_nan_inf_filter`: True
489
+ - `save_safetensors`: True
490
+ - `save_on_each_node`: False
491
+ - `save_only_model`: False
492
+ - `restore_callback_states_from_checkpoint`: False
493
+ - `no_cuda`: False
494
+ - `use_cpu`: False
495
+ - `use_mps_device`: False
496
+ - `seed`: 42
497
+ - `data_seed`: None
498
+ - `jit_mode_eval`: False
499
+ - `use_ipex`: False
500
+ - `bf16`: False
501
+ - `fp16`: False
502
+ - `fp16_opt_level`: O1
503
+ - `half_precision_backend`: auto
504
+ - `bf16_full_eval`: False
505
+ - `fp16_full_eval`: False
506
+ - `tf32`: None
507
+ - `local_rank`: 0
508
+ - `ddp_backend`: None
509
+ - `tpu_num_cores`: None
510
+ - `tpu_metrics_debug`: False
511
+ - `debug`: []
512
+ - `dataloader_drop_last`: False
513
+ - `dataloader_num_workers`: 0
514
+ - `dataloader_prefetch_factor`: None
515
+ - `past_index`: -1
516
+ - `disable_tqdm`: False
517
+ - `remove_unused_columns`: True
518
+ - `label_names`: None
519
+ - `load_best_model_at_end`: False
520
+ - `ignore_data_skip`: False
521
+ - `fsdp`: []
522
+ - `fsdp_min_num_params`: 0
523
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
524
+ - `fsdp_transformer_layer_cls_to_wrap`: None
525
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
526
+ - `deepspeed`: None
527
+ - `label_smoothing_factor`: 0.0
528
+ - `optim`: adamw_torch
529
+ - `optim_args`: None
530
+ - `adafactor`: False
531
+ - `group_by_length`: False
532
+ - `length_column_name`: length
533
+ - `ddp_find_unused_parameters`: None
534
+ - `ddp_bucket_cap_mb`: None
535
+ - `ddp_broadcast_buffers`: False
536
+ - `dataloader_pin_memory`: True
537
+ - `dataloader_persistent_workers`: False
538
+ - `skip_memory_metrics`: True
539
+ - `use_legacy_prediction_loop`: False
540
+ - `push_to_hub`: False
541
+ - `resume_from_checkpoint`: None
542
+ - `hub_model_id`: None
543
+ - `hub_strategy`: every_save
544
+ - `hub_private_repo`: False
545
+ - `hub_always_push`: False
546
+ - `gradient_checkpointing`: False
547
+ - `gradient_checkpointing_kwargs`: None
548
+ - `include_inputs_for_metrics`: False
549
+ - `eval_do_concat_batches`: True
550
+ - `fp16_backend`: auto
551
+ - `push_to_hub_model_id`: None
552
+ - `push_to_hub_organization`: None
553
+ - `mp_parameters`:
554
+ - `auto_find_batch_size`: False
555
+ - `full_determinism`: False
556
+ - `torchdynamo`: None
557
+ - `ray_scope`: last
558
+ - `ddp_timeout`: 1800
559
+ - `torch_compile`: False
560
+ - `torch_compile_backend`: None
561
+ - `torch_compile_mode`: None
562
+ - `dispatch_batches`: None
563
+ - `split_batches`: None
564
+ - `include_tokens_per_second`: False
565
+ - `include_num_input_tokens_seen`: False
566
+ - `neftune_noise_alpha`: None
567
+ - `optim_target_modules`: None
568
+ - `batch_eval_metrics`: False
569
+ - `batch_sampler`: batch_sampler
570
+ - `multi_dataset_batch_sampler`: proportional
571
+
572
+ </details>
573
+
574
+ ### Training Logs
575
+ <details><summary>Click to expand</summary>
576
+
577
+ | Epoch | Step | Training Loss |
578
+ |:------:|:----:|:-------------:|
579
+ | 0.0476 | 2 | 1.5732 |
580
+ | 0.0952 | 4 | 1.6162 |
581
+ | 0.1429 | 6 | 1.3108 |
582
+ | 0.1905 | 8 | 1.0944 |
583
+ | 0.2381 | 10 | 0.8889 |
584
+ | 0.2857 | 12 | 0.7499 |
585
+ | 0.3333 | 14 | 0.601 |
586
+ | 0.3810 | 16 | 0.565 |
587
+ | 0.4286 | 18 | 0.4791 |
588
+ | 0.4762 | 20 | 0.4314 |
589
+ | 0.5238 | 22 | 0.4619 |
590
+ | 0.5714 | 24 | 0.3768 |
591
+ | 0.6190 | 26 | 0.4344 |
592
+ | 0.6667 | 28 | 0.3748 |
593
+ | 0.7143 | 30 | 0.3172 |
594
+ | 0.7619 | 32 | 0.3971 |
595
+ | 0.8095 | 34 | 0.2847 |
596
+ | 0.8571 | 36 | 0.3426 |
597
+ | 0.9048 | 38 | 0.4206 |
598
+ | 0.9524 | 40 | 0.276 |
599
+ | 1.0 | 42 | 0.1399 |
600
+ | 1.0476 | 44 | 0.2204 |
601
+ | 1.0952 | 46 | 0.2922 |
602
+ | 1.1429 | 48 | 0.2728 |
603
+ | 1.1905 | 50 | 0.2355 |
604
+ | 1.2381 | 52 | 0.2075 |
605
+ | 1.2857 | 54 | 0.2285 |
606
+ | 1.3333 | 56 | 0.2303 |
607
+ | 1.3810 | 58 | 0.2122 |
608
+ | 1.4286 | 60 | 0.2553 |
609
+ | 1.4762 | 62 | 0.2361 |
610
+ | 1.5238 | 64 | 0.2407 |
611
+ | 1.5714 | 66 | 0.2206 |
612
+ | 1.6190 | 68 | 0.2375 |
613
+ | 1.6667 | 70 | 0.2509 |
614
+ | 1.7143 | 72 | 0.1977 |
615
+ | 1.7619 | 74 | 0.2391 |
616
+ | 1.8095 | 76 | 0.1676 |
617
+ | 1.8571 | 78 | 0.3073 |
618
+ | 1.9048 | 80 | 0.2181 |
619
+ | 1.9524 | 82 | 0.265 |
620
+ | 2.0 | 84 | 0.1474 |
621
+ | 2.0476 | 86 | 0.1838 |
622
+ | 2.0952 | 88 | 0.2052 |
623
+ | 2.1429 | 90 | 0.1581 |
624
+ | 2.1905 | 92 | 0.1753 |
625
+ | 2.2381 | 94 | 0.1829 |
626
+ | 2.2857 | 96 | 0.2051 |
627
+ | 2.3333 | 98 | 0.2081 |
628
+ | 2.3810 | 100 | 0.194 |
629
+ | 2.4286 | 102 | 0.1139 |
630
+ | 2.4762 | 104 | 0.2349 |
631
+ | 2.5238 | 106 | 0.1427 |
632
+ | 2.5714 | 108 | 0.1654 |
633
+ | 2.6190 | 110 | 0.187 |
634
+ | 2.6667 | 112 | 0.1615 |
635
+ | 2.7143 | 114 | 0.1933 |
636
+ | 2.7619 | 116 | 0.1608 |
637
+ | 2.8095 | 118 | 0.1548 |
638
+ | 2.8571 | 120 | 0.1659 |
639
+ | 2.9048 | 122 | 0.1498 |
640
+ | 2.9524 | 124 | 0.1927 |
641
+ | 3.0 | 126 | 0.0566 |
642
+ | 3.0476 | 128 | 0.1493 |
643
+ | 3.0952 | 130 | 0.1435 |
644
+ | 3.1429 | 132 | 0.157 |
645
+ | 3.1905 | 134 | 0.1999 |
646
+ | 3.2381 | 136 | 0.1026 |
647
+ | 3.2857 | 138 | 0.1718 |
648
+ | 3.3333 | 140 | 0.1603 |
649
+ | 3.3810 | 142 | 0.1537 |
650
+ | 3.4286 | 144 | 0.1709 |
651
+ | 3.4762 | 146 | 0.1661 |
652
+ | 3.5238 | 148 | 0.1389 |
653
+ | 3.5714 | 150 | 0.1447 |
654
+ | 3.6190 | 152 | 0.1482 |
655
+ | 3.6667 | 154 | 0.1344 |
656
+ | 3.7143 | 156 | 0.1348 |
657
+ | 3.7619 | 158 | 0.1271 |
658
+ | 3.8095 | 160 | 0.1549 |
659
+ | 3.8571 | 162 | 0.124 |
660
+ | 3.9048 | 164 | 0.1555 |
661
+ | 3.9524 | 166 | 0.1215 |
662
+ | 4.0 | 168 | 0.1073 |
663
+ | 4.0476 | 170 | 0.1432 |
664
+ | 4.0952 | 172 | 0.133 |
665
+ | 4.1429 | 174 | 0.1253 |
666
+ | 4.1905 | 176 | 0.1433 |
667
+ | 4.2381 | 178 | 0.1671 |
668
+ | 4.2857 | 180 | 0.0884 |
669
+ | 4.3333 | 182 | 0.1326 |
670
+ | 4.3810 | 184 | 0.1318 |
671
+ | 4.4286 | 186 | 0.1445 |
672
+ | 4.4762 | 188 | 0.1168 |
673
+ | 4.5238 | 190 | 0.1106 |
674
+ | 4.5714 | 192 | 0.1235 |
675
+ | 4.6190 | 194 | 0.1252 |
676
+ | 4.6667 | 196 | 0.1265 |
677
+ | 4.7143 | 198 | 0.1885 |
678
+ | 4.7619 | 200 | 0.1168 |
679
+ | 4.8095 | 202 | 0.1035 |
680
+ | 4.8571 | 204 | 0.1822 |
681
+ | 4.9048 | 206 | 0.1227 |
682
+ | 4.9524 | 208 | 0.1332 |
683
+ | 5.0 | 210 | 0.0698 |
684
+
685
+ </details>
686
+
687
+ ### Framework Versions
688
+ - Python: 3.10.13
689
+ - Sentence Transformers: 3.0.1
690
+ - Transformers: 4.41.2
691
+ - PyTorch: 2.1.2
692
+ - Accelerate: 0.30.1
693
+ - Datasets: 2.19.2
694
+ - Tokenizers: 0.19.1
695
+
696
+ ## Citation
697
+
698
+ ### BibTeX
699
+
700
+ #### Sentence Transformers
701
+ ```bibtex
702
+ @inproceedings{reimers-2019-sentence-bert,
703
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
704
+ author = "Reimers, Nils and Gurevych, Iryna",
705
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
706
+ month = "11",
707
+ year = "2019",
708
+ publisher = "Association for Computational Linguistics",
709
+ url = "https://arxiv.org/abs/1908.10084",
710
+ }
711
+ ```
712
+
713
+ #### CachedMultipleNegativesRankingLoss
714
+ ```bibtex
715
+ @misc{gao2021scaling,
716
+ title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
717
+ author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
718
+ year={2021},
719
+ eprint={2101.06983},
720
+ archivePrefix={arXiv},
721
+ primaryClass={cs.LG}
722
+ }
723
+ ```
724
+
725
+ <!--
726
+ ## Glossary
727
+
728
+ *Clearly define terms in order to be accessible across audiences.*
729
+ -->
730
+
731
+ <!--
732
+ ## Model Card Authors
733
+
734
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
735
+ -->
736
+
737
+ <!--
738
+ ## Model Card Contact
739
+
740
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
741
+ -->
config.json ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "comet24082002/finetune_bge_simsce_V1",
3
+ "architectures": [
4
+ "XLMRobertaModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "bos_token_id": 0,
8
+ "classifier_dropout": null,
9
+ "eos_token_id": 2,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 1024,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 4096,
15
+ "layer_norm_eps": 1e-05,
16
+ "max_position_embeddings": 8194,
17
+ "model_type": "xlm-roberta",
18
+ "num_attention_heads": 16,
19
+ "num_hidden_layers": 24,
20
+ "output_past": true,
21
+ "pad_token_id": 1,
22
+ "position_embedding_type": "absolute",
23
+ "torch_dtype": "float32",
24
+ "transformers_version": "4.41.2",
25
+ "type_vocab_size": 1,
26
+ "use_cache": true,
27
+ "vocab_size": 250002
28
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.0.1",
4
+ "transformers": "4.41.2",
5
+ "pytorch": "2.1.2"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": null
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:698e2a5b1b1300ae8f155f6fe2ef9863349a0a0222099984acab9fe22f9bf2cb
3
+ size 2271064456
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
3
+ size 5069051
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:d9a6af42442a3e3e9f05f618eae0bb2d98ca4f6a6406cb80ef7a4fa865204d61
3
+ size 17083052
tokenizer_config.json ADDED
@@ -0,0 +1,62 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "mask_token": "<mask>",
49
+ "max_length": 512,
50
+ "model_max_length": 512,
51
+ "pad_to_multiple_of": null,
52
+ "pad_token": "<pad>",
53
+ "pad_token_type_id": 0,
54
+ "padding_side": "right",
55
+ "sep_token": "</s>",
56
+ "sp_model_kwargs": {},
57
+ "stride": 0,
58
+ "tokenizer_class": "XLMRobertaTokenizer",
59
+ "truncation_side": "right",
60
+ "truncation_strategy": "longest_first",
61
+ "unk_token": "<unk>"
62
+ }