strongpear commited on
Commit
4989aaa
·
verified ·
1 Parent(s): 5039e65

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 1024,
3
+ "pooling_mode_cls_token": true,
4
+ "pooling_mode_mean_tokens": false,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,653 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:89100
8
+ - loss:MultipleNegativesRankingLoss
9
+ base_model: BAAI/bge-m3
10
+ widget:
11
+ - source_sentence: Cơ chế một cửa tại Ủy ban Nhân dân huyện Phú Vang được thực hiện
12
+ như thế nào?
13
+ sentences:
14
+ - 'Bước 2: UBND cấp xã trong thời hạn 5 ngày có trách nhiệm cấp giấy xác nhận thân
15
+ nhân của người có công theo mẫu số 45 phụ lục I Nghị định số 131/2021/NĐ-CP, Phí,
16
+ lệ phí: Không, Tên VBQPPL quy định TTHC được chuẩn hóa: - Pháp lệnh ưu đãi người
17
+ có công năm 2020; -Nghị định số 131/2021/NĐ-CP ngày 30/12/2021.'
18
+ - "2. Về chủ trương thí điểm cơ chế cảng mở tại cụm cảng Container khu vực Cái Mép:\
19
+ \ \nĐồng ý với kiến nghị của Tỉnh, giao Bộ Tài chính chủ trì, phối hợp với Bộ\
20
+ \ Giao thông vận tải, Bộ Kế hoạch và Đầu tư, Ủy ban nhân dân tỉnh Bà Rịa - Vũng\
21
+ \ Tàu và các cơ quan liên quan nghiên cứu xây dựng cơ chế, chính sách thí điểm\
22
+ \ “cảng mở” tại cụm cảng Container khu vực Cái Mép, trình cấp có thẩm quyền theo\
23
+ \ quy định trong Quý II năm 2022. \n3. Về thành lập Chi cục Kiểm định hải quan\
24
+ \ tại khu vực cảng Cái Mép - Thị Vải: \nGiao Bộ Tài chính chủ trì, phối hợp với\
25
+ \ các cơ quan liên quan và tỉnh Bà Rịa - Vũng Tàu khẩn trương triển khai việc\
26
+ \ thành lập Chi cục Kiểm định hải quan tại khu vực cảng Cái Mép - Thị Vải theo\
27
+ \ thẩm quyền và quy định hiện hành, Ủy ban nhân dân tỉnh Bà Rịa - Vũng Tàu bố\
28
+ \ trí địa điểm làm việc, hoàn thành chậm nhất trong Quý II năm 2022. \n4. Về triển\
29
+ \ khai nhanh dự án đường cao tốc Biên Hòa - Vũng Tàu: \nTrường hợp Chương trình\
30
+ \ phục hồi và phát triển kinh tế được cấp có thẩm quyền thông qua và cân đối được\
31
+ \ nguồn vốn cho Dự án, giao Bộ Kế hoạch và Đầu tư chủ trì, phối hợp với Bộ Tài\
32
+ \ chính, Bộ Giao thông vận tải, Ủy ban nhân dân các tỉnh: Bà Rịa - Vũng Tàu, Đồng\
33
+ \ Nai, báo cáo Thủ tướng Chính phủ theo quy định."
34
+ - "Điều 3. Chánh Văn phòng Uỷ ban Nhân dân tỉnh, Giám đốc Sở Nội vụ, Chủ tịch UBND\
35
+ \ huyện Phú Vang, Thủ trưởng các cơ quan chuyên môn thuộc UBND tỉnh và các tổ\
36
+ \ chức, cá nhân liên quan chịu trách nhiệm thi hành Quyết định này./. \nQUY ĐỊNH\
37
+ \ VIỆC TIẾP NHẬN, GIẢI QUYẾT THỦ TỤC HÀNH CHÍNH THEO CƠ CHẾ MỘT CỬA TẠI ỦY BAN\
38
+ \ NHÂN DÂN HUYỆN PHÚ VANG (Ban hành kèm theo Quyết định số 1063/QĐ-UBND ngày 06\
39
+ \ tháng 5 năm 2008 của Chủ tịch Ủy ban Nhân dân tỉnh) Chương 1: \nĐiều 1. Cơ chế\
40
+ \ một cửa tại Ủy ban Nhân dân huyện Phú Vang Cơ chế một cửa tại Ủy ban Nhân dân\
41
+ \ (UBND) huyện Phú Vang là cơ chế giải quyết công việc của tổ chức, cá nhân thuộc\
42
+ \ trách nhiệm, thẩm quyền của UBND huyện, Chủ tịch UBND huyện Phú Vang; từ hướng\
43
+ \ dẫn - tiếp nhận hồ sơ, thụ lý hồ sơ đến giao trả kết quả được thực hiện tại\
44
+ \ một đầu mối là “Bộ phận tiếp nhận và trả kết quả” (sau đây gọi tắt là Bộ phận\
45
+ \ một cửa) của UBND huyện đặt tại Văn phòng HĐND và UBND huyện, do Chủ tịch UBND\
46
+ \ huyện thành lập. \n1. Công khai thủ tục hành chính; giải quyết nhanh gọn các\
47
+ \ thủ tục hành chính thuộc thẩm quyền giải quyết của UBND huyện và Chủ tịch UBND\
48
+ \ huyện, đáp ứng một cách tốt nhất mọi nhu cầu hợp pháp của tổ chức, cá nhân theo\
49
+ \ đúng quy định của pháp luật; phục vụ công cuộc phát triển kinh tế - xã hội của\
50
+ \ địa phương. \n2. Không ngừng nâng cao chất lượng giải quyết hồ sơ, đảm bảo thời\
51
+ \ hạn giao trả hồ sơ theo quy định; xác định trách nhiệm của công chức trực tiếp\
52
+ \ tham gia giải quyết hồ sơ đảm bảo sự thống nhất đồng bộ từ khâu tiếp nhận đến\
53
+ \ giao trả hồ sơ tại UBND huyện Phú Vang. \nĐiều 3."
54
+ - source_sentence: Trường trung cấp nghề cần tuân theo tiêu chuẩn nào để đảm bảo công
55
+ tác tuyển sinh và đào tạo hiệu quả?
56
+ sentences:
57
+ - "Điều 5. Xếp loại đánh giá Kết quả đánh giá cuối cùng của trường trung cấp nghề\
58
+ \ được xếp theo ba cấp độ sau: \nChương 2. \n1. Tiêu chuẩn 1. Công tác tuyển\
59
+ \ sinh được th���c hiện theo quy chế tuyển sinh của Bộ Lao động – Thương binh và\
60
+ \ Xã hội; đảm bảo chất lượng tuyển sinh. \na) Tuyển sinh theo quy chế tuyển sinh\
61
+ \ của Bộ Lao động – Thương binh và Xã hội. \nb) Hàng năm trường có hướng dẫn riêng\
62
+ \ về công tác tuyển sinh, cụ thể hóa quy định tuyển sinh của Bộ Lao động – Thương\
63
+ \ binh và Xã hội. \nc) Đảm bảo nghiêm túc, công bằng, khách quan trong tuyển sinh.\
64
+ \ \n2. Tiêu chuẩn 2. Thực hiện đa dạng hóa các phương thức tổ chức đào tạo đáp\
65
+ \ ứng yêu cầu học tập của người học, thiết lập được mối liên hệ chặt chẽ với các\
66
+ \ cơ sở sản xuất, kinh doanh, dịch vụ. \na) Đa dạng hóa các phương thức tổ chức\
67
+ \ đào tạo để đáp ứng yêu cầu học tập của người học. \nb) Có sự liên kết chặt chẽ\
68
+ \ với các cơ sở sản xuất, kinh doanh, dịch vụ trong quá trình đào tạo. \nc) Định\
69
+ \ kỳ thu thập ý kiến đánh giá của cán bộ quản lý, giáo viên, người học về chất\
70
+ \ lượng của các phương thức đào tạo so với mục tiêu đã đề ra. \n3. Tiêu chuẩn\
71
+ \ 3. Có kế hoạch đào tạo, giám sát chặt chẽ, bảo đảm thực hiện kế hoạch đào tạo\
72
+ \ đúng tiến độ và có hiệu quả; tổ chức dạy học lý thuyết, thực hành và thực tập\
73
+ \ lao động sản xuất theo nghề đào tạo phù hợp với các yêu cầu của thực tiễn sản\
74
+ \ xuất, kinh doanh, dịch vụ. \na) Có kế hoạch đào tạo cho từng nghề, theo từng\
75
+ \ học kỳ, năm học; có kế hoạch đào tạo chi tiết đến từng mô-đun, môn học, cụ thể\
76
+ \ cho các giờ học lý thuyết, thực hành, thực tập lao động sản xuất. \nb) Tổ chức\
77
+ \ giám sát, đánh giá việc thực hiện kế hoạch đào tạo bảo đảm thực hiện kế hoạch\
78
+ \ đào tạo đúng tiến độ, chất lượng và hiệu quả."
79
+ - "Điều 2. Ủy quyền cho Tổng Cục trưởng Tổng cục Giáo dục nghề nghiệp ban hành quy\
80
+ \ định chi tiết khối lượng kiến thức tối thiểu, yêu cầu về năng lực mà người học\
81
+ \ đạt được sau khi tốt nghiệp trình độ trung cấp, trình độ cao đẳng cho từng vị\
82
+ \ trí việc làm theo từng ngành, nghề đào tạo quy định tại Điều 1 của Thông tư\
83
+ \ này để các trường làm căn cứ tổ chức xây dựng, thẩm định, phê duyệt chương trình,\
84
+ \ giáo trình đào tạo áp dụng cho trường mình. \n4."
85
+ - "Điều 3. Vụ trưởng Vụ Công chức - Viên chức, Chánh Văn phòng Bộ, Thủ trưởng các\
86
+ \ đơn vị thuộc, trực thuộc Bộ, Thủ trưởng các đơn vị có liên quan chịu trách nhiệm\
87
+ \ thi hành Quyết định này. \n- Trong thời hạn 15 ngày kể từ ngày niêm yết công\
88
+ \ khai kết quả xét tuyển, người dự tuyển có quyền gửi đơn đề nghị phúc khảo kết\
89
+ \ quả xét tuyển. Người đứng đầu cơ quan có thẩm quyền tuyển dụng công chức có\
90
+ \ trách nhiệm tổ chức chấm phúc khảo trong thời hạn 15 ngày, kể từ ngày hết thời\
91
+ \ hạn nhận đơn phúc khảo theo quy định (Khoản 2 Điều 17 Nghị định số 24/2010/NĐ-CP);\
92
+ \ - Sau khi thực hiện việc niêm yết công khai kết quả xét tuyển, danh sách dự\
93
+ \ kiến người trúng tuyển và tổ chức chấm phúc khảo, người đứng đầu cơ quan có\
94
+ \ thẩm quyền tuyển dụng công chức báo cáo cơ quan quản lý công chức phê duyệt\
95
+ \ kết quả tuyển dụng công chức (Khoản 3 Điều 17 Nghị định số 24/2010/NĐ-CP); -\
96
+ \ Trong thời hạn 15 ngày, kể từ ngày có quyết định phê duyệt kết quả tuyển dụng\
97
+ \ của cơ quan quản lý công chức, người đứng đầu cơ quan có thẩm quyền tuyển dụng\
98
+ \ công chức phải gửi thông báo công nhận kết quả trúng tuyển bằng văn bản tới\
99
+ \ người dự tuyển theo địa chỉ mà người dự tuyển đã đăng ký (Khoản 1 Điều 9 Thông\
100
+ \ tư số 13/2010/TT-BNV); - Trong thời hạn 30 ngày, kể từ ngày nhận được thông\
101
+ \ báo công nhận kết quả trúng tuyển của cơ quan có thẩm quyền tuyển dụng công\
102
+ \ chức, người trúng tuyển phải đến cơ quan có thẩm quyền tuyển dụng công chức\
103
+ \ để hoàn thiện hồ sơ dự tuyển theo quy định (Khoản 2 Điều 9 Thông tư số 13/2010/TT-BNV);\
104
+ \ - Trường hợp người trúng tuyển có lý do chính đáng mà không thể đến hoàn thiện\
105
+ \ hồ sơ dự tuyển thì phải làm đơn xin gia hạn trước khi kết thúc thời hạn hoàn\
106
+ \ thiện hồ sơ dự tuyển gửi cơ quan có thẩm quyền tuyển dụng công chức."
107
+ - source_sentence: Những yếu tố nào khiến phương tiện vận tải trở thành đối tượng
108
+ kiểm tra thực tế liên quan đến bệnh truyền nhiễm?
109
+ sentences:
110
+ - "Đại diện của các cơ quan, tổ chức được mời dự hợp có quyền phát biểu nhưng không\
111
+ \ tham gia biểu quyết; khi phát hiện nghị quyết, quyết định của Hội đồng quản\
112
+ \ trị có phương hại đến lợi ích chung thì có quyền kiến nghị bằng văn bản đến\
113
+ \ Hội đồng quản trị, đồng thời báo cáo Thủ trưởng cơ quan mà mình đại diện để\
114
+ \ xem xét, giải quyết theo thẩm quyền. Trường hợp cần thiết thì Thủ trưởng các\
115
+ \ cơ quan này báo cáo Thủ tướng Chính phủ; \nđ) Nghị quyết, quyết định của Hội\
116
+ \ đồng quản trị có tính bắt buộc thi hành đối với toàn Tổng công ty. Trong trường\
117
+ \ hợp ý kiến của Tổng giám đốc khác với nghị quyết, quyết định của Hội đồng quản\
118
+ \ trị, Tổng giám đốc có quyền bảo lưu ý kiến và kiến nghị với cơ quan Nhà nước\
119
+ \ có thẩm quyền để xử lý; trong thời gian chưa có quyết định của cơ quan Nhà nước\
120
+ \ có thẩm quyền, Tổng giám đốc vẫn phải chấp hành nghị quyết, quyết định của Hội\
121
+ \ đồng quản trị;"
122
+ - '- Phương tiện vận tải có trung gian truyền bệnh truyền nhiễm, tác nhân gây bệnh
123
+ truyền nhiễm hoặc không bảo đảm điều kiện vệ sinh chung (bao gồm phát hiện chất
124
+ thải, chất tiết, dấu vết của trung gian truyền bệnh; thực phẩm, rác thải sinh
125
+ hoạt không được thu gom, bảo quản, xử lý đúng quy định hoặc các khu vực ăn, ở,
126
+ kho chứa, nhà vệ sinh không được vệ sinh thường xuyên gây tình trạng nấm, mốc,
127
+ mùi hôi thối). 3. Đối tượng kiểm tra thực tế: - Phương tiện vận tải có yếu tố
128
+ nguy cơ: a) Phương tiện vận tải đi qua quốc gia, vùng lãnh thổ có ghi nhận trường
129
+ hợp bệnh truyền nhiễm mà Bộ Y tế có yêu cầu phải giám sát; b) Phương tiện vận
130
+ tải chở người bệnh hoặc người nghi ngờ mắc bệnh hoặc mang tác nhân gây bệnh truyền
131
+ nhiễm; c) Phương tiện vận tải chở hàng hóa mang tác nhân gây bệnh truyền nhiễm
132
+ hoặc nghi ngờ mang tác nhân gây bệnh truyền nhiễm. - Phương tiện vận tải có trung
133
+ gian truyền bệnh truyền nhiễm, tác nhân gây bệnh truyền nhiễm hoặc không bảo đảm
134
+ điều kiện vệ sinh chung (bao gồm phát hiện chất thải, chất tiết, dấu vết của trung
135
+ gian truyền bệnh: thực phẩm, rác thải sinh hoạt không được thu gom, bảo quản,
136
+ xử lý đúng quy định hoặc các khu vực ăn, ở, kho chứa, nhà vệ sinh không được vệ
137
+ sinh thường xuyên gây tình trạng nấm, mốc, mùi hôi thối). - Phương tiện vận tải
138
+ xuất phát hoặc đi qua quốc gia, vùng lãnh thổ ghi nhận có trường hợp mắc bệnh
139
+ truyền nhiễm thuộc nhóm A mà chưa được xử lý y tế; phương tiện vận tải chở người
140
+ nghi ngờ, mắc bệnh truyền nhiễm thuộc nhóm A; phương tiện vận tải chở hàng hóa
141
+ nghi ngờ mang tác nhân gây bệnh truyền nhiễm, trung gian truyền bệnh thuộc nhóm
142
+ A; phương tiện vận tải không có giấy chứng nhận miễn hoặc đã xử lý vệ sinh. 4.'
143
+ - "Dịch vụ kỹ thuật, Số tiền: None, Trong quy định: None, Ngoài quy định: None,\
144
+ \ Ghi chú: None Các DVYT chưa thanh toán: ………………., Số tiền: None, Trong quy định:\
145
+ \ None, Ngoài quy định: None, Ghi chú: None Các DVYT chưa thanh toán: ……………….,\
146
+ \ Số tiền: None, Trong quy định: None, Ngoài quy định: None, Ghi chú: None Các\
147
+ \ DVYT chưa thanh toán: 2. Vật tư y tế thay thế, Số tiền: None, Trong quy định:\
148
+ \ None, Ngoài quy định: None, Ghi chú: None Các DVYT chưa thanh toán: ……………….,\
149
+ \ Số tiền: None, Trong quy định: None, Ngoài quy định: None, Ghi chú: None Các\
150
+ \ DVYT chưa thanh toán: ………………., Số tiền: None, Trong quy định: None, Ngoài quy\
151
+ \ định: None, Ghi chú: None Các DVYT chưa thanh toán: III. Thuốc K, chống thải\
152
+ \ ghép ngoài danh mục, Số tiền: None, Trong quy định: None, Ngoài quy định: None,\
153
+ \ Ghi chú: None Các DVYT chưa thanh toán: IV. Khác (ghi rõ nếu có), Số tiền: None,\
154
+ \ Trong quy định: None, Ngoài quy định: None, Ghi chú: None Lý do chưa được thanh\
155
+ \ toán: \n…………………………………………………………………………… ……………………………………………………………………………………………………………….\
156
+ \ Mẫu số 09/BHYT BẢO HIỂM XÃ HỘI TỈNH………….. BẢO HIỂM XÃ HỘI HUYỆN …………… TỔNG HỢP\
157
+ \ THANH TOÁN TRỰC TIẾP CHI PHÍ KCB BHYT Quý ……/năm…………."
158
+ - source_sentence: Chủ tịch Ủy ban nhân dân thành phố thuộc Thành phố Hồ Chí Minh
159
+ có quyền hạn gì khi vắng mặt?
160
+ sentences:
161
+ - '0, Mức giá: 35.0 TT: 2, KHU VỰC: Đất mặt tiền đoạn từ nhà ông Phạm Ngọc Hoà đến
162
+ UBND xã Sơn Nham, Vị trí: 2.0, Mức giá: 30.0 TT: 3, KHU VỰC: Đất mặt tiền đoạn
163
+ từ UBND xã đến Trường Tiểu học thôn Cận Sơn, Vị trí: 3.0, Mức giá: 25.0 TT: 4,
164
+ KHU VỰC: Đất mặt tiền đoạn từ thôn Cận Sơn đến hết địa phận thôn Cận Sơn, Vị trí:
165
+ 4.0, Mức giá: 15.0 TT: 5, KHU VỰC: Đất ở các vị trí khác còn lại trên địa bàn
166
+ xã, Vị trí: 5.0, Mức giá: 13.0 TT: IV, KHU VỰC: Xã Sơn Cao, Vị trí: None, Mức
167
+ giá: None TT: A, KHU VỰC: Khu vực 1: Không có, Vị trí: None, Mức giá: None TT:
168
+ B, KHU VỰC: Khu vực 2: Không có, Vị trí: None, Mức giá: None TT: C, KHU VỰC: Khu
169
+ vực 3:, Vị trí: None, Mức giá: None TT: 1, KHU VỰC: Đất mặt tiền đường Sơn Cao
170
+ - Sơn Linh đoạn từ UBND xã Sơn Cao đến giáp địa phận xã Sơn Linh, Vị trí: 1.0,
171
+ Mức giá: 35.0 TT: 2, KHU VỰC: Đất mặt tiền đoạn từ UBND xã đến hết nhà bà Nam,
172
+ Vị trí: 2.0, Mức giá: 30.0 TT: 3, KHU VỰC: Đất mặt tiền đoạn từ nhà bà Nam đến
173
+ suối Xà Ây, Vị trí: 3.0, Mức giá: 25.0 TT: 4, KHU VỰC: Đất mặt tiền đoạn từ suối
174
+ Xà Ây đến Trường Mẫu giáo thôn Cà Long, Vị trí: 4.0, Mức giá: 15.0 TT: 5, KHU
175
+ VỰC: Đất mặt tiền đoạn từ ngã 3 đường Sơn Cao - Sơn Linh đi Làng Trá đến cầu Xà
176
+ Ây, Vị trí: 4.0, Mức giá: 15.0 TT: 6, KHU VỰC: Đất ở các vị trí khác còn lại trên
177
+ địa bàn xã, Vị trí: 5.0, Mức giá: 13.0 TT: V, KHU VỰC: Xã Sơn Linh, Vị trí: None,
178
+ Mức giá: None TT: A, KHU VỰC: Khu vực 1: Không có, Vị trí: None, Mức giá: None
179
+ TT: B, KHU VỰC: Khu vực 2:, Vị trí: None, Mức giá: None TT: 1,'
180
+ - 'đường An Trung, đường Vinh Quang, đường Phúc Lâm (đoạn từ đường 389 đến hết chợ
181
+ Kinh Môn) 1- Đường 389 (từ Trường THPT Kinh Môn đến Cầu Bệnh viện): 3- Đường 388
182
+ (đoạn trong phạm vi thị trấn) Nhóm B 1- Đường vành đai khu dân cư phía Nam thị
183
+ trấn Kinh Môn (ven kênh KT12): 2- Đường ngang cắt qua cổng chính của trụ sở UBND
184
+ huyện 1- Đường vành đai khu dân cư phía Nam thị trấn Kinh Môn (ven kênh KT12):
185
+ 3- Đường vành đai khu dân cư phía nam thị trấn Kinh Môn (đoạn từ UBND thị trấn
186
+ Kinh Môn đến hết khu dân cư mới phía Nam thị trấn Kinh Môn) 1- Đường vành đai
187
+ khu dân cư phía Nam thị trấn Kinh Môn (ven kênh KT12): 4- Đường từ phố Vinh Quang
188
+ đến Cầu nối sang đường vành đai trụ sở UBND thị trấn Kinh Môn 1- Đường vành đai
189
+ khu dân cư phía Nam thị trấn Kinh Môn (ven kênh KT12): 5- Đường 389 (đoạn từ cầu
190
+ Bệnh viện đến đường 388) Nhóm C 1- Đường nội thị thuộc khu các cơ quan mới quy
191
+ hoạch của huyện: 2- Đường bê tông Nhà máy nước (đoạn từ đường Phúc Lâm đến hết
192
+ nhà ông Tích).'
193
+ - "Trường hợp cần thiết, Chủ tịch Ủy ban nhân dân thành phố thuộc Thành phố Hồ Chí\
194
+ \ Minh có thể thành lập các tổ chức tư vấn để tham mưu, giúp Chủ tịch giải quyết\
195
+ \ công việc. \n3. Ủy quyền một Phó Chủ tịch Ủy ban nhân dân thành phố thuộc Thành\
196
+ \ phố Hồ Chí Minh thay mặt Chủ tịch điều hành công việc của Ủy ban nhân dân thành\
197
+ \ phố thuộc Thành phố Hồ Chí Minh khi Chủ tịch Ủy ban nhân dân thành phố thuộc\
198
+ \ Thành phố Hồ Chí Minh vắng mặt. \n4. Thay mặt Ủy ban nhân dân thành phố thuộc\
199
+ \ Thành phố Hồ Chí Minh ký quyết định của Ủy ban nhân dân thành phố thuộc Thành\
200
+ \ phố Hồ Chí Minh; ban hành quyết định, chỉ thị và hướng dẫn, kiểm tra việc thi\
201
+ \ hành các văn bản đó ở địa phương."
202
+ - source_sentence: Các hình thức tuyên truyền nào được đề cập trong ngữ cảnh?
203
+ sentences:
204
+ - "a. Nguồn cấp: Nguồn cấp điện trước mắt lấy từ tuyến 35KV Gia Lâm - Phố Nối (2\
205
+ \ lộ 372, 373). Sau khi trạm biến áp chung của khu vực 110/2KV Trâu Quỳ và mạng\
206
+ \ 22KV được xây dựng theo quy hoạch, nguồn cấp điện cho khu đô thị sẽ được điều\
207
+ \ chỉnh phù hợp. \nb. Mạng trung thế: Xây dựng tuyến cáp trục 35KV: XLPE - 120mm2\
208
+ \ (điểm đấu trực tiếp từ tuyến ĐDK - 35KV Gia Lâm - Phố Nối) để cấp điện cho 09\
209
+ \ trạm biến áp 35/0,4KV xây dựng mới trong khu đô thị, cần có sự thoả thuận với\
210
+ \ Công ty Điện lực Hà Nội. \nc. Mạng hạ thế 0,4KV phục vụ sinh hoạt và chiếu sáng\
211
+ \ đèn đường: \n- Xây dựng mạng cáp ngầm 0,4KV trên hè các tuyến đường trong khu\
212
+ \ đô thị mới để cấp điện phục vụ sinh hoạt và chiếu sáng đèn đường. - Vị trí mạng\
213
+ \ cáp ngầm và cột chiếu sáng đèn đường tuân thủ các quy định hiện hành. \na. Nguồn\
214
+ \ cấp: Các hộ thuê bao được lấy nguồn từ tổng đài vệ tinh Trâu Quỳ - 6000 số (tại\
215
+ \ thị trấn Trâu Quỳ) thông qua mạng cáp quang hiện có dọc Quốc lộ 5 (điểm đấu\
216
+ \ cụ thể cần có sự thoả thuận của các cơ quan quản lý chuyên ngành). \nb. Mạng\
217
+ \ cáp: Xây dựng mạng cáp gốc và mạng cáp thuê bao ngầm dọc theo các tuyến đường\
218
+ \ theo Tiêu chuẩn, Quy chuẩn Xây dựng. \na. Thoát nước bẩn: \n- Xây dựng mạng\
219
+ \ lưới cống thoát nước thải riêng cho khu đô thị có tiết diện D300 - 400mm dọc\
220
+ \ theo các tuyến đường của khu đô thị mới."
221
+ - 'Kịch nói, văn nghệ quần chúng: None, Kịch nói, văn nghệ quần chúng.1: None, Kịch
222
+ nói, văn nghệ quần chúng.2: None, Kịch nói, văn nghệ quần chúng.3: None, Chiếu
223
+ phim lưu động: None, Chiếu phim lưu động.1: None, Chiếu phim lưu động.2: None,
224
+ Chiếu phim lưu động.3: None, Gương điển hình: None, Gương điển hình.1: None, Gương
225
+ điển hình.2: None, Gương điển hình.3: None, Tuyên truyền miệng (thông qua họp
226
+ chợ, họp thôn, chi bộ, hội nghị.): None, Tuyên truyền miệng (thông qua họp chợ,
227
+ họp thôn, chi bộ, hội nghị.).1: None, Tuyên truyền miệng (thông qua họp chợ, họp
228
+ thôn, chi bộ, hội nghị.).2: None, Tuyên truyền miệng (thông qua họp chợ, họp thôn,
229
+ chi bộ, hội nghị.).3: None, Tổ chức ra quân: None, Tổ chức ra quân.1: None, Tổ
230
+ chức ra quân.2: None, Tổ chức ra quân.3: None TT: . Địa điểm thực hiện: . Kịch
231
+ nói, văn nghệ quần chúng: None, Kịch nói, văn nghệ quần chúng.1: None, Kịch nói,
232
+ văn nghệ quần chúng.2: None, Kịch nói, văn nghệ quần chúng.3: None, Chiếu phim
233
+ lưu động: None, Chiếu phim lưu động.1: None, Chiếu phim lưu động.2: None, Chiếu
234
+ phim lưu động.3: None, Gương điển hình: None, Gương điển hình.1: None, Gương điển
235
+ hình.2: None, Gương điển hình.3: None, Tuyên truyền miệng (thông qua họp chợ,
236
+ họp thôn, chi bộ, hội nghị.): None, Tuyên truyền miệng (thông qua họp chợ, họp
237
+ thôn, chi bộ, hội nghị.).1: None, Tuyên truyền miệng (thông qua họp chợ, họp thôn,
238
+ chi bộ, hội nghị.).2: None, Tuyên truyền miệng (thông qua họp chợ, họp thôn, chi
239
+ bộ, hội nghị.).3: None, Tổ chức ra quân: None, Tổ chức ra quân.1: None, Tổ chức
240
+ ra quân.2: None, Tổ chức ra quân.3: None TT: TỔNG CỘNG, Địa điểm thực hiện: TỔNG
241
+ CỘNG, Kịch nói, văn nghệ quần chúng: -, Kịch nói, văn nghệ quần chúng.1: -, Kịch
242
+ nói,'
243
+ - '0, Tên cơ sở: Nhà máy chế biến thủy sản của Công ty CP thực phẩm Sao Ta, Địa
244
+ chỉ: Km2132, Quốc lộ 1A, phường 2, thành phố Sóc Trăng, tỉnh Sóc Trăng, Nội dung:
245
+ Kiểm tra tiến độ xử lý ô nhiễm triệt để và việc chấp hành các quy định về bảo
246
+ vệ môi trường đối với cơ sở gây ô nhiễm môi trường nghiêm trọng mới phát sinh
247
+ phải xử lý trong giai đoạn 2 của Quyết định số 64/2003/QĐ-TTg của Nhà máy chế
248
+ biến thủy sản của Công ty CP thực phẩm Sao Ta, Địa điểm, thành phần làm việc với
249
+ Đoàn kiểm tra: - Trụ sở Nhà máy chế biến thủy sản của Công ty CP thực phẩm Sao
250
+ Ta; - Đại diện lãnh đạo và cán bộ phụ trách môi trường của Nhà máy chế biến thủy
251
+ sản của Công ty CP thực phẩm Sao Ta; Thời gian công bố Quyết định: 08h00 ngày
252
+ 20/07/2011 Stt: 5.0, Tên cơ sở: Nhà máy thu mua - chế biến thủy sản Thanh Khiết
253
+ (Công ty TNHH Thanh Khiết), Địa chỉ: Thị trấn Vĩnh Châu, huyện Vĩnh Châu, tỉnh
254
+ Sóc Trăng, Nội dung: Kiểm tra tiến độ xử lý ô nhiễm triệt để và việc chấp hành
255
+ các quy định về bảo vệ môi trường đối với cơ sở gây ô nhiễm môi trường nghiêm
256
+ trọng mới phát sinh phải xử lý trong giai đoạn 2 của Quyết định số 64/2003/QĐ-TTg
257
+ của Nhà máy thu mua - chế biến thủy sản Thanh Khiết, Địa điểm, thành phần làm
258
+ việc với Đoàn kiểm tra: - Trụ sở Nhà máy thu mua - chế biến thủy sản Thanh Khiết;
259
+ - Đại diện lãnh đạo và cán bộ phụ trách môi trường của Nhà máy thu mua - chế biến
260
+ thủy sản Thanh Khiết; Thời gian công bố Quyết định: 14h00 ngày 20/07/2011 Stt:
261
+ 6.0, Tên cơ sở: Xưởng sản xuất của Công ty TNHH Phương Nam, Địa chỉ: Quốc lộ 1,
262
+ phường 7, thành phố Sóc Trăng, tỉnh Sóc Trăng,'
263
+ pipeline_tag: sentence-similarity
264
+ library_name: sentence-transformers
265
+ ---
266
+
267
+ # SentenceTransformer based on BAAI/bge-m3
268
+
269
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
270
+
271
+ ## Model Details
272
+
273
+ ### Model Description
274
+ - **Model Type:** Sentence Transformer
275
+ - **Base model:** [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3) <!-- at revision 5617a9f61b028005a4858fdac845db406aefb181 -->
276
+ - **Maximum Sequence Length:** 8192 tokens
277
+ - **Output Dimensionality:** 1024 dimensions
278
+ - **Similarity Function:** Cosine Similarity
279
+ <!-- - **Training Dataset:** Unknown -->
280
+ <!-- - **Language:** Unknown -->
281
+ <!-- - **License:** Unknown -->
282
+
283
+ ### Model Sources
284
+
285
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
286
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
287
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
288
+
289
+ ### Full Model Architecture
290
+
291
+ ```
292
+ SentenceTransformer(
293
+ (0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
294
+ (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
295
+ (2): Normalize()
296
+ )
297
+ ```
298
+
299
+ ## Usage
300
+
301
+ ### Direct Usage (Sentence Transformers)
302
+
303
+ First install the Sentence Transformers library:
304
+
305
+ ```bash
306
+ pip install -U sentence-transformers
307
+ ```
308
+
309
+ Then you can load this model and run inference.
310
+ ```python
311
+ from sentence_transformers import SentenceTransformer
312
+
313
+ # Download from the 🤗 Hub
314
+ model = SentenceTransformer("strongpear/M3-retriever-LAW")
315
+ # Run inference
316
+ sentences = [
317
+ 'Các hình thức tuyên truyền nào được đề cập trong ngữ cảnh?',
318
+ 'Kịch nói, văn nghệ quần chúng: None, Kịch nói, văn nghệ quần chúng.1: None, Kịch nói, văn nghệ quần chúng.2: None, Kịch nói, văn nghệ quần chúng.3: None, Chiếu phim lưu động: None, Chiếu phim lưu động.1: None, Chiếu phim lưu động.2: None, Chiếu phim lưu động.3: None, Gương điển hình: None, Gương điển hình.1: None, Gương điển hình.2: None, Gương điển hình.3: None, Tuyên truyền miệng (thông qua họp chợ, họp thôn, chi bộ, hội nghị.): None, Tuyên truyền miệng (thông qua họp chợ, họp thôn, chi bộ, hội nghị.).1: None, Tuyên truyền miệng (thông qua họp chợ, họp thôn, chi bộ, hội nghị.).2: None, Tuyên truyền miệng (thông qua họp chợ, họp thôn, chi bộ, hội nghị.).3: None, Tổ chức ra quân: None, Tổ chức ra quân.1: None, Tổ chức ra quân.2: None, Tổ chức ra quân.3: None TT: . Địa điểm thực hiện: . Kịch nói, văn nghệ quần chúng: None, Kịch nói, văn nghệ quần chúng.1: None, Kịch nói, văn nghệ quần chúng.2: None, Kịch nói, văn nghệ quần chúng.3: None, Chiếu phim lưu động: None, Chiếu phim lưu động.1: None, Chiếu phim lưu động.2: None, Chiếu phim lưu động.3: None, Gương điển hình: None, Gương điển hình.1: None, Gương điển hình.2: None, Gương điển hình.3: None, Tuyên truyền miệng (thông qua họp chợ, họp thôn, chi bộ, hội nghị.): None, Tuyên truyền miệng (thông qua họp chợ, họp thôn, chi bộ, hội nghị.).1: None, Tuyên truyền miệng (thông qua họp chợ, họp thôn, chi bộ, hội nghị.).2: None, Tuyên truyền miệng (thông qua họp chợ, họp thôn, chi bộ, hội nghị.).3: None, Tổ chức ra quân: None, Tổ chức ra quân.1: None, Tổ chức ra quân.2: None, Tổ chức ra quân.3: None TT: TỔNG CỘNG, Địa điểm thực hiện: TỔNG CỘNG, Kịch nói, văn nghệ quần chúng: -, Kịch nói, văn nghệ quần chúng.1: -, Kịch nói,',
319
+ '0, Tên cơ sở: Nhà máy chế biến thủy sản của Công ty CP thực phẩm Sao Ta, Địa chỉ: Km2132, Quốc lộ 1A, phường 2, thành phố Sóc Trăng, tỉnh Sóc Trăng, Nội dung: Kiểm tra tiến độ xử lý ô nhiễm triệt để và việc chấp hành các quy định về bảo vệ môi trường đối với cơ sở gây ô nhiễm môi trường nghiêm trọng mới phát sinh phải xử lý trong giai đoạn 2 của Quyết định số 64/2003/QĐ-TTg của Nhà máy chế biến thủy sản của Công ty CP thực phẩm Sao Ta, Địa điểm, thành phần làm việc với Đoàn kiểm tra: - Trụ sở Nhà máy chế biến thủy sản của Công ty CP thực phẩm Sao Ta; - Đại diện lãnh đạo và cán bộ phụ trách môi trường của Nhà máy chế biến thủy sản của Công ty CP thực phẩm Sao Ta; Thời gian công bố Quyết định: 08h00 ngày 20/07/2011 Stt: 5.0, Tên cơ sở: Nhà máy thu mua - chế biến thủy sản Thanh Khiết (Công ty TNHH Thanh Khiết), Địa chỉ: Thị trấn Vĩnh Châu, huyện Vĩnh Châu, tỉnh Sóc Trăng, Nội dung: Kiểm tra tiến độ xử lý ô nhiễm triệt để và việc chấp hành các quy định về bảo vệ môi trường đối với cơ sở gây ô nhiễm môi trường nghiêm trọng mới phát sinh phải xử lý trong giai đoạn 2 của Quyết định số 64/2003/QĐ-TTg của Nhà máy thu mua - chế biến thủy sản Thanh Khiết, Địa điểm, thành phần làm việc với Đoàn kiểm tra: - Trụ sở Nhà máy thu mua - chế biến thủy sản Thanh Khiết; - Đại diện lãnh đạo và cán bộ phụ trách môi trường của Nhà máy thu mua - chế biến thủy sản Thanh Khiết; Thời gian công bố Quyết định: 14h00 ngày 20/07/2011 Stt: 6.0, Tên cơ sở: Xưởng sản xuất của Công ty TNHH Phương Nam, Địa chỉ: Quốc lộ 1, phường 7, thành phố Sóc Trăng, tỉnh Sóc Trăng,',
320
+ ]
321
+ embeddings = model.encode(sentences)
322
+ print(embeddings.shape)
323
+ # [3, 1024]
324
+
325
+ # Get the similarity scores for the embeddings
326
+ similarities = model.similarity(embeddings, embeddings)
327
+ print(similarities.shape)
328
+ # [3, 3]
329
+ ```
330
+
331
+ <!--
332
+ ### Direct Usage (Transformers)
333
+
334
+ <details><summary>Click to see the direct usage in Transformers</summary>
335
+
336
+ </details>
337
+ -->
338
+
339
+ <!--
340
+ ### Downstream Usage (Sentence Transformers)
341
+
342
+ You can finetune this model on your own dataset.
343
+
344
+ <details><summary>Click to expand</summary>
345
+
346
+ </details>
347
+ -->
348
+
349
+ <!--
350
+ ### Out-of-Scope Use
351
+
352
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
353
+ -->
354
+
355
+ <!--
356
+ ## Bias, Risks and Limitations
357
+
358
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
359
+ -->
360
+
361
+ <!--
362
+ ### Recommendations
363
+
364
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
365
+ -->
366
+
367
+ ## Training Details
368
+
369
+ ### Training Dataset
370
+
371
+ #### Unnamed Dataset
372
+
373
+
374
+ * Size: 89,100 training samples
375
+ * Columns: <code>anchor</code> and <code>positive</code>
376
+ * Approximate statistics based on the first 1000 samples:
377
+ | | anchor | positive |
378
+ |:--------|:-----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
379
+ | type | string | string |
380
+ | details | <ul><li>min: 13 tokens</li><li>mean: 25.91 tokens</li><li>max: 60 tokens</li></ul> | <ul><li>min: 31 tokens</li><li>mean: 400.4 tokens</li><li>max: 896 tokens</li></ul> |
381
+ * Samples:
382
+ | anchor | positive |
383
+ |:-------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
384
+ | <code>Các công việc đo vẽ bản đồ tỷ lệ 1/200 có đường đồng mức 0,5m và 1m địa hình I, II, III, IV, V có mã đơn giá nào?</code> | <code>đ­ường đồng mức 0,5m địa hình II, Đơn vị: Ha, Vật liệu: 64.301, VÙNG III: 3.218.736, VÙNG III.1: 241.655, VÙNG IV: 3.048.518, VÙNG IV.1: 241.655 Mã đơn giá: CK.11130, Công việc: Đo vẽ bản đồ tỷ lệ 1/200, đ­ường đồng mức 0,5m địa hình III, Đơn vị: Ha, Vật liệu: 81.295, VÙNG III: 4.403.904, VÙNG III.1: 370.187, VÙNG IV: 4.171.010, VÙNG IV.1: 370.187 Mã đơn giá: CK.11140, Công việc: Đo vẽ bản đồ tỷ lệ 1/200, đư­ờng đồng mức 0,5m địa hình IV, Đơn vị: Ha, Vật liệu: 81.295, VÙNG III: 5.875.488, VÙNG III.1: 451.529, VÙNG IV: 5.564.771, VÙNG IV.1: 451.529 Mã đơn giá: CK.11150, Công việc: Đo vẽ bản đồ tỷ lệ 1/200, đ­ường đồng mức 0,5m địa hình V, Đơn vị: Ha, Vật liệu: 98.288, VÙNG III: 8.207.280, VÙNG III.1: 640.465, VÙNG IV: 7.773.250, VÙNG IV.1: 640.465 Mã đơn giá: CK.11200, Công việc: Đo vẽ bản đồ tỷ lệ 1/200, đư­ờng đồng mức 1 m, Đơn vị: None, Vật liệu: None, VÙNG III: None, VÙNG III.1: None, VÙNG IV: None, VÙNG IV.1: None Mã đơn giá: CK.11210, Công việc: Đo vẽ bản đồ tỷ lệ 1/200, đ­ường đồ...</code> |
385
+ | <code>Sở Y tế có những nhiệm vụ gì để nâng cao chất lượng dịch vụ chăm sóc sức khỏe cho người dân?</code> | <code>Sở Y tế phối hợp cùng các sở, ngành có liên quan: - Củng cố mạng lưới y tế cơ sở, phát triển sự nghiệp y tế, nâng cao chất lượng các dịch vụ chăm sóc sức khỏe; đảm bảo cho mọi người dân đều dễ dàng được tiếp cận các dịch vụ y tế, đặc biệt là ở vùng sâu, vùng xa, vùng khó khăn và người nghèo, tạo sự công bằng trong khám chữa bệnh. - Bảo hiểm xã hội tỉnh, Sở Lao động, Thương binh và Xã hội, UBND các huyện, thành phố triển khai thực hiện tốt chính sách BHYT cho người nghèo, người khó khăn và các đối tượng chính sách được hưởng các dịch vụ y tế. - Từng bước khắc phục tình trạng quá tải bệnh viện tuyến tỉnh; chủ động áp dụng chế độ luân phiên cán bộ y tế xuống tuyến dưới, nâng cao chất lượng khám chữa bệnh. Quản lý chặt chẽ chất lượng và chấp hành pháp luật trong khám chữa bệnh, thị trường thuốc chữa bệnh, nâng cao y đức trong khám chữa bệnh, đa dạng hóa các loại hình dịch vụ y tế kỹ thuật cao; huy động các nguồn lực để đầu tư xây dựng hệ thống các bệnh viện, phòng khám đa khoa khu vực, mua...</code> |
386
+ | <code>Sở Văn hóa, Thể thao và Du lịch có những nhiệm vụ gì trong việc quản lý băng đĩa và trò chơi trên địa bàn tỉnh?</code> | <code>Sở Văn hóa, Thể thao và Du lịch. <br>a) Chủ trì, phối hợp với Chi cục Quản lý thị trường tỉnh, Công an tỉnh, UBND cấp huyện tăng cường công tác thanh tra, kiểm tra, xử lý băng đĩa, trò chơi nhập lậu, các băng đĩa trò chơi có nội dung bạo lực, đồi trụy, xuyên tạc lịch sử và chống phá Đảng, Nhà nước Cộng hòa XHCN Việt Nam. <br>b) Đẩy mạnh công tác tuyên truyền về phong trào xây dựng nếp sống văn hóa trên địa bàn tỉnh, về xây dựng gia đình văn hóa, làng bản văn hóa, cơ quan, trường học văn hóa. <br>6. Chi cục Quản lý thị trường tỉnh. <br>Tăng cường công tác kiểm tra, phát hiện và xử lý nghiêm các đĩa trò chơi nhập lậu trên thị trường. <br>a) Chỉ đạo các cơ sở Đoàn tuyên truyền, vận động và hướng dẫn đoàn viên, thanh, thiếu niên chấp hành nghiêm chỉnh các quy định của pháp luật về quản lý, cung cấp, sử dụng dịch vụ Internet. <br>b) Phối hợp với Sở Giáo dục và Đào tạo, các đơn vị liên quan tổ chức các hoạt động tuyên truyền, hướng dẫn thanh, thiếu niên, học sinh, sinh viên khi sử dụng Internet và trò chơi tr...</code> |
387
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
388
+ ```json
389
+ {
390
+ "scale": 20.0,
391
+ "similarity_fct": "cos_sim"
392
+ }
393
+ ```
394
+
395
+ ### Evaluation Dataset
396
+
397
+ #### Unnamed Dataset
398
+
399
+
400
+ * Size: 900 evaluation samples
401
+ * Columns: <code>anchor</code> and <code>positive</code>
402
+ * Approximate statistics based on the first 900 samples:
403
+ | | anchor | positive |
404
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
405
+ | type | string | string |
406
+ | details | <ul><li>min: 13 tokens</li><li>mean: 26.0 tokens</li><li>max: 62 tokens</li></ul> | <ul><li>min: 29 tokens</li><li>mean: 399.12 tokens</li><li>max: 772 tokens</li></ul> |
407
+ * Samples:
408
+ | anchor | positive |
409
+ |:--------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
410
+ | <code>Chủ tịch UBND các huyện, thị xã, thành phố có trách nhiệm gì trong việc quản lý phân bón?</code> | <code>e) Định kỳ 06 (sáu) tháng, hàng năm Chủ tịch UBND các huyện, thị xã, thành phố có trách nhiệm báo cáo công tác quản lý nhà nước đối với các hoạt động quản lý phân bón trên địa bàn, đồng thời kiến nghị biện pháp, giải pháp nhằm nâng cao chất lượng, hiệu quả quản lý nhà nước đối với việc quản lý phân bón về Sở Nông nghiệp và Phát triển nông thôn để tổng hợp, báo cáo UBND tỉnh. <br>a) Duy trì đầy đủ các điều kiện và trách nhiệm trong sản xuất, buôn bán phân bón quy định tại Điều 41, Điều 42 Luật Trồng trọt; Nghị định số 84/2019/NĐ-CP ngày 14/11/2019 của Chính phủ Quy định về quản lý phân bón. <br>b) Sản xuất, buôn bán phân bón đúng quy chuẩn kỹ thuật quốc gia và tiêu chuẩn công bố áp dụng. <br>c) Thu hồi, xử lý phân bón không bảo đảm chất lượng và bồi thường thiệt hại theo quy định của pháp luật. <br>d) Chấp hành nghiêm việc thanh tra, kiểm tra và xử lý của cơ quan nhà nước có thẩm quyền. <br>e) Chấp hành nghiêm các quy định của pháp luật về: phòng cháy và chữa cháy, hóa chất, lao động, môi trường và qu...</code> |
411
+ | <code>Trung tâm và Chi nhánh cần tăng cường đầu tư kinh phí từ đâu để đáp ứng yêu cầu nhiệm vụ?</code> | <code>- Tăng cường đầu tư kinh phí từ nguồn ngân sách Nhà nước và từ các chương trình mục tiêu quốc gia, từ các nguồn hỗ trợ, đáp ứng yêu cầu nhiệm vụ của Trung tâm và Chi nhánh. <br>2. Định hướng đến năm 2015:</code> |
412
+ | <code>Công tác lập hồ sơ hiện hành và giao nộp hồ sơ vào lưu trữ cơ quan đã có những chuyển biến gì trong thời gian qua?</code> | <code>Phần I. <br>a) Lập hồ sơ hiện hành, thu thập, bổ sung tài liệu vào lưu trữ cơ quan Công tác lập hồ sơ hiện hành và giao nộp hồ sơ, tài liệu vào lưu trữ cơ quan của các Bộ, ngành trung ương đã có những chuyển biến tích cực. Nhiều cơ quan đã tổ chức thực hiện khá tốt chế độ lập hồ sơ hiện hành và giao nộp hồ sơ, tài liệu vào lưu trữ cơ quan như: Văn phòng Chính phủ, Văn phòng Quốc hội, Văn phòng Chủ tịch nước, Tập đoàn Bưu chính Viễn thông Việt Nam, Bộ Kế hoạch và Đầu tư, Kiểm toán Nhà nước…Kết quả tài liệu thu vào lưu trữ cơ quan không chỉ tăng về khối lượng mà còn được cải thiện đáng kể về chất lượng. <br>Những cơ quan, tổ chức có thành tích nổi bật trong việc thu tài liệu vào lưu trữ cơ quan 7 năm qua là: Bộ Quốc phòng (2.915m), Tập đoàn Dầu khí Việt Nam (1.800m), Thông tấn xã Việt Nam (860m), Viện Kiểm sát nhân dân tối cao (49.000 hồ sơ), Văn phòng Chính phủ (9.626 cặp)… Riêng năm 2007, Tập đoàn Dầu khí Việt Nam thu được 850 m, Văn phòng Chính phủ 3.372 hồ sơ, Bộ Công an 162 m và 71 cuộn ...</code> |
413
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
414
+ ```json
415
+ {
416
+ "scale": 20.0,
417
+ "similarity_fct": "cos_sim"
418
+ }
419
+ ```
420
+
421
+ ### Training Hyperparameters
422
+ #### Non-Default Hyperparameters
423
+
424
+ - `eval_strategy`: steps
425
+ - `per_device_train_batch_size`: 32
426
+ - `per_device_eval_batch_size`: 32
427
+ - `warmup_ratio`: 0.1
428
+ - `load_best_model_at_end`: True
429
+ - `batch_sampler`: no_duplicates
430
+
431
+ #### All Hyperparameters
432
+ <details><summary>Click to expand</summary>
433
+
434
+ - `overwrite_output_dir`: False
435
+ - `do_predict`: False
436
+ - `eval_strategy`: steps
437
+ - `prediction_loss_only`: True
438
+ - `per_device_train_batch_size`: 32
439
+ - `per_device_eval_batch_size`: 32
440
+ - `per_gpu_train_batch_size`: None
441
+ - `per_gpu_eval_batch_size`: None
442
+ - `gradient_accumulation_steps`: 1
443
+ - `eval_accumulation_steps`: None
444
+ - `torch_empty_cache_steps`: None
445
+ - `learning_rate`: 5e-05
446
+ - `weight_decay`: 0.0
447
+ - `adam_beta1`: 0.9
448
+ - `adam_beta2`: 0.999
449
+ - `adam_epsilon`: 1e-08
450
+ - `max_grad_norm`: 1.0
451
+ - `num_train_epochs`: 3
452
+ - `max_steps`: -1
453
+ - `lr_scheduler_type`: linear
454
+ - `lr_scheduler_kwargs`: {}
455
+ - `warmup_ratio`: 0.1
456
+ - `warmup_steps`: 0
457
+ - `log_level`: passive
458
+ - `log_level_replica`: warning
459
+ - `log_on_each_node`: True
460
+ - `logging_nan_inf_filter`: True
461
+ - `save_safetensors`: True
462
+ - `save_on_each_node`: False
463
+ - `save_only_model`: False
464
+ - `restore_callback_states_from_checkpoint`: False
465
+ - `no_cuda`: False
466
+ - `use_cpu`: False
467
+ - `use_mps_device`: False
468
+ - `seed`: 42
469
+ - `data_seed`: None
470
+ - `jit_mode_eval`: False
471
+ - `use_ipex`: False
472
+ - `bf16`: False
473
+ - `fp16`: False
474
+ - `fp16_opt_level`: O1
475
+ - `half_precision_backend`: auto
476
+ - `bf16_full_eval`: False
477
+ - `fp16_full_eval`: False
478
+ - `tf32`: None
479
+ - `local_rank`: 0
480
+ - `ddp_backend`: None
481
+ - `tpu_num_cores`: None
482
+ - `tpu_metrics_debug`: False
483
+ - `debug`: []
484
+ - `dataloader_drop_last`: False
485
+ - `dataloader_num_workers`: 0
486
+ - `dataloader_prefetch_factor`: None
487
+ - `past_index`: -1
488
+ - `disable_tqdm`: False
489
+ - `remove_unused_columns`: True
490
+ - `label_names`: None
491
+ - `load_best_model_at_end`: True
492
+ - `ignore_data_skip`: False
493
+ - `fsdp`: []
494
+ - `fsdp_min_num_params`: 0
495
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
496
+ - `fsdp_transformer_layer_cls_to_wrap`: None
497
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
498
+ - `deepspeed`: None
499
+ - `label_smoothing_factor`: 0.0
500
+ - `optim`: adamw_torch
501
+ - `optim_args`: None
502
+ - `adafactor`: False
503
+ - `group_by_length`: False
504
+ - `length_column_name`: length
505
+ - `ddp_find_unused_parameters`: None
506
+ - `ddp_bucket_cap_mb`: None
507
+ - `ddp_broadcast_buffers`: False
508
+ - `dataloader_pin_memory`: True
509
+ - `dataloader_persistent_workers`: False
510
+ - `skip_memory_metrics`: True
511
+ - `use_legacy_prediction_loop`: False
512
+ - `push_to_hub`: False
513
+ - `resume_from_checkpoint`: None
514
+ - `hub_model_id`: None
515
+ - `hub_strategy`: every_save
516
+ - `hub_private_repo`: None
517
+ - `hub_always_push`: False
518
+ - `gradient_checkpointing`: False
519
+ - `gradient_checkpointing_kwargs`: None
520
+ - `include_inputs_for_metrics`: False
521
+ - `include_for_metrics`: []
522
+ - `eval_do_concat_batches`: True
523
+ - `fp16_backend`: auto
524
+ - `push_to_hub_model_id`: None
525
+ - `push_to_hub_organization`: None
526
+ - `mp_parameters`:
527
+ - `auto_find_batch_size`: False
528
+ - `full_determinism`: False
529
+ - `torchdynamo`: None
530
+ - `ray_scope`: last
531
+ - `ddp_timeout`: 1800
532
+ - `torch_compile`: False
533
+ - `torch_compile_backend`: None
534
+ - `torch_compile_mode`: None
535
+ - `dispatch_batches`: None
536
+ - `split_batches`: None
537
+ - `include_tokens_per_second`: False
538
+ - `include_num_input_tokens_seen`: False
539
+ - `neftune_noise_alpha`: None
540
+ - `optim_target_modules`: None
541
+ - `batch_eval_metrics`: False
542
+ - `eval_on_start`: False
543
+ - `use_liger_kernel`: False
544
+ - `eval_use_gather_object`: False
545
+ - `average_tokens_across_devices`: False
546
+ - `prompts`: None
547
+ - `batch_sampler`: no_duplicates
548
+ - `multi_dataset_batch_sampler`: proportional
549
+
550
+ </details>
551
+
552
+ ### Training Logs
553
+ | Epoch | Step | Training Loss | Validation Loss |
554
+ |:----------:|:-------:|:-------------:|:---------------:|
555
+ | 0.0718 | 200 | 0.0673 | 0.0142 |
556
+ | **0.1436** | **400** | **0.0245** | **0.0125** |
557
+ | 0.2154 | 600 | 0.03 | 0.0157 |
558
+ | 0.2873 | 800 | 0.033 | 0.0295 |
559
+ | 0.3591 | 1000 | 0.0374 | 0.0214 |
560
+ | 0.4309 | 1200 | 0.0304 | 0.0308 |
561
+ | 0.5027 | 1400 | 0.0324 | 0.0147 |
562
+ | 0.5745 | 1600 | 0.0326 | 0.0277 |
563
+ | 0.6463 | 1800 | 0.0317 | 0.0223 |
564
+ | 0.7181 | 2000 | 0.0323 | 0.0218 |
565
+ | 0.7899 | 2200 | 0.029 | 0.0240 |
566
+ | 0.8618 | 2400 | 0.0271 | 0.0205 |
567
+ | 0.9336 | 2600 | 0.0227 | 0.0175 |
568
+ | 1.0054 | 2800 | 0.0291 | 0.0212 |
569
+ | 1.0772 | 3000 | 0.0196 | 0.0273 |
570
+ | 1.1490 | 3200 | 0.014 | 0.0202 |
571
+ | 1.2208 | 3400 | 0.012 | 0.0193 |
572
+ | 1.2926 | 3600 | 0.0093 | 0.0230 |
573
+ | 1.3645 | 3800 | 0.0109 | 0.0153 |
574
+ | 1.4363 | 4000 | 0.0061 | 0.0227 |
575
+ | 1.5081 | 4200 | 0.0075 | 0.0246 |
576
+ | 1.5799 | 4400 | 0.0067 | 0.0212 |
577
+ | 1.6517 | 4600 | 0.0103 | 0.0180 |
578
+ | 1.7235 | 4800 | 0.0095 | 0.0170 |
579
+ | 1.7953 | 5000 | 0.0075 | 0.0177 |
580
+ | 1.8671 | 5200 | 0.0071 | 0.0176 |
581
+ | 1.9390 | 5400 | 0.0059 | 0.0166 |
582
+ | 2.0108 | 5600 | 0.0069 | 0.0151 |
583
+ | 2.0826 | 5800 | 0.0052 | 0.0162 |
584
+ | 2.1544 | 6000 | 0.0043 | 0.0153 |
585
+ | 2.2262 | 6200 | 0.0044 | 0.0170 |
586
+ | 2.2980 | 6400 | 0.0025 | 0.0173 |
587
+ | 2.3698 | 6600 | 0.0028 | 0.0154 |
588
+ | 2.4417 | 6800 | 0.0017 | 0.0150 |
589
+ | 2.5135 | 7000 | 0.0025 | 0.0166 |
590
+ | 2.5853 | 7200 | 0.0028 | 0.0150 |
591
+ | 2.6571 | 7400 | 0.0022 | 0.0129 |
592
+ | 2.7289 | 7600 | 0.0035 | 0.0136 |
593
+ | 2.8007 | 7800 | 0.0022 | 0.0129 |
594
+ | 2.8725 | 8000 | 0.0021 | 0.0132 |
595
+ | 2.9443 | 8200 | 0.0026 | 0.0135 |
596
+
597
+ * The bold row denotes the saved checkpoint.
598
+
599
+ ### Framework Versions
600
+ - Python: 3.11.10
601
+ - Sentence Transformers: 3.3.1
602
+ - Transformers: 4.47.0
603
+ - PyTorch: 2.5.1+cu124
604
+ - Accelerate: 1.2.1
605
+ - Datasets: 3.0.0
606
+ - Tokenizers: 0.21.0
607
+
608
+ ## Citation
609
+
610
+ ### BibTeX
611
+
612
+ #### Sentence Transformers
613
+ ```bibtex
614
+ @inproceedings{reimers-2019-sentence-bert,
615
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
616
+ author = "Reimers, Nils and Gurevych, Iryna",
617
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
618
+ month = "11",
619
+ year = "2019",
620
+ publisher = "Association for Computational Linguistics",
621
+ url = "https://arxiv.org/abs/1908.10084",
622
+ }
623
+ ```
624
+
625
+ #### MultipleNegativesRankingLoss
626
+ ```bibtex
627
+ @misc{henderson2017efficient,
628
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
629
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
630
+ year={2017},
631
+ eprint={1705.00652},
632
+ archivePrefix={arXiv},
633
+ primaryClass={cs.CL}
634
+ }
635
+ ```
636
+
637
+ <!--
638
+ ## Glossary
639
+
640
+ *Clearly define terms in order to be accessible across audiences.*
641
+ -->
642
+
643
+ <!--
644
+ ## Model Card Authors
645
+
646
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
647
+ -->
648
+
649
+ <!--
650
+ ## Model Card Contact
651
+
652
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
653
+ -->
config.json ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "BAAI/bge-m3",
3
+ "architectures": [
4
+ "XLMRobertaModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "bos_token_id": 0,
8
+ "classifier_dropout": null,
9
+ "eos_token_id": 2,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 1024,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 4096,
15
+ "layer_norm_eps": 1e-05,
16
+ "max_position_embeddings": 8194,
17
+ "model_type": "xlm-roberta",
18
+ "num_attention_heads": 16,
19
+ "num_hidden_layers": 24,
20
+ "output_past": true,
21
+ "pad_token_id": 1,
22
+ "position_embedding_type": "absolute",
23
+ "torch_dtype": "float32",
24
+ "transformers_version": "4.47.0",
25
+ "type_vocab_size": 1,
26
+ "use_cache": true,
27
+ "vocab_size": 250002
28
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.3.1",
4
+ "transformers": "4.47.0",
5
+ "pytorch": "2.5.1+cu124"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:59d334bea45d9501841475a567fbaa5d4bc3b772f3a3272e923f0f13248493ad
3
+ size 2271064456
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 8192,
3
+ "do_lower_case": false
4
+ }
sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
3
+ size 5069051
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:e4f7e21bec3fb0044ca0bb2d50eb5d4d8c596273c422baef84466d2c73748b9c
3
+ size 17083053
tokenizer_config.json ADDED
@@ -0,0 +1,56 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "extra_special_tokens": {},
49
+ "mask_token": "<mask>",
50
+ "model_max_length": 8192,
51
+ "pad_token": "<pad>",
52
+ "sep_token": "</s>",
53
+ "sp_model_kwargs": {},
54
+ "tokenizer_class": "XLMRobertaTokenizer",
55
+ "unk_token": "<unk>"
56
+ }