File size: 61,430 Bytes
6bc2672
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
---
base_model: BAAI/bge-m3
library_name: sentence-transformers
pipeline_tag: sentence-similarity
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:148500
- loss:MultipleNegativesRankingLoss
widget:
- source_sentence: Thành phố San Fernando  một phần của nước nào   bao nhiêu
    dân số?
  sentences:
  - Boule-d'Amont  một  trong vùng Occitanie, thuộc tỉnh Pyrénées-Orientales,
    quận Prades, tổng Vinça. Tọa độ địa  của   42° 34' vĩ độ bắc, 02° 36' kinh
    độ đông. Boule-d'Amont nằm trên độ cao trung bình  483 mét trên mực nước biển,
     điểm thấp nhất  234 mét  điểm cao nhất  1.348 mét.   diện tích 23,22 km²,
    dân số vào thời điểm 1999  73 người; mật độ dân số  3 người/km².
  - 'Thành phố San Fernando là một trong ba thành phố lớn của Trinidad và Tobago,
    là đô thị lớn thứ hai. Thành phố có diện tịch 18 km² và nằm ở phía tây nam của
    đảo Trinidad. Nó giáp sông Guaracara về phía bắc, giáp sông Oropouche về phía
    nam, giáp quốc lộ Sir Solomon Hochoy về phía đông, và vịnh Paria về phía tây.
    Dân số ước tính năm 2000 là 62.000 người. Đô thị San Fernando được nâng cấp thành
    thành phố ngày 18 tháng 11 năm 1988. Khẩu hiệu của San Fernando là: "Sanitas Fortis"
    - "Trong một môi trường lành mạnh chúng ta sẽ tìm thấy sức mạnh".'
  - 'Các dự án quân sự bản địa khác liên quan đến việc thiết kế và bổ sung hàng không
    mẫu hạm lớp "Vikrant" và tàu ngầm hạt nhân lớp "Arihant".

    Sau khi kết thúc Chiến tranh Lạnh,Ấn Độ tăng cường hợp tác về kinh tế,chiến lược
    và quân sự với Hoa Kỳ và Liên minh châu Âu. Năm 2008, Hoa Kỳ và Ấn Độ ký kết một
    thỏa thuận hạt nhân dân sự.Mặc dù đương thời Ấn Độ là quốc gia sở hữu vũ khí hạt
    nhân và không phải là một bên tham gia của Hiệp ước không phổ biến vũ khí hạt
    nhân,song quốc gia này vẫn nhận được sự miễn trừ từ Cơ quan Năng lượng Nguyên
    tử Quốc tế và Nhóm các nhà cung cấp hạt nhân,do vậy thoát khỏi các hạn chế,rào
    cản trước đây đối với công nghệ và thương mại hạt nhân. Như một hệ quả, Ấn Độ
    trở thành quốc gia thứ sáu sở hữu vũ khí hạt nhân "trên thực tế". Ấn Độ sau đó
    ký kết các thỏa thuận hợp tác liên quan đến năng lượng hạt nhân dân sự với Nga,
    Pháp, Anh Quốc, và Canada.

    Tổng thống Ấn Độ là thống soái tối cao của lực lượng vũ trang quốc gia với 1,6
    triệu quân tại ngũ và xếp thứ ba thế giới trên tiêu chí này. Quân đội Ấn Độ gồm
    có lục quân, hải quân, và không quân; các tổ chức phụ trợ gồm có Bộ tư lệnh chiến
    lược (Strategic Forces Command) và ba nhóm bán quân sự: Đội quân súng trường Assam,
    Lực lượng biên cảnh đặc chủng, và Lực lượng bảo vệ bờ biển Ấn Độ. Ngân sách quốc
    phòng chính thức của Ấn Độ giai đoạn 2012-17 chiếm khoảng 2,5% GDP. Năm 2012,
    Ấn Độ là nước nhập khẩu vũ khí lớn nhất thế giới;từ năm 2007 đến năm 2011, tiền
    mua vũ khí của Ấn Độ chiếm 10% tổng phí tổn dành cho mua sắm vũ khí. Phần lớn
    chi tiêu quân sự tập trung vào phòng thủ đối với riêng Pakistan và chống lại ảnh
    hưởng ngày càng gia tăng của Trung Quốc tại Ấn Độ Dương.

    Một trận ẩu đả dữ dội giữa quân đội Trung Quốc và Ấn Độ tại khu vực lãnh thổ tranh
    chấp đã làm 20 binh sĩ Ấn Độ và ít nhất 4 binh sĩ Trung Quốc thiệt mạng.'
- source_sentence: Sự khác biệt giữa các loại sao về nhiệt độ bề mặt  gì?
  sentences:
  - 'Một khi việc cấp phát vùng nhớ động không còn cần thiết nữa thì phần bộ nhớ đó
    nên được trả về cho hệ điều hành. Thao tác này có thể tiến hành bằng hàm codice_134.
    Nó cần một tham số: tên của con trỏ mà trước đây đã xin cấp phát vùng nhớ. Một
    cách an toàn hơn là sau khi đã trả vùng nhớ về cho hệ điều hành, người lập trình
    cũng nên cài (hay gán) cho con trỏ liên đới giá trị codice_135 để hủy bỏ địa chỉ
    mà nó đang chỉ tới (nhằm tránh gây ra các hiệu ứng phụ do việc tham chiếu của
    con trỏ này có thể gây ra).

    Các mảng đa chiều.

    C có hỗ trợ việc dùng mảng đa chiều. Việc định nghĩa chúng giống như là tạo ra
    "mảng của các mảng ", mặc dù vậy trong thực tế nó không hoàn toàn đúng. Cú pháp
    sau:

    sẽ định nghĩa một mảng hai chiều; chiều thứ nhất có codice_136 phần tử. Chiều
    thứ hai sẽ có codice_137 các phần tử—một tập hợp của codice_138 các phần tử mà
    mỗi phần tử là một chiều thứ nhất.

    Các mảng đa chiều hoàn toàn có thể được xem như là dãy của các con trỏ. Trong
    thí dụ trên, codice_139 (nếu codice_136 là 1) sẽ là một tham chiếu giá trị nguyên
    mà nó chỉ tới một mảng của codice_138 các phần tử.

    Dãy ký tự.

    Dãy ký tự có thể được thay đổi nội dung của nó mà không cần đến thư viện chuẩn.
    Tuy nhiên, thư viện này có nhiều hàm có thể dùng cho cả dãy ký tự có kết thúc
    0 và mảng không có ký tự kết thúc kiểu codice_84. Trong phần này từ "dãy" được
    để chỉ dãy ký tự.

    Các hàm thường dùng là:

    Các hàm ít dùng tới hơn là:

    Tập tin I/O.

    Trong C, I/O được tiến hành qua một nhóm các hàm trong thư viện chuẩn. Trong ANSI/ISO
    C, những hàm đó được định nghĩa trong codice_202.

    Tiêu chuẩn I/O.

    Ba tiêu chuẩn dòng I/O được định nghĩa sẵn là:

    Các dòng này được tự động mở và đóng lại bởi môi trường của thời gian thi hành,
    chúng không cần và không nên được mở một cách rõ ràng.

    Thí dụ sau minh họa làm thế nào một chương trình bộ lọc được cấu trúc một cách
    điển hình:

    Việc chuyển các đối số qua dòng lệnh.'
  - "Số lượng nguyên tử chì cao cũng làm tăng mật độ của vật liệu, vì chì có trọng\
    \ lượng nguyên tử rất cao là 207,2, so với 40,08 đối với calci. Mật độ của ly\
    \ soda là 2,4g/cm³ hoặc thấp hơn, trong khi tinh thể chì điển hình có mật độ khoảng\
    \ 3,1g/cm³ và kính chì cao có thể trên 4,0g/cm³ hoặc thậm chí lên tới 5,9g/cm³\
    \ \nSự sáng chói của tinh thể chì phụ thuộc vào chỉ số khúc xạ cao gây ra bởi\
    \ hàm lượng chì. Thủy tinh thông thường có chiết suất \"n\" = 1,5, trong khi việc\
    \ bổ sung chì tạo ra phạm vi lên tới 1,7 hoặc 1,8. Chỉ số khúc xạ tăng cao này\
    \ cũng tương quan với độ tán sắc tăng, đo mức độ mà môi trường phân tách ánh sáng\
    \ thành quang phổ thành phần của nó, như trong lăng kính. Kỹ thuật cắt pha lê\
    \ khai thác các tính chất này để tạo ra hiệu ứng lấp lánh rực rỡ khi mỗi khía\
    \ cạnh cắt phản xạ và truyền ánh sáng qua vật thể. Chỉ số khúc xạ cao rất hữu\
    \ ích cho việc chế tạo ống kính, vì có thể đạt được độ dài tiêu cự nhất định với\
    \ ống kính mỏng hơn. Tuy nhiên, độ phân tán phải được hiệu chỉnh bởi các thành\
    \ phần khác của hệ thống thấu kính nếu nó bị mờ.\nViệc bổ sung oxide chì vào thủy\
    \ tinh kali cũng làm giảm độ nhớt của nó, khiến nó lỏng hơn thủy tinh soda thông\
    \ thường trên nhiệt độ làm mềm (khoảng ), với điểm làm việc là . Độ nhớt của thủy\
    \ tinh thay đổi hoàn toàn theo nhiệt độ, nhưng thủy tinh chì nhỏ hơn khoảng 100\
    \ lần so với kính soda thông thường trong phạm vi nhiệt độ làm việc (lên tới ).\
    \ Từ quan điểm của thợ làm kính, điều này dẫn đến hai sự phát triển thực tế. Đầu\
    \ tiên, thủy tinh chì có thể được chế tạo ở nhiệt độ thấp hơn, dẫn đến việc sử\
    \ dụng nó trong việc tráng men, và thứ hai, các mạch rõ ràng có thể được làm sạch\
    \ khỏi bọt khí bị kẹt với độ khó thấp hơn đáng kể so với kính thông thường, cho\
    \ phép chế tạo các vật thể hoàn hảo, rõ ràng.\nKhi gõ, pha lê chì tạo ra âm thanh\
    \ vang lên, không giống như kính thông thường. Người tiêu dùng vẫn dựa vào đặc\
    \ tính này để phân biệt với kính rẻ hơn."
  - 'Nhiệt độ bề mặt của sao, cùng với độ sáng biểu kiến tuyệt đối và các đặc trưng
    của vạch hấp thụ trong quang phổ, thường được sử dụng để phân loại sao (xem phân
    loại bên dưới).

    Các sao khối lượng lớn ở dải chính có nhiệt độ bề mặt lên tới 50.000 K. Các sao
    nhỏ hơn như Mặt Trời có nhiệt độ 6000 K. Những sao khổng lồ đỏ có nhiệt độ bề
    mặt tương đối thấp vào khoảng 3.600 K, nhưng chúng cũng có độ trưng tương đối
    lớn do diện tích mặt ngoài lớn.

    Bức xạ.

    Năng lượng được sản xuất ra bởi sao, là sản phẩm của phản ứng tổng hợp hạt nhân,
    bức xạ vào trong không gian bằng cả bức xạ điện từ và bức xạ hạt. Ngôi sao phát
    ra bức xạ hạt cũng chính là gió Sao Thổi vào không gian (tồn tại như là một dòng
    các hạt tích điện ổn định, như proton, hạt anpha, và hạt beta, thoát ra từ các
    lớp ngoài cùng của sao) và dòng ổn định các hạt neutrino thoát ra từ lõi sao.

    Sản phẩm năng lượng tại lõi cũng là nguyên nhân tại sao ngôi sao chiếu sáng: mỗi
    lần hai hoặc nhiều hơn hạt nhân nguyên tử của một nguyên tố tổng hợp với nhau
    để tạo thành một hạt nhân của nguyên tố mới nặng hơn, các photon tia gamma được
    giải phóng từ phản ứng tổng hợp hạt nhân. Năng lượng này được biến đổi thành các
    dạng năng lượng điện từ khác, bao gồm ánh sáng khả kiến, theo thời gian chúng
    truyền đến các lớp bên ngoài của sao.

    Màu sắc của một sao, được xác định bởi đỉnh tần số của ánh sáng khả kiến, phụ
    thuộc vào nhiệt độ các lớp ngoài cùng của ngôi sao, bao gồm quang quyển của nó.
    Bên cạnh ánh sáng khả kiến, ngôi sao cũng phát ra các dạng bức xạ điện từ không
    nhìn thấy được bằng mắt thường. Thực tế bức xạ điện từ phát ra từ ngôi sao trải
    rộng trên toàn phổ điện từ, từ bước sóng dài nhất là sóng radio, hồng ngoại cho
    đến bước sóng ngắn nhất như tia tử ngoại, tia X, và tia gamma. Mọi bước sóng bức
    xạ điện từ của ngôi sao, cả nhìn thấy và không nhìn thấy, đều có ý nghĩa quan
    trọng.

    Sử dụng phổ của ngôi sao, các nhà thiên văn cũng xác định được nhiệt độ bề mặt,
    hấp dẫn tại bề mặt, tính kim loại (metallicity) và vận tốc tự quay của sao.'
- source_sentence: Tại sao vấn đề Đài Loan độc lập lại phức tạp?
  sentences:
  - 'Marie-Ségolène Royal (sinh ngày 22 tháng 9 năm 1953 tại Dakar, Senegal, Tây Phi
    thuộc Pháp), được gọi là Ségolène Royal (), là một chính trị gia Pháp. Bà là chủ
    tịch Hội đồng Vùng Nouvelle-Aquitaine, một cựu thành viên của Quốc hội, cựu bộ
    trưởng trong chính phủ, và là một thành viên có ảnh hưởng của Đảng Xã hội Pháp.
    Người phụ nữ đầu tiên tại Pháp được chỉ định bởi một đảng lớn làm ứng cử viên
    trong cuộc bầu cử tổng thống Pháp năm 2007 nhưng đã thua cuộc trước Nicolas Sarkozy
    ngày 6 tháng 5 năm 2007.

    Ngày 28 tháng 11 năm 2008, Royal tuyên bố tư cách ứng cử viên cho cuộc bầu cử
    Tổng thống Pháp trong cuộc bầu cử tổng thống năm 2012.

    Tuổi trẻ.

    Ségolène Royal ra đời tại một căn cứ quân sự ở Ouakam, Dakar, Senegal ngày 22
    tháng 9 năm 1953, là con gái của Hélène Dehaye và Jacques Royal, một cựu sĩ quan
    pháp binh và trợ lý cho thị trưởng Chamagne (Vosges).

    Cha mẹ bà đã sinh tám người con trong chín năm: Marie-Odette, Marie-Nicole, Gérard,
    Marie-Ségolène, Antoine, Paul, Henri và Sigisbert.

    Sau khi học xong trung học, Marie-Ségolène vào trường đại học địa phương nơi bà
    tốt nghiệp ở vị trí thứ hai trong lớp ngành Kinh tế. Chị cả của bà sau đó hướng
    bà chuẩn bị cho kỳ thi đầu vào Sciences Po và bà được học bổng tại đây. Trong
    trường bà nghiên cứu chính trị của lớp và sự bình đẳng nam nữ. ("Sciences Po"
    khi ấy có tới 85% sinh viên thuộc tầng lớp trên người Paris và chủ yếu là nam
    giới). Mùa hè năm 1971, bà làm công không lương tại Dublin, Ireland. Năm 1972,
    khi 19 tuổi, Royal đã kiện cha mình vì ông từ chối li dị mẹ bà và trả tiền cấp
    dưỡng và tiền nuôi dạy con cho việc học tập của các con. Bà thắng kiện sau nhiều
    năm hầu toà, ngay trước khi Jacques Royal chết vì ung thư phổi năm 1981. Sáu trong
    tám người con đã từ chối gặp lại ông, trong đó có cả Ségolène.

    Royal, như hầu hết giới tinh hoa chính trị Pháp, là người tốt nghiệp Trường Hành
    chính quốc gia (ENA). Bà học cùng lớp với người bạn đời trong 30 năm, François
    Hollande (bà gặp ông tại một bữa tiệc), và Dominique de Villepin (thủ tướng dưới
    thời Jacques Chirac).'
  - 'Mặc dù Trung Hoa Dân Quốc thống trị khu vực Đài Loan từ thập niên 1950 có tính
    độc lập, đồng thời đa số dân chúng cho rằng tự thân có chủ quyền quốc gia, song
    do chịu uy hiếp quân sự của nước Cộng hòa Nhân dân Trung Hoa, khiến vấn đề Đài
    Loan độc lập cực kỳ phức tạp. Đại bộ phận dân chúng hy vọng duy trì hiện trạng
    hai bờ eo biển Đài Loan, song số lượng người chủ trương độc lập đông hơn người
    chủ trương thống nhất. Ngoài ra, một bộ phận nhân sĩ chủ trương việc Trung Hoa
    Dân Quốc thu hồi Đài Loan theo "Tuyên bố Cairo" có tranh nghị, cho rằng Trung
    Hoa Dân Quốc chỉ đại diện cho Đồng Minh chiếm lĩnh quân sự Đài Loan và Bành Hồ;
    đồng thời căn cứ theo Hiệp ước San Francisco tuyên bố chủ quyền Đài Loan chưa
    xác định,cho rằng Trung Hoa Dân Quốc là chính phủ lưu vong nước ngoài từ miền
    eo biển bên kia.

    Hành chính.

    Sau khi chính phủ Trung Hoa Dân Quốc dời sang Đài Loan vào năm 1949, họ chỉ có
    thể thống trị các đảo thuộc tỉnh Đài Loan (bao gồm đảo Đài Loan, quần đảo Bành
    Hồ) và tỉnh Phúc Kiến (bao gồm Kim Môn, Mã Tổ). Ngoài ra, chính phủ Trung Hoa
    Dân Quốc còn khống chế quần đảo Đông Sa, và đảo Ba Bình thuộc quần đảo Trường
    Sa trên biển Đông, giao các đảo này cho thành phố Cao Hùng phụ trách quản lý.
    Trung Hoa Dân Quốc tham gia tranh chấp chủ quyền quần đảo Trường Sa (gọi là Nam
    Sa) và quần đảo Senkaku (gọi là Điếu Ngư đài). Từ năm 1949 trở đi, chính phủ Trung
    Hoa Dân Quốc từng nhiều lần cải cách phân chia hành chính nhằm tổng hợp phát triển
    khu vực. Trong đó, chức năng của chính phủ cấp tỉnh của tỉnh Phúc Kiến và tỉnh
    Đài Loan lần lượt được tinh giản vào năm 1956 và 1998, chỉ duy trì công tác mang
    tính tượng trưng.

    Ngoài ra, vào năm 1967 và năm 1979, thành phố Đài Bắc và thành phố Cao Hùng lần
    lượt được tách khỏi tỉnh Đài Loan để chuyển sang trực thuộc trung ương. Năm 2010,
    chính phủ lại chuyển các thành phố Tân Bắc, Đài Trung, Đài Nam sang trực thuộc
    trung ương. Năm thành phố này cũng là năm thành thị trọng yếu nhất của Trung Hoa
    Dân Quốc hiện nay, trong đó Tân Bắc nguyên là huyện Đài Bắc, Đài Trung cùng Đài
    Nam và Cao Hùng hợp nhất với các huyện cùng tên.'
  - 'Theo luật, Quỹ bao gồm một hội đồng quản trị của năm công dân Thụy Điển hay Na
    Uy, với trụ sở tại Stockholm. Chủ tịch Hội đồng quản trị được Vua Thụy Điển bổ
    nhiệm, với bốn thành viên khác do ủy thác của các tổ chức trao giải thưởng bổ
    nhiệm. Một giám đốc điều hành được lựa chọn trong số các thành viên hội đồng quản
    trị, Phó giám đốc được Vua Thụy Điển bổ nhiệm, và hai phó chủ tịch được bổ nhiệm
    do người được ủy thác. Tuy nhiên, kể từ năm 1995, tất cả các thành viên của hội
    đồng quản trị được lựa chọn bởi các ủy viên quản trị; Giám đốc điều hành và các
    Phó Giám đốc chỉ định bởi chính hội đồng quản trị. Cũng như hội đồng quản trị,
    Quỹ Nobel được tạo thành từ các tổ chức trao giải (Viện Hàn lâm Khoa học Hoàng
    gia Thụy Điển, Đại hội đồng Nobel tại Viện Karolinska, Viện Hàn lâm Thụy Điển,
    và các Ủy ban Nobel Na Uy), người được ủy thác của các tổ chức trên, và các kiểm
    toán viên.

    Huy chương Nobel.

    Huy chương Nobel làm bằng 150 gram vàng 18 ca-ra chạm hình Alfred Nobel. Mặt sau
    của tấm huy chương giải Nobel Vật lý và Hóa học là hình một phụ nữ để ngực trần.

    Một số tấm huy chương Nobel đã được chủ nhân mang ra bán đấu giá. Tấm huy chương
    Nobel Hòa bình được bán rẻ nhất trong đấu giá đó là của Aristide Briand, người
    Pháp đã có đóng góp lớn trong năm 1926 vào cuộc hoà hợp ngắn ngủi Đức – Pháp.
    Năm 2008 huy chương Nobel này được bảo tàng Ecomusée của Saint-Nazaire mua về
    với khoản tiền 12 nghìn euro. Khá hơn một chút, huy chương Nobel Hoà bình của
    người Anh William Randal Cremer vinh danh năm 1903 đã bán với giá 17.000 đô la
    tại một cuộc đấu giá năm 1985.

    Từ năm 2014, việc bán huy chương Nobel trở nên phổ thông. Cho tới giờ 8 huy chương
    đã được bán kể từ đó. Cũng về giải Nobel Hoà bình, tấm huy chương của người Bỉ
    Auguste Beernaert (được trao năm 1909) đã đạt tới giá 661 nghìn đô la và huy chương
    Nobel của Carlos Saavedra Lamas, người Argentina, nhận năm 1936, thậm chí đã tìm
    được người mua với giá kỷ lục 1,16 triệu đô la.

    Kỷ lục hiện nay là huy chương của James Watson, người Mỹ được nhận giải nobel
    Y học năm 1962 cho những phát hiện ra cấu trúc DNA. Ông đã bán được tấm huy chương
    Nobel của mình với giá 4,76 triệu đô la Mỹ vào tháng 12/2014.'
- source_sentence: Phong trào kháng chiến Na Uy đã hoạt động như thế nào trong thời
    gian chiếm đóng?
  sentences:
  - 'Michael Walzer (3/3/1935) là một trong số các triết gia chính trị hàng đầu của
    Mỹ, giáo sư về hưu của Institute for Advanced Study, Đại học Princeton ở New Jersey,
    đồng thời là tổng biên tập tạp chí khoa học Dissent, theo thiên hướng cánh tả,
    ra hàng quý, về chính trị và văn hóa. Các đề tài của ông trải rộng từ tính hợp
    pháp của các cuộc chiến cho tới dân tộc và nhân chủng học, kinh tế, xã hội và
    trách nhiệm chính trị, với 27 sách và 300 bài viết, thành viên của hội triết gia
    Hoa Kỳ.

    Sinh ở New York City, nhưng Walzer xuất thân từ một gia đình Do Thái gốc Đông
    Âu, được đào tạo bậc đại học trong ngôi trường Do Thái đầu tiên trên đất Mỹ Brandeis
    University. Một phần do môi trường chính trị Hoa Kỳ không có nhiều chỗ hoạt động
    cho cánh tả mà ông quyết định xuống đường cùng phong trào sinh viên chống Chiến
    tranh Việt Nam.

    Một trong số các phạm trù chính của Walzer là khái niệm "communitarianism" trong
    chính trị học, bên cạnh các tên tuổi như Alasdair MacIntyre và Michael Sandel.
    Khái niệm này có lẽ nên được tạm dịch là Chủ nghĩa cộng đồng, vì nó liên quan
    và bắt nguồn từ chữ "community", và đề cao các giá trị chung trong khuôn khổ xã
    hội công dân ("civic society") như một phản đề đối với chủ nghĩa cá nhân, và có
    khác với "communalism", tức là Chủ nghĩa công xã, và tất nhiên còn khác xa với
    Chủ nghĩa cộng sản - "communism". Walzer cũng đóng góp nhiều trong lý thuyết về
    cuộc chiến chính nghĩa - "just war".

    Walzer cho rằng mỗi lý thuyết chính trị cần phải khởi nguồn từ một xã hội nhất
    định với truyền thống và văn hóa riêng, phản đối xu hướng trừu tượng hóa triết
    học chính trị. Mô hình "communitarian" theo cách hiểu của Walzer là một xã hội
    với những sự bình đẳng không đồng nhất - "complex equality". Theo đó, thước đo
    của bình đẳng không chỉ đơn giản là vật chất hay đạo đức, mà nên hiểu theo nghĩa
    công bằng một cách công bình ("egalitarian justice"), tức là phân phối hàng hóa
    (vật chất và đạo đức) tùy thuộc vào giá trị xã hội của nó và không được phép (tiền
    và quyền lực chính trị cũng là một thứ hàng hóa) chiếm ưu thế hoặc thay đổi sự
    phân phối của các loại hàng hóa khác trong các lãnh vực khác.'
  - 'Vua Haakon và chính phủ Na Uy tiếp tục cuộc chiến trong hoàn cảnh tị nạn tại
    Rotherhithe, Luân Đôn. Vào ngày cuộc xâm lược diễn ra, vị đồng lãnh đạo của Đảng
    Quốc gia-Xã hội nhỏ Nasjonal Samling — Vidkun Quisling — đã tìm cách lên nắm quyền
    lực, nhưng đã bị quân chiếm đóng Đức gạt ra rìa. Quyền lực thực sự nằm trong tay
    chính quyền chiếm đóng Đức, Reichskommissar Josef Terboven. Quisling, với tư cách
    "bộ trưởng tổng thống", sau này đã thành lập một chính phủ liên minh dưới sự quản
    lý của Đức. Các cơ sở tại Na Uy đã chế tạo nước nặng, một nguyên liệu chủ chốt
    chế tạo vũ khí hạt nhân, và cuối cùng đã bị người Đức bỏ lại sau nhiều nỗ lực
    phá huỷ cơ sở Vemork của người Na Uy, người Anh và người Mỹ. Trong những năm chiếm
    đóng của Phát xít, người Na Uy đã xây dựng một phong trào kháng chiến mạnh chống
    lại các lực lượng chiếm đóng Đức bằng cả chiến tranh vũ trang và bất tuân dân
    sự. Tuy nhiên, yếu tố quan trọng hơn với Đồng Minh, là vai trò của hải quân thương
    mại Na Uy. Ở thời điểm xảy ra cuộc xâm lược, Na Uy có hạm đội tàu biển thương
    mại đứng hàng thứ tư thế giới (cũng như có tốc độ nhanh nhất và hiệu quả nhất).
    Công ty tàu biển Na Uy Nortraship đã nằm dưới sự điều khiển của Đồng Minh trong
    suốt cuộc chiến và tham gia vào mọi chiến dịch từ việc sơ tán Dunkirk tới cuộc
    đổ bộ vào Normandy.

    Sau cuộc chiến, những thành viên đảng Dân chủ Xã hội lên nắm quyền và lãnh đạo
    quốc gia trong hầu hết thời gian cuộc chiến tranh lạnh. Na Uy đã gia nhập NATO
    năm 1949, và trở thành một đồng minh thân cận của Hoa Kỳ. Hai cuộc trưng cầu dân
    ý nhằm gia nhập Liên minh châu Âu (được gọi là Cộng đồng châu Âu năm 1972) đã
    thất bại với tỷ số mong manh năm 1972 và 1994. Những nguồn dự trữ dầu mỏ và khí
    gas lớn đã được khám phá trong thập niên 1960, dẫn tới sự bùng nổ kinh tế sau
    đó.

    Địa lý, khí hậu và môi trường.

    Na Uy gồm phần phía tây của Scandinavia ở Bắc Âu. Bờ biển lởm chởm, bị chia cắt
    bởi nhiều vịnh hẹp (fjord) và khoảng 50.000 hòn đảo, trải dài hơn 2.500 km.'
  - 'Các vị sư trong chùa tu hành theo tông phái nào cũng không quan trọng, miễn là
    các vị sư này giữ gìn được các giáo giới quan trọng nhất của Phật giáo (không
    sát sinh, không trộm cắp, không phạm sắc giới, không uống rượu, không ăn thịt).
    Họ cũng không có hiểu biết sâu sắc về giáo lý Phật giáo mà chỉ hiểu đơn giản là
    thiện nghiệp thiện báo hoặc thậm chí hiểu sai lạc cúng dường cho chùa nhiều thì
    thiện báo. Có người đến chùa chỉ để cầu xin cho bản thân và coi Phật như là thần
    linh có thể giúp họ toại nguyện chứ không hiểu rằng những gì họ nhận được chính
    là kết quả của những gì họ tạo ra. Còn những sinh hoạt như cúng bái, cầu siêu,
    cầu an, bói toán, thỉnh vong, đốt vàng mã... là những hoạt động được du nhập vào
    Phật giáo từ Nho giáo, Đạo giáo và Shaman giáo.

    Trung Quốc.

    "Bài chi tiết: Phật giáo Trung Quốc"

    Theo sử liệu cho thấy Phật giáo được giới thiệu đến Trung Quốc do các nhà buôn
    hay các nhà sư truyền giáo người Ấn qua các ngã đường biển và đường bộ. Về đường
    biển thì xuất phát từ các hải cảng vùng Nam Ấn rồi qua ngã Sri Lanka, Nam Dương
    để vào hải cảng Quảng Đông. Về đường bộ, còn gọi là con đường tơ lụa (Silk road)
    nối liền Đông Tây, di chuyển bằng lạc đà, xuất phát từ miền Đông Bắc Ấn, rồi băng
    qua các sa mạc ở Trung Á để tới Lạc Dương (kinh đô của nhà Hán).

    Theo biên niên sử thì Phật giáo truyền đến Trung Quốc vào thế kỷ thứ 2 trước Công
    Nguyên từ Trung Á nhằm niên hiệu Nguyên Thọ đời vua Hán Ai Đế nhà Tây Hán, nhưng
    Phật giáo không truyền bá rộng rãi cho đến năm 65 Công nguyên, dưới triều vua
    Hán Minh Đế (niên hiệu Vĩnh Bình thứ 10 nhà Hậu Hán, 25-220 công nguyên), thì
    Phật giáo mới bắt đầu cắm rễ và phát triển ở Trung Quốc. Vì muốn thần dân tu học
    Phật pháp nên vua Minh Đế đã cử một phái đoàn gồm 18 người đến Ấn Độ để thỉnh
    cầu hai Thiền sư người Ấn là Ca Diếp Ma Đằng (Kàsyapama''tanga) và Trúc Pháp Lan
    (Dharmaraksa) đến Trung Quốc hoằng pháp.'
- source_sentence: Quận Sông  được thành lập vào thời điểm nào  dựa trên  sở
    nào?
  sentences:
  - 'Quang Châu có thể là:'
  - 'Mạng lưới sông rạch.

    Toàn huyện có 355 km kênh mương thủy lợi chính, gồm 80 km kênh cấp I và 275 km
    kênh cấp II, bình quân 1 ha đất canh tác có 12,62m kênh mương thủy lợi.

    Do nằm ven sông Cổ Chiên và có cù lao Hoà Minh – Long Hoà chạy dài ra sát cửa
    Cung Hầu nên huyện Châu Thành chịu ảnh hưởng chế độ bán nhật trìêu của biển Đông,
    thông qua đoạn sông Cổ Chiên vào các hệ thống sông rạch lớn như: Láng Thé – Ba
    Si – Ô Chát, sông Trà Vinh – Kinh Thống Nhất hệ Tầm Phương, sông Bãi Vàng – Vinh
    Kim. Ngoài ra, do yêu cầu tiếp ngọt với hai cống ngăn mặn Đa Lộc, Hiệp Hòa vào
    mùa khô, nguồn nước từ Cầu Quan (sông Hậu) được đưa sang kinh Thống Nhất và Trà
    Vinh. Trong ngày nước lên xuống hai lần, mỗi tháng có 2 lần triều cường sau ngày
    1 và ngày 15 âl và 2 lần triều kèm sau ngày 7 và 23 âl (từ 2 đến 3 ngày), biên
    độ triều hàng ngày rất lớn, nhất là các khu vực gần cửa sông.

    Biên độ tắt dần khi vào nội đồng, đặc biệt vào mùa triều cường (tháng 10,12 dương
    lịch) đối với vùng kinh Thông Nhất qua ngọn Ô Chát chịu ảnh hưởng chung của sông
    Cổ Chiên và sông Hậu, biên độ triều hàng ngày nhỏ và hầu như không đáng kể vào
    thời kỳ triều cường nhất trong năm. Một số vùng thấp (Thanh Mỹ – Đa Lộc) có thời
    gian nước trên đồng không rút được, dù độ ngập không lớn.

    Vào mùa khô, triều cường và gió chướng đã đưa nước mặn xâm nhập vào nội đồng,
    độ mặn trung bình thay đổi từ 2,24‰ -9,96‰ từ cuối tháng 1 đến tháng 6, tuy nhiên
    tháng tư có độ mặn cao nhất trên 18‰ (Hưng Mỹ). Các cửa sông gần biển thì độ mặn
    càng cao. Do dự trữ nước nội đồng và nguồn bổ sung từ trên xuống, từ sông Hậu
    sang nên độ mặn giảm dần khi vào nội đồng.

    Hành chính.

    Huyện Châu Thành có 14 đơn vị hành chính cấp xã trực thuộc, bao gồm thị trấn Châu
    Thành và 13 xã: Đa Lộc, Hòa Lợi, Hòa Minh, Hòa Thuận, Hưng Mỹ, Long Hòa, Lương
    Hòa, Lương Hòa A, Mỹ Chánh, Nguyệt Hóa, Phước Hảo, Song Lộc, Thanh Mỹ.

    Lịch sử.'
  - 'Quận Sông Bé được thành lập theo Nghị định của Toàn quyền Đông Dương ngày 25
    tháng 10 năm 1927 trên cơ sở đổi tên quận Phú Riềng (thuộc tỉnh Biên Hòa) và chuyển
    quận lị về Bu Kroai (nay thuộc xã Đức Hạnh, huyện Bù Gia Mập).

    Ngày 20 tháng 5 năm 1933, cùng với việc chuyển quận lị Sông Bé về núi Bà Rá, quận
    Sông Bé được đổi tên thành quận Núi Bà Rá.

    Quận Núi Bà Rá được nâng cấp thành tỉnh Phước Long theo Sắc lệnh số 143-NV ngày
    22 tháng 10 năm 1956 do Tổng thống Việt Nam Cộng hòa ký, chia Nam phần thành 22
    tỉnh. Tỉnh lỵ tỉnh Phước Long đặt tại Phước Bình, về mặt hành chính thuộc xã Sơn
    Giang, quận Phước Bình (nay là khu vực trung tâm thị xã Phước Long). Địa bàn quận
    Sông Bé nay thuộc tỉnh Bình Phước.'
---

# SentenceTransformer based on BAAI/bge-m3

This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

## Model Details

### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3) <!-- at revision 5617a9f61b028005a4858fdac845db406aefb181 -->
- **Maximum Sequence Length:** 8192 tokens
- **Output Dimensionality:** 1024 dimensions
- **Similarity Function:** Cosine Similarity
<!-- - **Training Dataset:** Unknown -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->

### Model Sources

- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)

### Full Model Architecture

```
SentenceTransformer(
  (0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: XLMRobertaModel 
  (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)
```

## Usage

### Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

```bash
pip install -U sentence-transformers
```

Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("strongpear/M3-retriever-Wiki")
# Run inference
sentences = [
    'Quận Sông Bé được thành lập vào thời điểm nào và dựa trên cơ sở nào?',
    'Quận Sông Bé được thành lập theo Nghị định của Toàn quyền Đông Dương ngày 25 tháng 10 năm 1927 trên cơ sở đổi tên quận Phú Riềng (thuộc tỉnh Biên Hòa) và chuyển quận lị về Bu Kroai (nay thuộc xã Đức Hạnh, huyện Bù Gia Mập).\nNgày 20 tháng 5 năm 1933, cùng với việc chuyển quận lị Sông Bé về núi Bà Rá, quận Sông Bé được đổi tên thành quận Núi Bà Rá.\nQuận Núi Bà Rá được nâng cấp thành tỉnh Phước Long theo Sắc lệnh số 143-NV ngày 22 tháng 10 năm 1956 do Tổng thống Việt Nam Cộng hòa ký, chia Nam phần thành 22 tỉnh. Tỉnh lỵ tỉnh Phước Long đặt tại Phước Bình, về mặt hành chính thuộc xã Sơn Giang, quận Phước Bình (nay là khu vực trung tâm thị xã Phước Long). Địa bàn quận Sông Bé nay thuộc tỉnh Bình Phước.',
    'Mạng lưới sông rạch.\nToàn huyện có 355\xa0km kênh mương thủy lợi chính, gồm 80\xa0km kênh cấp I và 275\xa0km kênh cấp II, bình quân 1 ha đất canh tác có 12,62m kênh mương thủy lợi.\nDo nằm ven sông Cổ Chiên và có cù lao Hoà Minh – Long Hoà chạy dài ra sát cửa Cung Hầu nên huyện Châu Thành chịu ảnh hưởng chế độ bán nhật trìêu của biển Đông, thông qua đoạn sông Cổ Chiên vào các hệ thống sông rạch lớn như: Láng Thé – Ba Si – Ô Chát, sông Trà Vinh – Kinh Thống Nhất hệ Tầm Phương, sông Bãi Vàng – Vinh Kim. Ngoài ra, do yêu cầu tiếp ngọt với hai cống ngăn mặn Đa Lộc, Hiệp Hòa vào mùa khô, nguồn nước từ Cầu Quan (sông Hậu) được đưa sang kinh Thống Nhất và Trà Vinh. Trong ngày nước lên xuống hai lần, mỗi tháng có 2 lần triều cường sau ngày 1 và ngày 15 âl và 2 lần triều kèm sau ngày 7 và 23 âl (từ 2 đến 3 ngày), biên độ triều hàng ngày rất lớn, nhất là các khu vực gần cửa sông.\nBiên độ tắt dần khi vào nội đồng, đặc biệt vào mùa triều cường (tháng 10,12 dương lịch) đối với vùng kinh Thông Nhất qua ngọn Ô Chát chịu ảnh hưởng chung của sông Cổ Chiên và sông Hậu, biên độ triều hàng ngày nhỏ và hầu như không đáng kể vào thời kỳ triều cường nhất trong năm. Một số vùng thấp (Thanh Mỹ – Đa Lộc) có thời gian nước trên đồng không rút được, dù độ ngập không lớn.\nVào mùa khô, triều cường và gió chướng đã đưa nước mặn xâm nhập vào nội đồng, độ mặn trung bình thay đổi từ 2,24‰ -9,96‰ từ cuối tháng 1 đến tháng 6, tuy nhiên tháng tư có độ mặn cao nhất trên 18‰ (Hưng Mỹ). Các cửa sông gần biển thì độ mặn càng cao. Do dự trữ nước nội đồng và nguồn bổ sung từ trên xuống, từ sông Hậu sang nên độ mặn giảm dần khi vào nội đồng.\nHành chính.\nHuyện Châu Thành có 14 đơn vị hành chính cấp xã trực thuộc, bao gồm thị trấn Châu Thành và 13 xã: Đa Lộc, Hòa Lợi, Hòa Minh, Hòa Thuận, Hưng Mỹ, Long Hòa, Lương Hòa, Lương Hòa A, Mỹ Chánh, Nguyệt Hóa, Phước Hảo, Song Lộc, Thanh Mỹ.\nLịch sử.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
```

<!--
### Direct Usage (Transformers)

<details><summary>Click to see the direct usage in Transformers</summary>

</details>
-->

<!--
### Downstream Usage (Sentence Transformers)

You can finetune this model on your own dataset.

<details><summary>Click to expand</summary>

</details>
-->

<!--
### Out-of-Scope Use

*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->

<!--
## Bias, Risks and Limitations

*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->

<!--
### Recommendations

*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->

## Training Details

### Training Dataset

#### Unnamed Dataset


* Size: 148,500 training samples
* Columns: <code>anchor</code> and <code>positive</code>
* Approximate statistics based on the first 1000 samples:
  |         | anchor                                                                            | positive                                                                            |
  |:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
  | type    | string                                                                            | string                                                                              |
  | details | <ul><li>min: 7 tokens</li><li>mean: 19.77 tokens</li><li>max: 40 tokens</li></ul> | <ul><li>min: 7 tokens</li><li>mean: 408.51 tokens</li><li>max: 699 tokens</li></ul> |
* Samples:
  | anchor                                                                                                  | positive                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             |
  |:--------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
  | <code>Adidas đã thực hiện những bước tiến nào trong lĩnh vực giày thể thao từ năm 2005 đến 2006?</code> | <code>Vào ngày 25 tháng 11 năm 2005, Adidas đã phát hành phiên bản mới của Adidas 1 với phạm vi đệm tăng lên, cho phép giày trở nên mềm hơn hoặc cứng hơn và một động cơ mới có mô-men xoắn lớn hơn 153%.<br>Vào ngày 11 tháng 4 năm 2006, Adidas công bố hợp đồng 11 năm để trở thành nhà cung cấp quần áo chính thức của NBA. Công ty đã và đang sản xuất áo thi đấu và các sản phẩm của NBA, NBDL và WNBA cũng như các phiên bản màu đội của giày bóng rổ "Superstar". Thỏa thuận này (trị giá hơn 400 triệu đô la) đã tiếp quản thỏa thuận Reebok trước đó đã được thực hiện vào năm 2001 trong 10 năm.<br>Vào tháng 11 năm 2011, Adidas thông báo rằng họ sẽ mua lại thương hiệu biểu diễn thể thao hành động ngoài trời Five Ten thông qua một thỏa thuận mua cổ phần. Tổng giá mua là 25 triệu đô la Mỹ bằng tiền mặt khi đóng cửa.<br>Những năm gần đây.<br>Vào cuối năm 2012, Adidas đã báo cáo doanh thu cao nhất từ ​​trước đến nay và Giám đốc điều hành Herbert Hainer bày tỏ sự lạc quan cho năm tới. Adidas hiện có trụ sở công ty toàn cầu...</code> |
  | <code>Tại sao Hồ Nhất Đao chết và điều gì xảy ra với vợ của ông?</code>                                 | <code>Không may Miêu Nhân Phụng (cầm đao của Hồ Nhất Đao) làm bị thương Hồ Nhất Đao, thế là Hồ Nhất Đao chết vì bị độc, vợ của Hồ Nhất Đao mới sinh được một đứa con trai - là nhân vật chính Hồ Phỉ - cũng tự sát theo chồng. Bi kịch thù hận bốn họ tạm thời ngưng lại trong sự hối hận của Miêu Nhân Phụng, ông chôn cất vợ chồng Hồ Nhất Đao và hàng năm tế bái, coi họ là anh em, suốt đời ân hận vì đã nỡ tay hại chết tri kỷ.<br>Hồ Phỉ hóa giải ân oán.<br>Đoạn này lẫn lộn nội dung Tuyết Sơn Phi Hồ và Phi Hồ Ngoại Truyện<br>Khi Hồ Nhất Đao chết, bọn Điền Quy Nông muốn trừ hậu họa nên lục tìm giết đứa bé, nhưng Bình A Tứ (một người hầu nghèo khổ trong quán trước đó được Hồ Nhất Đao cứu giúp, chịu ơn lớn của Hồ Nhất Đao) đã nhanh tay cứu mang đứa bé đi. Thầy lang Diêm Cơ định cướp đao phổ nhưng không thành, chỉ giật được vài trang đầu sau đó đi tu luyện thành võ công cao cường lấy hiệu là Bảo Thụ.<br>Bình A Tứ nuôi lớn Hồ Phỉ, Hồ Phỉ luyện thành võ công cao cường, quay lại tìm hiểu bí mật cái chết của cha mẹ (chi t...</code> |
  | <code>Thế hệ thứ nhất của RAF đã thực hiện những hoạt động gì trong giai đoạn 1970-1972?</code>         | <code>Thế hệ thứ nhất.<br>Thế hệ thứ nhất của RAF (Andreas Baader, Gudrun Ensslin, Holger Meins, Ulrike Meinhof, Jan-Carl Raspe và nhiều người khác) trong thời gian từ 1970 đến 1972 đã thực hiện nhiều vụ đánh cướp ngân hàng, đánh bom các cơ sở quân sự Mỹ, trong đó có sở tổng chỉ huy quân đội Mỹ tại Frankfurt am Main, và cơ quan nhà nước, qua đó đã có bốn người chết và trên 30 người bị thương. Trong tháng 6 năm 1972 những người nắm vai trò chủ chốt bị bắt giam: Andreas Baader, Holger Meins và Jan-Carl Raspe tại Frankfurt, Gudrun Ensslin tại Hamburg, Brigitte Mohnhaupt tại Tây Berlin và Ulrike Meinhof tại Hannover. Tháng 5 năm 1975 họ bị khởi tố và trong tháng 4 năm 1977 sau 192 ngày xử án bị tuyên án tù chung thân vì tội giết người ngoài những tội khác.<br>Trong nhà giam, nhóm người này khiếu nại về điều kiện giam giữ được thắt chặt như là tra tấn bằng cách cô lập và yêu cầu hủy bỏ điều này cũng như là công nhận quy chế tù nhân chiến tranh và những điều khác. Để tăng sức ép cho yêu cầu, họ đã nhiều...</code>       |
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
  ```json
  {
      "scale": 20.0,
      "similarity_fct": "cos_sim"
  }
  ```

### Evaluation Dataset

#### Unnamed Dataset


* Size: 1,500 evaluation samples
* Columns: <code>anchor</code> and <code>positive</code>
* Approximate statistics based on the first 1000 samples:
  |         | anchor                                                                            | positive                                                                            |
  |:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
  | type    | string                                                                            | string                                                                              |
  | details | <ul><li>min: 7 tokens</li><li>mean: 19.84 tokens</li><li>max: 48 tokens</li></ul> | <ul><li>min: 7 tokens</li><li>mean: 410.74 tokens</li><li>max: 657 tokens</li></ul> |
* Samples:
  | anchor                                                                                      | positive                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          |
  |:--------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
  | <code>Pennsylvania được gọi là gì và có những đặc điểm gì liên quan đến chính quyền?</code> | <code>Ngày nay, hai thành phố lớn của tiểu bang là —Philadelphia, quê hương của chuông Liberty, sảnh Independence, là một khu đô thị sầm uất, và Pittsburgh, một cảng sông bận rộn bên trong lục địa và là một trung tâm lớn cho giáo dục và các tiến bộ kỹ thuật. Dãy núi Pocono và Delaware Water Gap cung cấp các hoạt động giải trí phổ thông.<br>Pennsylvania là một "Commonwealth", mặc cho nó có State Treasury và State Police. Massachusetts, Virginia và Kentucky cũng được biết như là "Commonwealth".<br>Chiến hạm USS "Pennsylvania", bị hư hỏng tại Trân Châu Cảng "(Pearl Harbor)", được đặt tên để vinh danh tiểu bang này, cũng như là một vài chiến hạm hải quân khác. Nó được sửa chữa lại Sun Ship Yard &amp; Dry Dock trước đây ở Chester, Pennsylvania.</code>                                                                                                                                                                                                                                                                              |
  | <code>Romaja là gì và nó có liên quan như thế nào đến việc ghi tiếng Hàn Quốc?</code>       | <code>Romaja hay cách ghi tiếng Hàn Quốc (Triều Tiên) bằng chữ latinh là các phương pháp ghi tiếng Triều Tiên bằng chữ cái Latinh. Romaja có nghĩa là "La Mã tự" hay "chữ La Mã". Romaja quốc ngữ là phương pháp nhiều người thường dùng nhất.<br>"Romaja" không được nhầm lẫn với "romanization (La-tinh hóa)". Cách viết thứ nhất có thể được áp dụng cho bất kỳ cách sử dụng chữ cái Latinh nào trong văn bản tiếng Hàn - cho dù đối với các từ hoặc tên tiếng Hàn hoặc không phải tiếng Hàn Quốc - trong khi cách viết thứ hai đề cập đến việc viết các từ tiếng Hàn bằng hệ thống chữ Latinh: hoặc là chữ La tinh hóa các từ riêng lẻ trong văn bản tiếng Hàn, hoặc viết toàn bộ văn bản tiếng Hàn bằng hệ thống chữ Latinh.<br>Hệ thống.<br>Nhiều lược đồ La tinh hóa đang được sử dụng phổ biến:</code>                                                                                                                                                                                                                                                    |
  | <code>Tây Sơn có vai trò gì trong địa lý của Bắc Kinh?</code>                               | <code>Địa lý.<br>Địa hình.<br>Thành phố Bắc Kinh nằm trên vùng đất thấp và bằng phẳng, với độ cao thường nằm trong khoảng 40-60m trên mực nước biển. Điểm cao nhất trong khu thành cổ là đỉnh của Cảnh Sơn với độ cao là 88,35 m, từ đây có thể nhìn toàn cảnh Tử Cấm thành. Đỉnh của Vạn Thọ Sơn (万寿山) thuộc Di Hòa Viên có độ cao . Vùng đồng bằng từ Bắc Kinh kéo dài xa về phía đông đến Sơn Hải quan bên bờ Bột Hải và xa về phía nam đến Nam Kinh.<br>Ở phía tây Bắc Kinh có Tây Sơn, có thể nhìn thấy núi này từ nội thị vào những ngày quang đãng. Tây Sơn tạo thành sườn núi phía đông của Thái Hành Sơn- dãy núi chạy theo chiều bắc-nam và tạo thành xương sống phía tây của Hà Bắc. Tây Sơn bao trùm gần như toàn bộ các quận Phòng Sơn và Môn Đầu Câu ở phía tây thành phố. Đông Linh Sơn (东灵山, cao ), một đỉnh núi của Tây Sơn nằm trên ranh giới với Hà Bắc, là đỉnh cao nhất tại Bắc Kinh. Đỉnh này nằm cách trung tâm thành phố . Tây Sơn cũng được biết đến với các đồng cỏ núi cao và các hẻm núi sông, bao gồm Thập Độ (十渡). Vùng c...</code> |
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
  ```json
  {
      "scale": 20.0,
      "similarity_fct": "cos_sim"
  }
  ```

### Training Hyperparameters
#### Non-Default Hyperparameters

- `eval_strategy`: steps
- `per_device_train_batch_size`: 32
- `per_device_eval_batch_size`: 32
- `num_train_epochs`: 1
- `warmup_ratio`: 0.1
- `bf16`: True
- `batch_sampler`: no_duplicates

#### All Hyperparameters
<details><summary>Click to expand</summary>

- `overwrite_output_dir`: False
- `do_predict`: False
- `eval_strategy`: steps
- `prediction_loss_only`: True
- `per_device_train_batch_size`: 32
- `per_device_eval_batch_size`: 32
- `per_gpu_train_batch_size`: None
- `per_gpu_eval_batch_size`: None
- `gradient_accumulation_steps`: 1
- `eval_accumulation_steps`: None
- `torch_empty_cache_steps`: None
- `learning_rate`: 5e-05
- `weight_decay`: 0.0
- `adam_beta1`: 0.9
- `adam_beta2`: 0.999
- `adam_epsilon`: 1e-08
- `max_grad_norm`: 1.0
- `num_train_epochs`: 1
- `max_steps`: -1
- `lr_scheduler_type`: linear
- `lr_scheduler_kwargs`: {}
- `warmup_ratio`: 0.1
- `warmup_steps`: 0
- `log_level`: passive
- `log_level_replica`: warning
- `log_on_each_node`: True
- `logging_nan_inf_filter`: True
- `save_safetensors`: True
- `save_on_each_node`: False
- `save_only_model`: False
- `restore_callback_states_from_checkpoint`: False
- `no_cuda`: False
- `use_cpu`: False
- `use_mps_device`: False
- `seed`: 42
- `data_seed`: None
- `jit_mode_eval`: False
- `use_ipex`: False
- `bf16`: True
- `fp16`: False
- `fp16_opt_level`: O1
- `half_precision_backend`: auto
- `bf16_full_eval`: False
- `fp16_full_eval`: False
- `tf32`: None
- `local_rank`: 0
- `ddp_backend`: None
- `tpu_num_cores`: None
- `tpu_metrics_debug`: False
- `debug`: []
- `dataloader_drop_last`: False
- `dataloader_num_workers`: 0
- `dataloader_prefetch_factor`: None
- `past_index`: -1
- `disable_tqdm`: False
- `remove_unused_columns`: True
- `label_names`: None
- `load_best_model_at_end`: False
- `ignore_data_skip`: False
- `fsdp`: []
- `fsdp_min_num_params`: 0
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
- `fsdp_transformer_layer_cls_to_wrap`: None
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
- `deepspeed`: None
- `label_smoothing_factor`: 0.0
- `optim`: adamw_torch
- `optim_args`: None
- `adafactor`: False
- `group_by_length`: False
- `length_column_name`: length
- `ddp_find_unused_parameters`: None
- `ddp_bucket_cap_mb`: None
- `ddp_broadcast_buffers`: False
- `dataloader_pin_memory`: True
- `dataloader_persistent_workers`: False
- `skip_memory_metrics`: True
- `use_legacy_prediction_loop`: False
- `push_to_hub`: False
- `resume_from_checkpoint`: None
- `hub_model_id`: None
- `hub_strategy`: every_save
- `hub_private_repo`: False
- `hub_always_push`: False
- `gradient_checkpointing`: False
- `gradient_checkpointing_kwargs`: None
- `include_inputs_for_metrics`: False
- `eval_do_concat_batches`: True
- `fp16_backend`: auto
- `push_to_hub_model_id`: None
- `push_to_hub_organization`: None
- `mp_parameters`: 
- `auto_find_batch_size`: False
- `full_determinism`: False
- `torchdynamo`: None
- `ray_scope`: last
- `ddp_timeout`: 1800
- `torch_compile`: False
- `torch_compile_backend`: None
- `torch_compile_mode`: None
- `dispatch_batches`: None
- `split_batches`: None
- `include_tokens_per_second`: False
- `include_num_input_tokens_seen`: False
- `neftune_noise_alpha`: None
- `optim_target_modules`: None
- `batch_eval_metrics`: False
- `eval_on_start`: False
- `use_liger_kernel`: False
- `eval_use_gather_object`: False
- `prompts`: None
- `batch_sampler`: no_duplicates
- `multi_dataset_batch_sampler`: proportional

</details>

### Training Logs
| Epoch  | Step | Training Loss | Validation Loss |
|:------:|:----:|:-------------:|:---------------:|
| 0.0431 | 200  | 0.0372        | 0.0122          |
| 0.0862 | 400  | 0.0226        | 0.0162          |
| 0.1293 | 600  | 0.0305        | 0.0181          |
| 0.1724 | 800  | 0.0351        | 0.0205          |
| 0.2155 | 1000 | 0.0326        | 0.0171          |
| 0.2586 | 1200 | 0.0289        | 0.0156          |
| 0.3017 | 1400 | 0.028         | 0.0169          |
| 0.3448 | 1600 | 0.0273        | 0.0199          |
| 0.3878 | 1800 | 0.0216        | 0.0180          |
| 0.4309 | 2000 | 0.0252        | 0.0122          |
| 0.4740 | 2200 | 0.0213        | 0.0138          |
| 0.5171 | 2400 | 0.0254        | 0.0142          |
| 0.5602 | 2600 | 0.0202        | 0.0155          |
| 0.6033 | 2800 | 0.0168        | 0.0145          |
| 0.6464 | 3000 | 0.0176        | 0.0123          |
| 0.6895 | 3200 | 0.0212        | 0.0123          |
| 0.7326 | 3400 | 0.0166        | 0.0102          |
| 0.7757 | 3600 | 0.0181        | 0.0102          |
| 0.8188 | 3800 | 0.0158        | 0.0086          |
| 0.8619 | 4000 | 0.0151        | 0.0090          |
| 0.9050 | 4200 | 0.0134        | 0.0095          |
| 0.9481 | 4400 | 0.012         | 0.0093          |
| 0.9912 | 4600 | 0.0134        | 0.0090          |


### Framework Versions
- Python: 3.9.20
- Sentence Transformers: 3.3.1
- Transformers: 4.45.2
- PyTorch: 2.4.0+cu121
- Accelerate: 1.0.1
- Datasets: 3.0.0
- Tokenizers: 0.20.1

## Citation

### BibTeX

#### Sentence Transformers
```bibtex
@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}
```

#### MultipleNegativesRankingLoss
```bibtex
@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}
```

<!--
## Glossary

*Clearly define terms in order to be accessible across audiences.*
-->

<!--
## Model Card Authors

*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->

<!--
## Model Card Contact

*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
-->