pablosi commited on
Commit
19e428c
1 Parent(s): f5c4b0f

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 1024,
3
+ "pooling_mode_cls_token": true,
4
+ "pooling_mode_mean_tokens": false,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,1309 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - es
4
+ license: apache-2.0
5
+ tags:
6
+ - sentence-transformers
7
+ - sentence-similarity
8
+ - feature-extraction
9
+ - generated_from_trainer
10
+ - dataset_size:4221
11
+ - loss:MatryoshkaLoss
12
+ - loss:MultipleNegativesRankingLoss
13
+ base_model: BAAI/bge-m3
14
+ widget:
15
+ - source_sentence: ¿Cuál es la sede de la Organización establecida en virtud de la
16
+ Convención?
17
+ sentences:
18
+ - 'e Sanidad y Consumo para modificar, en el ámbito de sus respectivas
19
+
20
+ competencias, el contenido de los anexos de dicha
21
+
22
+ norma.
23
+
24
+ En su virtud, a propuesta de la Ministra de Agricultura,
25
+
26
+ Pesca y Alimentación y del Ministro de Sanidad y Consumo, dispongo:
27
+
28
+
29
+ Artículo único. _Modificación del anexo XI del Real_
30
+
31
+ _Decreto 3454/2000, de 22 de diciembre._
32
+
33
+
34
+ El anexo XI del Real Decreto 3454/2000, de 22 de
35
+
36
+ diciembre, por el que se establece y regula el Programa
37
+
38
+ Integral Coordinado de vigilancia y control de las encefalopatías espongiformes
39
+ transmisibles de los animales, se
40
+
41
+ sustituye por el que figura como anexo a esta Orden.
42
+
43
+
44
+ Disposición final única. _Entrada en vigor._
45
+
46
+
47
+ La presente Orden entrará en vigor el día siguiente al
48
+
49
+ de su publicación en el Boletín Oficial del Estado.
50
+
51
+
52
+ Madrid, 5 de octubre de 2007.–La Vicepresidenta Primera del Gobierno y Ministra
53
+ de la Presidencia, María
54
+
55
+ Teresa Fernández de la Vega Sanz.
56
+
57
+
58
+ |Asignaturas|Curso 1.º – horas|Curso 2.º – horas|Curso 3.º – horas|Curso 4.º –
59
+ horas|Curso 5.º – horas|Curso 6.º – horas|
60
+
61
+ |---|---|---|---|---|---|---|
62
+
63
+ |Piano . . . . . . . . . . . . . . . . Lenguaje . . . . . . . . . . . . . Conjunto
64
+ . . . . . . . . . . . . . Coro **. . . . . . . . . .'
65
+ - 'y recaudación de la tasa, reglamentando especialmente Tipo
66
+
67
+ los casinos de juego y el juego denominado «bingo», quedando Porción de base imponible
68
+ comprendida aplicable
69
+
70
+ eji consecuencia pendiente de concreta regulación el amplio entre pesetas
71
+
72
+ campo de juegos que, dentro de la característica genérica de Porcentaje
73
+
74
+ suerte, envite o azar, pueden desarrollarse en los demás locales,
75
+
76
+ instalaciones o recintos, tanto (como dice el artículo primero 0 v 300.000 000
77
+ ..................... ........................... 35
78
+
79
+ del Real Decreto cuatrocientos cuarenta y cuatro/mil novecien­ 300.000.001 y 600.000.000
80
+ .................................................... ... 42
81
+
82
+ tos setenta y siete, de once de marzo! a -través de la realiza­ Más de 600.000.000
83
+ .............................................................. 50
84
+
85
+ ción de actividades humanas, como mediante la utilización de
86
+
87
+ máquinas o aparatos automáticos.
88
+
89
+ El Real Decreto-ley nueve/mil novecientos ochenta, de veinti­
90
+
91
+ séis de septiembre, ha modificado el anteriormente citado dieci­ Dos. Cuotas fijas:
92
+
93
+ séis/mil novecientos setenta y siete, de veinticinco de febrero,
94
+
95
+
96
+ a) En los casos de explotación de máquinas o aparatos auto­
97
+
98
+
99
+ en cuanto a ios tipos t'
100
+ - 'ven-
101
+
102
+
103
+ la Prohibiciôn de las Armas Qufmicas. con el fin de lograr
104
+
105
+
106
+ ciôn.
107
+
108
+
109
+ el objeto y propôsito de la presente Convenciôn. asegurar
110
+
111
+ la aplicaciôn de sus disposiciones. entre ellas las relativas
112
+
113
+
114
+ Artfculo Viı'' _Medidas nacionales de aplicaci6n._ a la verificaciôn internacional
115
+ de su cumplimiento. y pro-
116
+
117
+
118
+ porcionar un foro para las consultas y la colaboraciôn
119
+
120
+
121
+ Obligaciones generales: entre los Estados Partes.
122
+
123
+
124
+ 2. Todos los Estados Partes en la presente Conven-
125
+
126
+
127
+ 1. Cada Estado Parte adoptara. de conformidad con ciôn seran miembros de la Organizaciôn.
128
+ Ninglln Estado
129
+
130
+ sus procedimientos constitucionales. las medidas nece- Parte sera privado de su
131
+ calidad de miembro de la Orga-
132
+
133
+ sarias para cumplir las obligaciones contrafdas en virtud nizaciôn.
134
+
135
+ de la presente Convenciôn. En particular: 3: ''La Organizaciôn tendra su sede
136
+ en La Haya. Reino
137
+
138
+
139
+ de los Pafses Bajos.
140
+
141
+
142
+ a) Prohibira a las personas ffsicas y jurfdicas que
143
+
144
+
145
+ 4. Por el presente artfculo. quedan establecidos
146
+
147
+
148
+ se encuentren el cualquier lugar de su territorio 0 en
149
+
150
+
151
+ como ôrganos de la Organizaciôn: la Conferencia de los
152
+
153
+
154
+ cualquier otro lugar bajo su jurisdicciôn. reconocido por
155
+
156
+
157
+ Estados Partes. el Consejo Ejecutivo y la Secretarfa Tac-
158
+
159
+
160
+ el'
161
+ - source_sentence: ¿En qué año y mes se aprobó la Ley general de Instrucción Pública?
162
+ sentences:
163
+ - 'I6n, 0 a la., adquıslci6n ymejol''a de D E LA'' G.O B E R N ACI 0 N
164
+
165
+ insta.laclol1es y elemeııtos para la producc16n y con§etyacl6n de
166
+
167
+ 1as traviesas, _ . _ÔRDEN_ _de_ 23 de _1uniO_ _de_ 1961 _1''or_ _la_ _que_ _se_
168
+ acıarcm 10#
169
+
170
+ Art. 2.° El restant~ 60 por'' 100 se entregarti .. a. la D1recc16n _articulos
171
+ ''segımdo_ _11_ _quinto_ _clel_ _DeC!Teto, cle_ 31 _de_ maııo
172
+
173
+ General de Montes, Caza y Pe.sca P1uvıaı para su Invel·s16n., aı _de_ _1957,_
174
+ sO,bre _cstabledmiento_ d.e _nUClla.s_ farmackı8.
175
+
176
+ tra.ves del Instltuto Forestal de Investlgac10nes y Experlencias, ''
177
+
178
+ en el dC$arroUo de un plan qulnquena.l, que, e.probado POl'' di· Ilustr~imoseiior:,
179
+
180
+
181
+ chıı. ''Dlreccl6n General,; abarque 108 e:ıtud1os necesar10s sobre
182
+
183
+ resl''sten<:ia. 1mpl''egnac.1ones, etc" de ıruı.derll8 Daclonıı.le& 0 exö- E1
184
+ Dcıereto de 31 de mayo de 195''1, POl'' eı que se cüctan nor·
185
+
186
+ t1cas de posible ap''lcacI611 paı''Q elaborartrııvlesa:., mas para cı e.5tablecim1euto
187
+ ''de nuevas fıı.1''lılaclıı.s, ~spone en
188
+
189
+
190
+ EIIniıtituto Forestat de !n\''estigaclones y ExperlenCıas vle- su'' ıırt!culo
191
+ segurido qııe cı lo~al en que se, pretımda emplazar
192
+
193
+ ne obl1~do a fac1l1tar gratultamente. en- un- perlocio de dleı estas, en eı momento
194
+ de hacerse la petlcl'
195
+ - 'u labor más intensa se
196
+
197
+
198
+ ya la Ley general de Instrucción Pública de nueve de septiem­
199
+
200
+
201
+ desarrolló en Oviedo, en cuya Universidad se licenció y doc­
202
+
203
+
204
+ bre de mil ochocientos cincuenta y siete, la Ley de Reorgani­
205
+
206
+
207
+ toró, y en la que ocupó, durante cuarenta años, la Cátedra de
208
+
209
+
210
+ zación del Consejo Nacional de Educación de quince de julio
211
+
212
+
213
+ Teología.
214
+
215
+
216
+ de mil novecientos cincuenta y dos y el Decreto mil seiscientos
217
+
218
+
219
+ Con su larga vida y sus amplios escritos, Feijoo llena casi
220
+
221
+
222
+ #### treinta y siete/mil novecientos cincuenta y nueve, de veinti­
223
+
224
+
225
+ todo el siglo XVIII español. Las Ciencias Naturales, la Filo­
226
+
227
+
228
+ trés de septiembre, se refieren a Centros docentes nó oficiales
229
+
230
+
231
+ sofía, la Literatura, la Lingüística, la Moral, las Artes, etcé­
232
+
233
+
234
+ autorizados y reconocidos sin distinción de modalidades de en­
235
+
236
+
237
+ tera, encuentran amplia resonancia en su obra en la cual se
238
+
239
+
240
+ señanza, es lo cierto que, en la de Enseñanzas Artísticas, como
241
+
242
+
243
+ atiende a toda la compleja problemática de su época, siendo
244
+
245
+
246
+ en algunas otras, estos preceptos legales no han tenido el
247
+
248
+
249
+ considerado la figura española más representativa de la prime­
250
+
251
+
252
+ adecuado desarrollo reglamentario que ahora se hace preciso
253
+
254
+
255
+ #### ra mitad del siglo XVIII'
256
+ - 'enido los artículos 36 y 37 y la disposición final tercera.
257
+
258
+ 4. Se modifica la disposición adicional primera, que queda redactada como sigue:
259
+
260
+
261
+ «Primera.
262
+
263
+
264
+
265
+ Excepcionalmente, cuando la aplicación de la ley afecte a inmuebles que
266
+
267
+
268
+
269
+ formen parte del patrimonio histórico, artístico, arquitectónico o arqueológico
270
+ de la
271
+
272
+ Comunidad Autónoma, los organismos competentes podrán, mediante una
273
+
274
+ resolución motivada, autorizar o no las modificaciones, de acuerdo con sus propios
275
+
276
+ criterios, con informe previo del órgano colegiado previsto en el artículo 35
277
+ de esta
278
+
279
+ ley.»
280
+
281
+
282
+ **Artículo 36.** _Modificación de la Ley 11/2002, de 10 de julio, de Juventud
283
+ de Castilla y_
284
+
285
+
286
+
287
+ _León._
288
+
289
+
290
+ 1. Se modifica el apartado 2 del artículo 6, que queda redactado como sigue:
291
+
292
+
293
+
294
+ «2. Para asegurar la correcta aplicación, eficacia y seguimiento de las
295
+
296
+
297
+ obligaciones, acciones y servicios a que hace referencia la presente ley, existirá
298
+ un
299
+
300
+ órgano colegiado de carácter asesor.»
301
+
302
+
303
+
304
+ 2. Se modifica el artículo 8, que queda redactado como sigue:
305
+
306
+
307
+ «Artículo 8. _Órgano colegiado de carácter asesor en materia de juventud._
308
+
309
+
310
+
311
+ 1. En la Administración de la Comunidad de Castilla y León existirá un órgano
312
+
313
+
314
+
315
+ colegiado de carácter asesor en materia '
316
+ - source_sentence: ¿Cuál es el propósito de establecer las instrucciones para la representación
317
+ de la Administración en la negociación colectiva con el personal laboral?
318
+ sentences:
319
+ - 'fas, que habrán de incorporar las
320
+
321
+ cuotas de amortización de las obras.
322
+
323
+ 4. Los concesionarios de la actividad de desalación que tengan inscritos sus derechos
324
+ en el Registro
325
+
326
+ de Aguas podrán participar en las operaciones de los
327
+
328
+ centros de intercambio de derechos de uso del agua.»
329
+
330
+
331
+
332
+ -----
333
+
334
+
335
+ 21854 Jueves 23 junio 2005 BOE núm. 149
336
+
337
+
338
+
339
+ Tres. El apartado 4 del artículo 25 queda redactado
340
+
341
+ en los siguientes términos:
342
+
343
+ «4. Las Confederaciones Hidrográficas emitirán informe previo, en el plazo y supuestos
344
+ que
345
+
346
+ reglamentariamente se determinen, sobre los actos
347
+
348
+ y planes que las Comunidades Autónomas hayan de
349
+
350
+ aprobar en el ejercicio de sus competencias, entre
351
+
352
+ otras, en materia de medio ambiente, ordenación
353
+
354
+ del territorio y urbanismo, espacios naturales,
355
+
356
+ pesca, montes, regadíos y obras públicas de interés
357
+
358
+ regional, siempre que tales actos y planes afecten al
359
+
360
+ régimen y aprovechamiento de las aguas continentales o a los usos permitidos en
361
+ terrenos de dominio
362
+
363
+ público hidráulico y en sus zonas de servidumbre y
364
+
365
+ policía, teniendo en cuenta a estos efectos lo previsto en la planificación hidráulica
366
+ y en las planificaciones sectoriales aprobadas por el Gobierno.
367
+
368
+ Cuando los actos o planes de las Comunidades
369
+
370
+ Au'
371
+ - 'blico de sus condiciones de trabajo, así como darles
372
+
373
+ validez y eficacia a los acuerdos alcanzados mediante su
374
+
375
+ aprobación expresa y formal, estableciendo las condiciones de trabajo para los
376
+ casos en que no se produzca
377
+
378
+ acuerdo en la negociación.
379
+
380
+ 4. Establecer las instrucciones a las que debe atenerse la representación de la
381
+ Administración de la comunidad en la negociación colectiva con el personal laboral.
382
+
383
+ 5. Establecer anualmente los criterios para la aplicación del régimen retributivo
384
+ del personal funcionario
385
+
386
+ público y del personal al servicio de la Administración de
387
+
388
+ la Comunidad Autónoma de Galicia.
389
+
390
+ 6. Determinar los intervalos de los niveles de puestos de trabajo que les corresponderán
391
+ a los cuerpos o
392
+
393
+ escalas del personal funcionario.
394
+
395
+ 7. Aprobar las medidas de racionalización de efectivos así como los incentivos
396
+ a la excedencia voluntaria,
397
+
398
+ regulada en el artículo 57.5.º, y a la jubilación anticipada.
399
+
400
+ 8. Aprobar la oferta de empleo público.
401
+
402
+ 9. Aprobar las normas de clasificación y las relaciones de puestos de trabajo
403
+ de la Administración y acordar
404
+
405
+ su publicación.
406
+
407
+
408
+
409
+ -----
410
+
411
+
412
+ BOE núm. 167 Viernes 11 julio 2008 30449
413
+
414
+
415
+
416
+ 10. Aprobar la adscripción de cuerpos o escalas a
417
+
418
+ una determinada c'
419
+ - " bueno del ............................, en .................., a ..... de .............\
420
+ \ de ...........\n\n_(Firma del Secretario/a)_\nVº.Bº.\nEl .........................\n\
421
+ \n### ANEXO IV\n\n Subvenciones para proyectos de obras de reparación o restitución\
422
+ \ de infraestructuras, equipamientos e instalaciones y servicios de titularidad\
423
+ \ municipal y de las mancomunidades, y a la red viaria de las diputaciones provinciales,\
424
+ \ dañados por las inundaciones contempladas en el Real Decreto-Ley 10/2007, de\
425
+ \ 19 de octubre.\n\n_LIQUIDACIONES DE LAS SUBVENCIONES_\n(importe en euros)\n\n\
426
+ Obra\n\nImporte de adjudicación Obras terminadas Fecha de\n\nNúcleo de terminación\n\
427
+ Entidad población de la obra\nNúmero Denominación\n\na) Total a) Total\n\nb) Subvención\
428
+ \ MAP b) Subvención MAP\n\na) a)\n\nb) b)\n\nDon/Doña ..........................................................\
429
+ \ en calidad de .........................................................................\n\
430
+ CERTIFICO: que según los documentos justificativos de la ejecución de las obras,\
431
+ \ éstas han sido terminadas con el importe y en la fecha que se han\nindicado\
432
+ \ anteriormente.\nY para que así conste, y para su remisión a la Dirección General\
433
+ \ de Cooperación Local del Ministerio de Admini"
434
+ - source_sentence: ¿Qué tipo de obras hidráulicas se busca regular mediante el establecimiento
435
+ de un marco general regulador?
436
+ sentences:
437
+ - 'ncias.
438
+
439
+
440
+
441
+ Se han registrado las incidencias que se detallan a continuación: __________________________
442
+
443
+ ______________________________________________________________________________
444
+
445
+ ______________________________________________________________________________
446
+
447
+ ______________________________________________________________________________
448
+
449
+
450
+ _Espacio para la firma_
451
+
452
+
453
+
454
+ Nombre y apellidos
455
+
456
+
457
+
458
+ Cargo
459
+
460
+
461
+ _Espacio para la firma de los representantes de las candidaturas_
462
+
463
+
464
+
465
+ Nombre y apellidos
466
+
467
+
468
+ Candidatura
469
+
470
+
471
+
472
+ Nombre y apellidos
473
+
474
+
475
+ Candidatura
476
+
477
+
478
+
479
+ Nombre y apellidos
480
+
481
+
482
+ Candidatura
483
+
484
+
485
+
486
+ -----
487
+
488
+
489
+ # BOLETÍN OFICIAL DEL ESTADO
490
+
491
+
492
+ **Núm. 77** **Viernes 31 de marzo de 2023** **Sec. I. Pág. 46564**
493
+
494
+
495
+
496
+ b) Modelo de acta a utilizar en caso de remisión de sobres de votación (sin las
497
+ urnas)
498
+
499
+ y certificados de inscripción en el censo electoral
500
+
501
+
502
+
503
+ MINISTERIO
504
+
505
+ DE ASUNTOS EXTERIORES, UNIÓN EUROPEA
506
+
507
+ Y COOPERACIÓN
508
+
509
+
510
+
511
+ EMBAJADA/CONSULADO GENERAL
512
+
513
+ DE ESPAÑA EN
514
+
515
+
516
+
517
+ **ACTA DE RECEPCIÓN EN LA OFICINA CONSULAR DE CARRERA DE DOCUMENTACIÓN**
518
+
519
+ **ELECTORAL REMITIDA DESDE EL CENTRO HABILITADO PARA DEPÓSITO DE VOTO EN URNA**
520
+
521
+ (Orden AUC de 28 de marzo de 2023)
522
+
523
+
524
+
525
+ En ______________________, a las __:__ horas del día __ de ________________ de
526
+ 20__, el/la J'
527
+ - '000209146757|32.898|
528
+
529
+ |9|6|18|0,000112408735|0,000144575987|0,000211827062|32.662|
530
+
531
+ |9|6|19|0,000113345687|0,000139307904|0,000201264183|32.150|
532
+
533
+ |9|6|20|0,000115888651|0,000132000039|0,000191407279|32.340|
534
+
535
+ |9|6|21|0,000134398747|0,000135403400|0,000195643678|33.133|
536
+
537
+ |9|6|22|0,000147899091|0,000128330323|0,000178671327|32.267|
538
+
539
+ |9|6|23|0,000132086082|0,000112255849|0,000143713253|29.518|
540
+
541
+ |9|6|24|0,000111907260|0,000099351433|0,000105678479|27.493|
542
+
543
+ |9|7|1|0,000092404838|0,000089742596|0,000077069270|26.075|
544
+
545
+ |9|7|2|0,000078472941|0,000083921614|0,000038664310|24.911|
546
+
547
+ |9|7|3|0,000071090397|0,000081231723|0,000027151940|24.165|
548
+
549
+ |9|7|4|0,000067353032|0,000080200060|0,000021447897|23.839|
550
+
551
+ |9|7|5|0,000065575619|0,000079787006|0,000020568841|23.847|
552
+
553
+ |9|7|6|0,000066139732|0,000082392750|0,000025391096|24.697|
554
+
555
+ |9|7|7|0,000072536990|0,000090886812|0,000025683205|26.974|
556
+
557
+ |9|7|8|0,000087224482|0,000107105007|0,000024130932|29.344|
558
+
559
+ |9|7|9|0,000094494057|0,000129584514|0,000088412381|30.679|
560
+
561
+ |9|7|10|0,000101086851|0,000152095401|0,000149138836|31.855|
562
+
563
+ |9|7|11|0,000107788354|0,000162918146|0,000201594512|32.657|
564
+
565
+ |9|7|12|0,000110707645|0,000167233450|0,000225304479|33.356|
566
+
567
+ |9|7|13|0,000115520428|0,0001'
568
+ - 'ato de concesión de construcción y explotación de obras hidráulicas, permitan
569
+ el
570
+
571
+ establecimiento de un marco general regulador de este
572
+
573
+ tipo de obras.
574
+
575
+ Al propio tiempo, resulta evidente la necesidad de
576
+
577
+ potenciar y apoyar a las Comunidades de Usuarios, a
578
+
579
+ fin de fomentar la participación y responsabilidad de los
580
+
581
+ diferentes protagonistas en la gestión del agua, y la conveniencia de aumentar
582
+ también el carácter participativo
583
+
584
+ de las Confederaciones Hidrográficas, con objeto de adecuar su régimen jurídico
585
+ a la jurisprudencia del Tribunal
586
+
587
+ Constitucional. Todo ello, sin perjuicio de fomentar, además, la colaboración
588
+ entre las distintas Administraciones
589
+
590
+ públicas competentes, teniendo en cuenta su especial
591
+
592
+ protagonismo en materia de ordenación del territorio,
593
+
594
+ usos del suelo y construcción y regulación de las obras
595
+
596
+ hidráulicas.
597
+
598
+ Todos estos objetivos, necesidades y demandas se
599
+
600
+ afrontan mediante el presente texto modificativo de la
601
+
602
+ Ley 29/1985, de forma que sin alterar sustantivamente
603
+
604
+ la legislación preexistente y manteniendo su espíritu
605
+
606
+ codificador, se dé respuesta a sus insuficiencias, a los
607
+
608
+ nuevos retos que exige la gestión del agua a las puertas
609
+
610
+ del siglo XXI, en concordancia con nuestra ple'
611
+ - source_sentence: ¿En qué subsistema de contabilidad se realizan las anotaciones
612
+ contables para la formalización de reintegros del presupuesto de gastos?
613
+ sentences:
614
+ - ' la columna de haber del concepto 51030 “Otros movimientos internos.
615
+
616
+ Formalización de ingresos por cuenta de relaciones internas”».
617
+
618
+
619
+ 2. El número 41) FRPG.995, de formalización de reintegros del presupuesto de gastos
620
+
621
+
622
+
623
+ (minora reconocimientos de obligaciones, propuestas de pago, ordenaciones de pago
624
+ y
625
+
626
+ realizaciones de pago). Ejercicio corriente, queda redactado en los términos siguientes:
627
+
628
+
629
+ «41.–) FRPG.995, de formalización de reintegros del presupuesto de gastos
630
+
631
+
632
+
633
+ (minora reconocimientos de obligaciones, propuestas de pago, ordenaciones de
634
+
635
+ pago y realizaciones de pago). Ejercicio corriente. Las anotaciones contables
636
+ se
637
+
638
+
639
+
640
+ -----
641
+
642
+
643
+ # BOLETÍN OFICIAL DEL ESTADO
644
+
645
+
646
+ **Núm. 4** **Sábado 4 de enero de 2020** **Sec. I. Pág. 382**
647
+
648
+
649
+
650
+ realizan en los centros de gestión que expidieron las correspondientes propuestas
651
+
652
+ de reintegros y en las cajas pagadoras.
653
+
654
+
655
+ 41.1 En el subsistema de contabilidad patrimonial.
656
+
657
+
658
+
659
+ 41.1.1 En el centro de gestión que expidió la propuesta de reintegro. Por el
660
+
661
+
662
+
663
+ importe total íntegro del documento KRPG de referencia y de forma encadenada se
664
+
665
+ realizan los siguientes asientos con signo negativo:
666
+
667
+
668
+ a) Cargo, según proceda, a la subcuenta 40002 “Acreedores por obligaciones
669
+
670
+
671
+
672
+ rec'
673
+ - 'plina. En consecuencia,
674
+
675
+ resulta necesario contar con un marco específico de información reservada en esta
676
+
677
+ materia adecuado y suficiente para el correcto desarrollo de la referida función
678
+ de
679
+
680
+ supervisión, que viene a sustituir el contenido de la norma primera, así como
681
+ los anejos I
682
+
683
+ y II de la Circular 1/2009, de 18 de diciembre, del Banco de España.
684
+
685
+
686
+ Del mismo modo, los cambios normativos producidos desde la publicación de la
687
+
688
+
689
+
690
+ Circular 1/2009, de 18 de diciembre, del Banco de España hacen necesario derogar
691
+ la
692
+
693
+ norma segunda y el anejo III de dicha circular. En concreto, la disposición adicional
694
+
695
+ decimotercera de la Ley 26/2013, de 27 de diciembre, de cajas de ahorros y fundaciones
696
+
697
+ bancarias, establecía la amortización de las cuotas participativas emitidas por
698
+ las cajas de
699
+
700
+ ahorros, por lo que quedaban obsoletas las obligaciones de información sobre la
701
+ estructura
702
+
703
+ de cuotas participativas impuestas en la disposición transitoria tercera de la
704
+ Ley 10/2014,
705
+
706
+ de 26 de junio, de ordenación, supervisión y solvencia de entidades de crédito.
707
+
708
+
709
+ Por otro lado, en lo que se refiere a la inscripción en el Registro de Altos Cargos
710
+ y a
711
+
712
+ la remisión de información sobre los cargos que estos ostentan en ot'
713
+ - ' Subsecre-
714
+
715
+ Oficina de Control de Aproximación y Torre de Con­ taría de Aviación Civil.
716
+
717
+ ##### trol de Aeródromo de Tenerife-Norte. 5.2.6. Estación de Comunicaciones de
718
+ la ENA.
719
+
720
+
721
+ Segunda: Torres de Control de Aeródromo de Almería, 5.3. Tendrá consideración
722
+ de periférico, dependiendo de
723
+
724
+ ##### Sevilla, Alicante, lbiza, Gerona, Menorca, Valencia, San­ la Sección de
725
+ Telecomunicaciones Aeronáuticas, el
726
+
727
+ tiago, Bilbao, Zaragoza y Lanzarote. Centro de Retransmisión Automática de Madrid,
728
+ con
729
+
730
+ Tercera: Torres de Control de Aeródromo de Asturias, nivel orgánico de Sección.
731
+
732
+ Córdoba, Fuerteventura, Granada, Hierro, La Coruña, La Se estructurará en dos
733
+ Negociados:
734
+
735
+ Palma, Madrid-Cuatro Vientos, Melilla, Pampona,l Reus,
736
+
737
+ Sabadell, Santander, San Sebastián y Vigo. — Negociado de Comunicaciones Nacionales.
738
+
739
+
740
+ — Negociado de Comunicaciones Internacionales.
741
+
742
+
743
+ Cuando en un aeropuerto existen simultáneamente ofici­
744
+
745
+ ##### na de Control de Aproximación y Torre de Control de 6. Jefaturas de Mantenimiento,
746
+ enclavadas en los aeropuer­
747
+
748
+ Aeródromo, la Jefatura es conjunta. tos y Centros de Control en que presten servicio,
749
+ depen­
750
+
751
+ Las de categoría primera y segunda con nivel orgánico diendo orgánicamente de
752
+ la Subdirecci'
753
+ datasets:
754
+ - pablosi/boe-data-sintetic
755
+ pipeline_tag: sentence-similarity
756
+ library_name: sentence-transformers
757
+ metrics:
758
+ - cosine_accuracy@1
759
+ - cosine_accuracy@3
760
+ - cosine_accuracy@5
761
+ - cosine_accuracy@10
762
+ - cosine_precision@1
763
+ - cosine_precision@3
764
+ - cosine_precision@5
765
+ - cosine_precision@10
766
+ - cosine_recall@1
767
+ - cosine_recall@3
768
+ - cosine_recall@5
769
+ - cosine_recall@10
770
+ - cosine_ndcg@10
771
+ - cosine_mrr@10
772
+ - cosine_map@100
773
+ model-index:
774
+ - name: BGE large Legal Spanish Spa Law QA
775
+ results:
776
+ - task:
777
+ type: information-retrieval
778
+ name: Information Retrieval
779
+ dataset:
780
+ name: dim 1024
781
+ type: dim_1024
782
+ metrics:
783
+ - type: cosine_accuracy@1
784
+ value: 0.08747044917257683
785
+ name: Cosine Accuracy@1
786
+ - type: cosine_accuracy@3
787
+ value: 0.7494089834515366
788
+ name: Cosine Accuracy@3
789
+ - type: cosine_accuracy@5
790
+ value: 0.8226950354609929
791
+ name: Cosine Accuracy@5
792
+ - type: cosine_accuracy@10
793
+ value: 0.8888888888888888
794
+ name: Cosine Accuracy@10
795
+ - type: cosine_precision@1
796
+ value: 0.08747044917257683
797
+ name: Cosine Precision@1
798
+ - type: cosine_precision@3
799
+ value: 0.24980299448384552
800
+ name: Cosine Precision@3
801
+ - type: cosine_precision@5
802
+ value: 0.16453900709219857
803
+ name: Cosine Precision@5
804
+ - type: cosine_precision@10
805
+ value: 0.08888888888888888
806
+ name: Cosine Precision@10
807
+ - type: cosine_recall@1
808
+ value: 0.08747044917257683
809
+ name: Cosine Recall@1
810
+ - type: cosine_recall@3
811
+ value: 0.7494089834515366
812
+ name: Cosine Recall@3
813
+ - type: cosine_recall@5
814
+ value: 0.8226950354609929
815
+ name: Cosine Recall@5
816
+ - type: cosine_recall@10
817
+ value: 0.8888888888888888
818
+ name: Cosine Recall@10
819
+ - type: cosine_ndcg@10
820
+ value: 0.5557923762786463
821
+ name: Cosine Ndcg@10
822
+ - type: cosine_mrr@10
823
+ value: 0.442789598108747
824
+ name: Cosine Mrr@10
825
+ - type: cosine_map@100
826
+ value: 0.44693713228151144
827
+ name: Cosine Map@100
828
+ - task:
829
+ type: information-retrieval
830
+ name: Information Retrieval
831
+ dataset:
832
+ name: dim 768
833
+ type: dim_768
834
+ metrics:
835
+ - type: cosine_accuracy@1
836
+ value: 0.09456264775413711
837
+ name: Cosine Accuracy@1
838
+ - type: cosine_accuracy@3
839
+ value: 0.7328605200945626
840
+ name: Cosine Accuracy@3
841
+ - type: cosine_accuracy@5
842
+ value: 0.8156028368794326
843
+ name: Cosine Accuracy@5
844
+ - type: cosine_accuracy@10
845
+ value: 0.8888888888888888
846
+ name: Cosine Accuracy@10
847
+ - type: cosine_precision@1
848
+ value: 0.09456264775413711
849
+ name: Cosine Precision@1
850
+ - type: cosine_precision@3
851
+ value: 0.24428684003152085
852
+ name: Cosine Precision@3
853
+ - type: cosine_precision@5
854
+ value: 0.16312056737588654
855
+ name: Cosine Precision@5
856
+ - type: cosine_precision@10
857
+ value: 0.08888888888888888
858
+ name: Cosine Precision@10
859
+ - type: cosine_recall@1
860
+ value: 0.09456264775413711
861
+ name: Cosine Recall@1
862
+ - type: cosine_recall@3
863
+ value: 0.7328605200945626
864
+ name: Cosine Recall@3
865
+ - type: cosine_recall@5
866
+ value: 0.8156028368794326
867
+ name: Cosine Recall@5
868
+ - type: cosine_recall@10
869
+ value: 0.8888888888888888
870
+ name: Cosine Recall@10
871
+ - type: cosine_ndcg@10
872
+ value: 0.5548355507079873
873
+ name: Cosine Ndcg@10
874
+ - type: cosine_mrr@10
875
+ value: 0.44204097714736
876
+ name: Cosine Mrr@10
877
+ - type: cosine_map@100
878
+ value: 0.4461566961770718
879
+ name: Cosine Map@100
880
+ ---
881
+
882
+ # BGE large Legal Spanish Spa Law QA
883
+
884
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3) on the [boe-data-sintetic](https://huggingface.co/datasets/pablosi/boe-data-sintetic) dataset. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
885
+
886
+ ## Model Details
887
+
888
+ ### Model Description
889
+ - **Model Type:** Sentence Transformer
890
+ - **Base model:** [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3) <!-- at revision 5617a9f61b028005a4858fdac845db406aefb181 -->
891
+ - **Maximum Sequence Length:** 8192 tokens
892
+ - **Output Dimensionality:** 1024 dimensions
893
+ - **Similarity Function:** Cosine Similarity
894
+ - **Training Dataset:**
895
+ - [boe-data-sintetic](https://huggingface.co/datasets/pablosi/boe-data-sintetic)
896
+ - **Language:** es
897
+ - **License:** apache-2.0
898
+
899
+ ### Model Sources
900
+
901
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
902
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
903
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
904
+
905
+ ### Full Model Architecture
906
+
907
+ ```
908
+ SentenceTransformer(
909
+ (0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
910
+ (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
911
+ (2): Normalize()
912
+ )
913
+ ```
914
+
915
+ ## Usage
916
+
917
+ ### Direct Usage (Sentence Transformers)
918
+
919
+ First install the Sentence Transformers library:
920
+
921
+ ```bash
922
+ pip install -U sentence-transformers
923
+ ```
924
+
925
+ Then you can load this model and run inference.
926
+ ```python
927
+ from sentence_transformers import SentenceTransformer
928
+
929
+ # Download from the 🤗 Hub
930
+ model = SentenceTransformer("pablosi/bge-m3-retrained")
931
+ # Run inference
932
+ sentences = [
933
+ '¿En qué subsistema de contabilidad se realizan las anotaciones contables para la formalización de reintegros del presupuesto de gastos?',
934
+ ' la columna de haber del concepto 51030 “Otros movimientos internos.\nFormalización de ingresos por cuenta de relaciones internas”».\n\n2. El número 41) FRPG.995, de formalización de reintegros del presupuesto de gastos\n\n\n(minora reconocimientos de obligaciones, propuestas de pago, ordenaciones de pago y\nrealizaciones de pago). Ejercicio corriente, queda redactado en los términos siguientes:\n\n«41.–) FRPG.995, de formalización de reintegros del presupuesto de gastos\n\n\n(minora reconocimientos de obligaciones, propuestas de pago, ordenaciones de\npago y realizaciones de pago). Ejercicio corriente. Las anotaciones contables se\n\n\n-----\n\n# BOLETÍN OFICIAL DEL ESTADO\n\n**Núm. 4** **Sábado 4 de enero de 2020** **Sec. I. Pág. 382**\n\n\nrealizan en los centros de gestión que expidieron las correspondientes propuestas\nde reintegros y en las cajas pagadoras.\n\n41.1 En el subsistema de contabilidad patrimonial.\n\n\n41.1.1 En el centro de gestión que expidió la propuesta de reintegro. Por el\n\n\nimporte total íntegro del documento KRPG de referencia y de forma encadenada se\nrealizan los siguientes asientos con signo negativo:\n\na) Cargo, según proceda, a la subcuenta 40002 “Acreedores por obligaciones\n\n\nrec',
935
+ ' Subsecre-\nOficina de Control de Aproximación y Torre de Con\xad taría de Aviación Civil.\n##### trol de Aeródromo de Tenerife-Norte. 5.2.6. Estación de Comunicaciones de la ENA.\n\nSegunda: Torres de Control de Aeródromo de Almería, 5.3. Tendrá consideración de periférico, dependiendo de\n##### Sevilla, Alicante, lbiza, Gerona, Menorca, Valencia, San\xad la Sección de Telecomunicaciones Aeronáuticas, el\ntiago, Bilbao, Zaragoza y Lanzarote. Centro de Retransmisión Automática de Madrid, con\nTercera: Torres de Control de Aeródromo de Asturias, nivel orgánico de Sección.\nCórdoba, Fuerteventura, Granada, Hierro, La Coruña, La Se estructurará en dos Negociados:\nPalma, Madrid-Cuatro Vientos, Melilla, Pampona,l Reus,\nSabadell, Santander, San Sebastián y Vigo. — Negociado de Comunicaciones Nacionales.\n\n— Negociado de Comunicaciones Internacionales.\n\nCuando en un aeropuerto existen simultáneamente ofici\xad\n##### na de Control de Aproximación y Torre de Control de 6. Jefaturas de Mantenimiento, enclavadas en los aeropuer\xad\nAeródromo, la Jefatura es conjunta. tos y Centros de Control en que presten servicio, depen\xad\nLas de categoría primera y segunda con nivel orgánico diendo orgánicamente de la Subdirecci',
936
+ ]
937
+ embeddings = model.encode(sentences)
938
+ print(embeddings.shape)
939
+ # [3, 1024]
940
+
941
+ # Get the similarity scores for the embeddings
942
+ similarities = model.similarity(embeddings, embeddings)
943
+ print(similarities.shape)
944
+ # [3, 3]
945
+ ```
946
+
947
+ <!--
948
+ ### Direct Usage (Transformers)
949
+
950
+ <details><summary>Click to see the direct usage in Transformers</summary>
951
+
952
+ </details>
953
+ -->
954
+
955
+ <!--
956
+ ### Downstream Usage (Sentence Transformers)
957
+
958
+ You can finetune this model on your own dataset.
959
+
960
+ <details><summary>Click to expand</summary>
961
+
962
+ </details>
963
+ -->
964
+
965
+ <!--
966
+ ### Out-of-Scope Use
967
+
968
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
969
+ -->
970
+
971
+ ## Evaluation
972
+
973
+ ### Metrics
974
+
975
+ #### Information Retrieval
976
+
977
+ * Datasets: `dim_1024` and `dim_768`
978
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
979
+
980
+ | Metric | dim_1024 | dim_768 |
981
+ |:--------------------|:-----------|:-----------|
982
+ | cosine_accuracy@1 | 0.0875 | 0.0946 |
983
+ | cosine_accuracy@3 | 0.7494 | 0.7329 |
984
+ | cosine_accuracy@5 | 0.8227 | 0.8156 |
985
+ | cosine_accuracy@10 | 0.8889 | 0.8889 |
986
+ | cosine_precision@1 | 0.0875 | 0.0946 |
987
+ | cosine_precision@3 | 0.2498 | 0.2443 |
988
+ | cosine_precision@5 | 0.1645 | 0.1631 |
989
+ | cosine_precision@10 | 0.0889 | 0.0889 |
990
+ | cosine_recall@1 | 0.0875 | 0.0946 |
991
+ | cosine_recall@3 | 0.7494 | 0.7329 |
992
+ | cosine_recall@5 | 0.8227 | 0.8156 |
993
+ | cosine_recall@10 | 0.8889 | 0.8889 |
994
+ | **cosine_ndcg@10** | **0.5558** | **0.5548** |
995
+ | cosine_mrr@10 | 0.4428 | 0.442 |
996
+ | cosine_map@100 | 0.4469 | 0.4462 |
997
+
998
+ <!--
999
+ ## Bias, Risks and Limitations
1000
+
1001
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
1002
+ -->
1003
+
1004
+ <!--
1005
+ ### Recommendations
1006
+
1007
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
1008
+ -->
1009
+
1010
+ ## Training Details
1011
+
1012
+ ### Training Dataset
1013
+
1014
+ #### boe-data-sintetic
1015
+
1016
+ * Dataset: [boe-data-sintetic](https://huggingface.co/datasets/pablosi/boe-data-sintetic) at [eccbec3](https://huggingface.co/datasets/pablosi/boe-data-sintetic/tree/eccbec3391f27cd7a9b93c22c53dc1bfbe420d79)
1017
+ * Size: 4,221 training samples
1018
+ * Columns: <code>question</code> and <code>context</code>
1019
+ * Approximate statistics based on the first 1000 samples:
1020
+ | | question | context |
1021
+ |:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
1022
+ | type | string | string |
1023
+ | details | <ul><li>min: 3 tokens</li><li>mean: 28.61 tokens</li><li>max: 65 tokens</li></ul> | <ul><li>min: 6 tokens</li><li>mean: 312.36 tokens</li><li>max: 837 tokens</li></ul> |
1024
+ * Samples:
1025
+ | question | context |
1026
+ |:-----------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
1027
+ | <code>¿Cuál es el carácter de la Jornada Escolar sobre el día Universal del Niño?</code> | <code>ica DE EDUCACION Y CIENCIA Segundo.—La Jornada Escolar sobre el día Universal del<br><br>Niño, que se considerará lectiva a todos los efectos, tendrá<br>carácter didáctico y conmemorativo y se celebrará con la parti­<br>cipación de toda la comunidad escolar.<br><br>###### 18723 dificaORDENla dede 146 dede abriljulio desobre1982convalidaciónpor la que sedelmotí­­ Tercero —La Inspección de Educación Básica del Estado orien­<br>_tulo_ _de_ _Profesor_ _de_ _Educación_ _Física_ _por_ _los_ _co­_ tará y supervisará la realización de las actividades que se<br>_rrespondientes_ _a_ _que_ _hace_ _referencia_ _el_ _artículo_ _5.º_ organicen de acuerdo con las instrucciones que señale la Direc­<br>_del_ _Real_ _Decreto_ _790/1981,_ _de_ _24_ _de_ _abril._ ción General de Educación Básica.<br><br>Cuarto.—La Constitución Española, la Declaración Universal<br><br>Ilustrísimo señor:<br><br>de los Derechos del Niño y los Pactos y Declaraciones Interna­<br><br>La Orden ministerial de 6 de abril de 1982 («Boletín Oficial cionales ratificados por España c...</code> |
1028
+ | <code>¿Cuál es el salario correspondiente al cargo de Oficial Administrativo de 2.ª?</code> | <code>e Administrativo de 2.ª, Jefe de Negociado 2.ª|133,45|<br>|Oficial Administrativo de 1.ª|133,43|<br>|Oficial Administrativo de 2.ª|133,43|<br>|Programador.|131,05|<br><br><br>-----<br><br></code> |
1029
+ | <code>¿Qué cambio se realiza en la denominación de la partida presupuestaria en la Comunidad Autónoma de Andalucía y Extremadura en el anexo?</code> | <code>ecir: K .. quedan afectados creditos,<br><br>Arqueo bruto de los barcos destinados ...».<br><br>Fecha Artículo 1.0 5, quinta y sexta líneas, donde dice: «... y 3.142,0<br>de entradaen vigor deDuración la t5tancia o mferiorIgual ~ur~ Superiora 5.000 aSuperior 10.000 a Extremadura ...millones a Extremadura ... )~. )), debe decir: «... y 3.142,0 millones de pesetas<br><br>## - a 3.000 TRB o ei~f:~or o ei~f~~r TRB En el anexo, Sección 21 -Ministerio de Agricultura, Pesca y<br>a 5.000 TRB a IO.COO TRB Alimentación, Servicio/Organismo 109- Instituto Nacional de Reforma<br><br>y Desarrollo Agrario. _<br><br>###### Períodos Comunidad Autónoma de Andalucía, donde dice: «89211090030<br><br>comple~ Ordenación y transformación de regadíos», debe decir: «89211090040<br>###### tos de Ordenación y transformación de regadíos».<br>1 enero veinti- Comunidad Autónoma de Extremadura, donde dice: «89211090030<br>de 1990 cuatro Ordenación y transformación de regadíos~), debe decir: «89211090040<br>horas o Ordenación y transformación de regadíos)).<br>fracción<br>sup...</code> |
1030
+ * Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
1031
+ ```json
1032
+ {
1033
+ "loss": "MultipleNegativesRankingLoss",
1034
+ "matryoshka_dims": [
1035
+ 1024,
1036
+ 768
1037
+ ],
1038
+ "matryoshka_weights": [
1039
+ 1,
1040
+ 1
1041
+ ],
1042
+ "n_dims_per_step": -1
1043
+ }
1044
+ ```
1045
+
1046
+ ### Evaluation Dataset
1047
+
1048
+ #### boe-data-sintetic
1049
+
1050
+ * Dataset: [boe-data-sintetic](https://huggingface.co/datasets/pablosi/boe-data-sintetic) at [eccbec3](https://huggingface.co/datasets/pablosi/boe-data-sintetic/tree/eccbec3391f27cd7a9b93c22c53dc1bfbe420d79)
1051
+ * Size: 4,221 evaluation samples
1052
+ * Columns: <code>question</code> and <code>context</code>
1053
+ * Approximate statistics based on the first 1000 samples:
1054
+ | | question | context |
1055
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
1056
+ | type | string | string |
1057
+ | details | <ul><li>min: 3 tokens</li><li>mean: 27.84 tokens</li><li>max: 61 tokens</li></ul> | <ul><li>min: 31 tokens</li><li>mean: 325.91 tokens</li><li>max: 932 tokens</li></ul> |
1058
+ * Samples:
1059
+ | question | context |
1060
+ |:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
1061
+ | <code>¿Cuál es el motivo por el que el Gobierno del Reino de España considera que la Declaración del Gobierno de la República Islámica de Pakistán es incompatible con el objeto y el fin del Pacto?</code> | <code>stado constituye una reserva.<br>El Gobierno del Reino de España considera que la<br>Declaración del Gobierno de la República Islámica de<br>Pakistán mediante la cual subordina la aplicación de las<br>disposiciones del Pacto a las disposiciones de la constitución de la República Islámica de Pakistán constituye una<br>reserva que pretende limitar los efectos jurídicos del<br>Pacto en su aplicación a la República Islámica de Pakistán.<br>Una reserva que contiene una referencia general al derecho interno, sin precisar su contenido, no permite determinar con claridad en qué medida la República Islámica<br>de Pakistán ha aceptado las obligaciones derivadas del<br>Pacto y, en consecuencia, suscita dudas sobre el compromiso de la República Islámica de Pakistán con el objeto y<br>el fin del Pacto .<br>El Gobierno del Reino de España considera que la<br>Declaración del Gobierno de la República islámica de<br>Pakistán mediante la cual subordina las obligaciones derivadas del Pacto Internacional de Derechos Económicos,<br>Sociales y Cult...</code> |
1062
+ | <code>¿Qué Plan de Reestructuración se aprobó por Decreto seiscientos noventa y cuatro/mil novecientos setenta y cinco, de Tres de abril?</code> | <code>ro, y el apartado b) de este mismo<br>cuotas específicas de carácter social ya establecidas puedan punto, artículo y Decreto, modificado por el Decreto tres mil<br>ser recaudadas en periodo ejecutivo por la vía administrativa cuarenta y nueve/mil novecientos setenta y uno, de veinticinco<br>de apremio, habida cuenta, por lo demás, del precedente exis­ de noviembre, por los que se desarrolla la Ley setenta y ocho/<br>tente en favor del Plan de Reestructuración de la Industria mil novecientos sesenta y ocho, de cinco de diciembre, queda­<br>Textil Lanera, aprobado por Decreto seiscientos noventa y cua­ rán redactados en la forma siguiente:<br>tro/mil novecientos setenta y cinco, de Tres de abril.<br><br>«Artículo dieciocho.—Dos. a) En los empleos de Capitán de<br><br>En su virtud, a propuesta de los Ministros de Hacienda, Tra­<br><br>Navio y asimilados comprenderá a todos los cumplidos de con­<br><br>bajo e Industria, con el informe favorable de las Comisiones<br><br>diciones generales y específicas. Caso de que este número no<br><br>Gestor...</code> |
1063
+ | <code>¿Cuál es la modalidad de pesca asignada a los buques censados en las modalidades mencionadas en el texto?</code> | <code>a Pérez. FE-2-2810 Camariñas Palangre de fondo.<br>E: Lnngitud 44~ 8' N~ latitud 8" 28' W. Nuevo Balbino. FE-2-2677 Finisterre _ Palangre de fondo.<br>F: Longitud 44' 8' N, latitud 8' 37' W. Nuevo Hermanos<br>G: Longitud 44" S' N, latitud 8" 37' W. Casina. FE-2-2954 Burela. Volanta.<br>H: Longitud 44' 5' N, latitud 8' 48' W. Nuevo Hermanos<br><br>Fraga. FE-2-2731 Burela. Volanta.<br><br> - Ql;leda reservada en forma exclusiva para el ejercicio de la pesca con Nuevo Jaime Balmes ST-3-1718 Cedeira. Volanta.<br>aparejos de palangre de fondo y artes de enmalle fijo de fondo, para Nuevo José Antonio. FE-3-1740 Cedeira. Volanta.<br>##### . buques censados en las citadas modalidades y con base oficialmente Nuevo Lozano. r Cü-3-1519 Cedeira. Volanta.<br><br><br>-----<br><br>10784 Martes 31 marzo 1992 BüE núm. 78 .,.<br><br>|Nombre dd buque|Matricula|Puerto base:|Modalidad|<br>|---|---|---|---|<br>|Vamos Indo 5. Vigo Blanco. Vulcano 11.|CQ..7-3447 CO-4-1754 Cü-4-1425|Camelle. Muxia. Camariñas|Palangre de fondo. Palangre de fondo. Palangre de fondo....</code> |
1064
+ * Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
1065
+ ```json
1066
+ {
1067
+ "loss": "MultipleNegativesRankingLoss",
1068
+ "matryoshka_dims": [
1069
+ 1024,
1070
+ 768
1071
+ ],
1072
+ "matryoshka_weights": [
1073
+ 1,
1074
+ 1
1075
+ ],
1076
+ "n_dims_per_step": -1
1077
+ }
1078
+ ```
1079
+
1080
+ ### Training Hyperparameters
1081
+ #### Non-Default Hyperparameters
1082
+
1083
+ - `eval_strategy`: steps
1084
+ - `per_device_train_batch_size`: 32
1085
+ - `per_device_eval_batch_size`: 32
1086
+ - `gradient_accumulation_steps`: 8
1087
+ - `learning_rate`: 3e-05
1088
+ - `weight_decay`: 0.01
1089
+ - `num_train_epochs`: 12
1090
+ - `lr_scheduler_type`: cosine
1091
+ - `warmup_ratio`: 0.15
1092
+ - `bf16`: True
1093
+ - `tf32`: True
1094
+ - `dataloader_num_workers`: 4
1095
+ - `load_best_model_at_end`: True
1096
+ - `optim`: adamw_torch_fused
1097
+ - `gradient_checkpointing`: True
1098
+ - `batch_sampler`: no_duplicates
1099
+
1100
+ #### All Hyperparameters
1101
+ <details><summary>Click to expand</summary>
1102
+
1103
+ - `overwrite_output_dir`: False
1104
+ - `do_predict`: False
1105
+ - `eval_strategy`: steps
1106
+ - `prediction_loss_only`: True
1107
+ - `per_device_train_batch_size`: 32
1108
+ - `per_device_eval_batch_size`: 32
1109
+ - `per_gpu_train_batch_size`: None
1110
+ - `per_gpu_eval_batch_size`: None
1111
+ - `gradient_accumulation_steps`: 8
1112
+ - `eval_accumulation_steps`: None
1113
+ - `torch_empty_cache_steps`: None
1114
+ - `learning_rate`: 3e-05
1115
+ - `weight_decay`: 0.01
1116
+ - `adam_beta1`: 0.9
1117
+ - `adam_beta2`: 0.999
1118
+ - `adam_epsilon`: 1e-08
1119
+ - `max_grad_norm`: 1.0
1120
+ - `num_train_epochs`: 12
1121
+ - `max_steps`: -1
1122
+ - `lr_scheduler_type`: cosine
1123
+ - `lr_scheduler_kwargs`: {}
1124
+ - `warmup_ratio`: 0.15
1125
+ - `warmup_steps`: 0
1126
+ - `log_level`: passive
1127
+ - `log_level_replica`: warning
1128
+ - `log_on_each_node`: True
1129
+ - `logging_nan_inf_filter`: True
1130
+ - `save_safetensors`: True
1131
+ - `save_on_each_node`: False
1132
+ - `save_only_model`: False
1133
+ - `restore_callback_states_from_checkpoint`: False
1134
+ - `no_cuda`: False
1135
+ - `use_cpu`: False
1136
+ - `use_mps_device`: False
1137
+ - `seed`: 42
1138
+ - `data_seed`: None
1139
+ - `jit_mode_eval`: False
1140
+ - `use_ipex`: False
1141
+ - `bf16`: True
1142
+ - `fp16`: False
1143
+ - `fp16_opt_level`: O1
1144
+ - `half_precision_backend`: auto
1145
+ - `bf16_full_eval`: False
1146
+ - `fp16_full_eval`: False
1147
+ - `tf32`: True
1148
+ - `local_rank`: 0
1149
+ - `ddp_backend`: None
1150
+ - `tpu_num_cores`: None
1151
+ - `tpu_metrics_debug`: False
1152
+ - `debug`: []
1153
+ - `dataloader_drop_last`: False
1154
+ - `dataloader_num_workers`: 4
1155
+ - `dataloader_prefetch_factor`: None
1156
+ - `past_index`: -1
1157
+ - `disable_tqdm`: False
1158
+ - `remove_unused_columns`: True
1159
+ - `label_names`: None
1160
+ - `load_best_model_at_end`: True
1161
+ - `ignore_data_skip`: False
1162
+ - `fsdp`: []
1163
+ - `fsdp_min_num_params`: 0
1164
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
1165
+ - `fsdp_transformer_layer_cls_to_wrap`: None
1166
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
1167
+ - `deepspeed`: None
1168
+ - `label_smoothing_factor`: 0.0
1169
+ - `optim`: adamw_torch_fused
1170
+ - `optim_args`: None
1171
+ - `adafactor`: False
1172
+ - `group_by_length`: False
1173
+ - `length_column_name`: length
1174
+ - `ddp_find_unused_parameters`: None
1175
+ - `ddp_bucket_cap_mb`: None
1176
+ - `ddp_broadcast_buffers`: False
1177
+ - `dataloader_pin_memory`: True
1178
+ - `dataloader_persistent_workers`: False
1179
+ - `skip_memory_metrics`: True
1180
+ - `use_legacy_prediction_loop`: False
1181
+ - `push_to_hub`: False
1182
+ - `resume_from_checkpoint`: None
1183
+ - `hub_model_id`: None
1184
+ - `hub_strategy`: every_save
1185
+ - `hub_private_repo`: False
1186
+ - `hub_always_push`: False
1187
+ - `gradient_checkpointing`: True
1188
+ - `gradient_checkpointing_kwargs`: None
1189
+ - `include_inputs_for_metrics`: False
1190
+ - `include_for_metrics`: []
1191
+ - `eval_do_concat_batches`: True
1192
+ - `fp16_backend`: auto
1193
+ - `push_to_hub_model_id`: None
1194
+ - `push_to_hub_organization`: None
1195
+ - `mp_parameters`:
1196
+ - `auto_find_batch_size`: False
1197
+ - `full_determinism`: False
1198
+ - `torchdynamo`: None
1199
+ - `ray_scope`: last
1200
+ - `ddp_timeout`: 1800
1201
+ - `torch_compile`: False
1202
+ - `torch_compile_backend`: None
1203
+ - `torch_compile_mode`: None
1204
+ - `dispatch_batches`: None
1205
+ - `split_batches`: None
1206
+ - `include_tokens_per_second`: False
1207
+ - `include_num_input_tokens_seen`: False
1208
+ - `neftune_noise_alpha`: None
1209
+ - `optim_target_modules`: None
1210
+ - `batch_eval_metrics`: False
1211
+ - `eval_on_start`: False
1212
+ - `use_liger_kernel`: False
1213
+ - `eval_use_gather_object`: False
1214
+ - `average_tokens_across_devices`: False
1215
+ - `prompts`: None
1216
+ - `batch_sampler`: no_duplicates
1217
+ - `multi_dataset_batch_sampler`: proportional
1218
+
1219
+ </details>
1220
+
1221
+ ### Training Logs
1222
+ | Epoch | Step | Training Loss | Validation Loss | dim_1024_cosine_ndcg@10 | dim_768_cosine_ndcg@10 |
1223
+ |:----------:|:------:|:-------------:|:---------------:|:-----------------------:|:----------------------:|
1224
+ | 0.6723 | 10 | 0.987 | - | - | - |
1225
+ | 1.3529 | 20 | 0.452 | - | - | - |
1226
+ | 2.0336 | 30 | 0.2283 | - | - | - |
1227
+ | 2.7059 | 40 | 0.0941 | - | - | - |
1228
+ | **3.3866** | **50** | **0.0624** | **0.1497** | **0.5937** | **0.5904** |
1229
+ | 4.0672 | 60 | 0.0381 | - | - | - |
1230
+ | 4.7395 | 70 | 0.0235 | - | - | - |
1231
+ | 5.4202 | 80 | 0.0204 | - | - | - |
1232
+ | 6.1008 | 90 | 0.0171 | - | - | - |
1233
+ | 6.7731 | 100 | 0.0085 | 0.1949 | 0.5714 | 0.5642 |
1234
+ | 7.4538 | 110 | 0.0107 | - | - | - |
1235
+ | 8.1345 | 120 | 0.0087 | - | - | - |
1236
+ | 8.8067 | 130 | 0.0049 | - | - | - |
1237
+ | 9.4874 | 140 | 0.0073 | - | - | - |
1238
+ | 10.1681 | 150 | 0.0074 | 0.2107 | 0.5558 | 0.5548 |
1239
+ | 10.8403 | 160 | 0.0047 | - | - | - |
1240
+
1241
+ * The bold row denotes the saved checkpoint.
1242
+
1243
+ ### Framework Versions
1244
+ - Python: 3.10.14
1245
+ - Sentence Transformers: 3.3.0
1246
+ - Transformers: 4.46.2
1247
+ - PyTorch: 2.2.2
1248
+ - Accelerate: 1.1.1
1249
+ - Datasets: 3.1.0
1250
+ - Tokenizers: 0.20.3
1251
+
1252
+ ## Citation
1253
+
1254
+ ### BibTeX
1255
+
1256
+ #### Sentence Transformers
1257
+ ```bibtex
1258
+ @inproceedings{reimers-2019-sentence-bert,
1259
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
1260
+ author = "Reimers, Nils and Gurevych, Iryna",
1261
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
1262
+ month = "11",
1263
+ year = "2019",
1264
+ publisher = "Association for Computational Linguistics",
1265
+ url = "https://arxiv.org/abs/1908.10084",
1266
+ }
1267
+ ```
1268
+
1269
+ #### MatryoshkaLoss
1270
+ ```bibtex
1271
+ @misc{kusupati2024matryoshka,
1272
+ title={Matryoshka Representation Learning},
1273
+ author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
1274
+ year={2024},
1275
+ eprint={2205.13147},
1276
+ archivePrefix={arXiv},
1277
+ primaryClass={cs.LG}
1278
+ }
1279
+ ```
1280
+
1281
+ #### MultipleNegativesRankingLoss
1282
+ ```bibtex
1283
+ @misc{henderson2017efficient,
1284
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
1285
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
1286
+ year={2017},
1287
+ eprint={1705.00652},
1288
+ archivePrefix={arXiv},
1289
+ primaryClass={cs.CL}
1290
+ }
1291
+ ```
1292
+
1293
+ <!--
1294
+ ## Glossary
1295
+
1296
+ *Clearly define terms in order to be accessible across audiences.*
1297
+ -->
1298
+
1299
+ <!--
1300
+ ## Model Card Authors
1301
+
1302
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
1303
+ -->
1304
+
1305
+ <!--
1306
+ ## Model Card Contact
1307
+
1308
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
1309
+ -->
config.json ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "BAAI/bge-m3",
3
+ "architectures": [
4
+ "XLMRobertaModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "bos_token_id": 0,
8
+ "classifier_dropout": null,
9
+ "eos_token_id": 2,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 1024,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 4096,
15
+ "layer_norm_eps": 1e-05,
16
+ "max_position_embeddings": 8194,
17
+ "model_type": "xlm-roberta",
18
+ "num_attention_heads": 16,
19
+ "num_hidden_layers": 24,
20
+ "output_past": true,
21
+ "pad_token_id": 1,
22
+ "position_embedding_type": "absolute",
23
+ "torch_dtype": "float32",
24
+ "transformers_version": "4.46.2",
25
+ "type_vocab_size": 1,
26
+ "use_cache": true,
27
+ "vocab_size": 250002
28
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.3.0",
4
+ "transformers": "4.46.2",
5
+ "pytorch": "2.2.2"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:0b687558f38f1b255323f011be846c96d80e7a786ebe084cebe039a4f918f317
3
+ size 2271064456
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 8192,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:e4f7e21bec3fb0044ca0bb2d50eb5d4d8c596273c422baef84466d2c73748b9c
3
+ size 17083053
tokenizer_config.json ADDED
@@ -0,0 +1,55 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "mask_token": "<mask>",
49
+ "model_max_length": 8192,
50
+ "pad_token": "<pad>",
51
+ "sep_token": "</s>",
52
+ "sp_model_kwargs": {},
53
+ "tokenizer_class": "XLMRobertaTokenizer",
54
+ "unk_token": "<unk>"
55
+ }