Add new SentenceTransformer model
Browse files- .gitattributes +1 -0
- 1_Pooling/config.json +10 -0
- README.md +1309 -0
- config.json +28 -0
- config_sentence_transformers.json +10 -0
- model.safetensors +3 -0
- modules.json +20 -0
- sentence_bert_config.json +4 -0
- special_tokens_map.json +51 -0
- tokenizer.json +3 -0
- tokenizer_config.json +55 -0
.gitattributes
CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
|
|
33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
|
|
|
33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
36 |
+
tokenizer.json filter=lfs diff=lfs merge=lfs -text
|
1_Pooling/config.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"word_embedding_dimension": 1024,
|
3 |
+
"pooling_mode_cls_token": true,
|
4 |
+
"pooling_mode_mean_tokens": false,
|
5 |
+
"pooling_mode_max_tokens": false,
|
6 |
+
"pooling_mode_mean_sqrt_len_tokens": false,
|
7 |
+
"pooling_mode_weightedmean_tokens": false,
|
8 |
+
"pooling_mode_lasttoken": false,
|
9 |
+
"include_prompt": true
|
10 |
+
}
|
README.md
ADDED
@@ -0,0 +1,1309 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
language:
|
3 |
+
- es
|
4 |
+
license: apache-2.0
|
5 |
+
tags:
|
6 |
+
- sentence-transformers
|
7 |
+
- sentence-similarity
|
8 |
+
- feature-extraction
|
9 |
+
- generated_from_trainer
|
10 |
+
- dataset_size:4221
|
11 |
+
- loss:MatryoshkaLoss
|
12 |
+
- loss:MultipleNegativesRankingLoss
|
13 |
+
base_model: BAAI/bge-m3
|
14 |
+
widget:
|
15 |
+
- source_sentence: ¿Cuál es la sede de la Organización establecida en virtud de la
|
16 |
+
Convención?
|
17 |
+
sentences:
|
18 |
+
- 'e Sanidad y Consumo para modificar, en el ámbito de sus respectivas
|
19 |
+
|
20 |
+
competencias, el contenido de los anexos de dicha
|
21 |
+
|
22 |
+
norma.
|
23 |
+
|
24 |
+
En su virtud, a propuesta de la Ministra de Agricultura,
|
25 |
+
|
26 |
+
Pesca y Alimentación y del Ministro de Sanidad y Consumo, dispongo:
|
27 |
+
|
28 |
+
|
29 |
+
Artículo único. _Modificación del anexo XI del Real_
|
30 |
+
|
31 |
+
_Decreto 3454/2000, de 22 de diciembre._
|
32 |
+
|
33 |
+
|
34 |
+
El anexo XI del Real Decreto 3454/2000, de 22 de
|
35 |
+
|
36 |
+
diciembre, por el que se establece y regula el Programa
|
37 |
+
|
38 |
+
Integral Coordinado de vigilancia y control de las encefalopatías espongiformes
|
39 |
+
transmisibles de los animales, se
|
40 |
+
|
41 |
+
sustituye por el que figura como anexo a esta Orden.
|
42 |
+
|
43 |
+
|
44 |
+
Disposición final única. _Entrada en vigor._
|
45 |
+
|
46 |
+
|
47 |
+
La presente Orden entrará en vigor el día siguiente al
|
48 |
+
|
49 |
+
de su publicación en el Boletín Oficial del Estado.
|
50 |
+
|
51 |
+
|
52 |
+
Madrid, 5 de octubre de 2007.–La Vicepresidenta Primera del Gobierno y Ministra
|
53 |
+
de la Presidencia, María
|
54 |
+
|
55 |
+
Teresa Fernández de la Vega Sanz.
|
56 |
+
|
57 |
+
|
58 |
+
|Asignaturas|Curso 1.º – horas|Curso 2.º – horas|Curso 3.º – horas|Curso 4.º –
|
59 |
+
horas|Curso 5.º – horas|Curso 6.º – horas|
|
60 |
+
|
61 |
+
|---|---|---|---|---|---|---|
|
62 |
+
|
63 |
+
|Piano . . . . . . . . . . . . . . . . Lenguaje . . . . . . . . . . . . . Conjunto
|
64 |
+
. . . . . . . . . . . . . Coro **. . . . . . . . . .'
|
65 |
+
- 'y recaudación de la tasa, reglamentando especialmente Tipo
|
66 |
+
|
67 |
+
los casinos de juego y el juego denominado «bingo», quedando Porción de base imponible
|
68 |
+
comprendida aplicable
|
69 |
+
|
70 |
+
eji consecuencia pendiente de concreta regulación el amplio entre pesetas
|
71 |
+
|
72 |
+
campo de juegos que, dentro de la característica genérica de Porcentaje
|
73 |
+
|
74 |
+
suerte, envite o azar, pueden desarrollarse en los demás locales,
|
75 |
+
|
76 |
+
instalaciones o recintos, tanto (como dice el artículo primero 0 v 300.000 000
|
77 |
+
..................... ........................... 35
|
78 |
+
|
79 |
+
del Real Decreto cuatrocientos cuarenta y cuatro/mil novecien 300.000.001 y 600.000.000
|
80 |
+
.................................................... ... 42
|
81 |
+
|
82 |
+
tos setenta y siete, de once de marzo! a -través de la realiza Más de 600.000.000
|
83 |
+
.............................................................. 50
|
84 |
+
|
85 |
+
ción de actividades humanas, como mediante la utilización de
|
86 |
+
|
87 |
+
máquinas o aparatos automáticos.
|
88 |
+
|
89 |
+
El Real Decreto-ley nueve/mil novecientos ochenta, de veinti
|
90 |
+
|
91 |
+
séis de septiembre, ha modificado el anteriormente citado dieci Dos. Cuotas fijas:
|
92 |
+
|
93 |
+
séis/mil novecientos setenta y siete, de veinticinco de febrero,
|
94 |
+
|
95 |
+
|
96 |
+
a) En los casos de explotación de máquinas o aparatos auto
|
97 |
+
|
98 |
+
|
99 |
+
en cuanto a ios tipos t'
|
100 |
+
- 'ven-
|
101 |
+
|
102 |
+
|
103 |
+
la Prohibiciôn de las Armas Qufmicas. con el fin de lograr
|
104 |
+
|
105 |
+
|
106 |
+
ciôn.
|
107 |
+
|
108 |
+
|
109 |
+
el objeto y propôsito de la presente Convenciôn. asegurar
|
110 |
+
|
111 |
+
la aplicaciôn de sus disposiciones. entre ellas las relativas
|
112 |
+
|
113 |
+
|
114 |
+
Artfculo Viı'' _Medidas nacionales de aplicaci6n._ a la verificaciôn internacional
|
115 |
+
de su cumplimiento. y pro-
|
116 |
+
|
117 |
+
|
118 |
+
porcionar un foro para las consultas y la colaboraciôn
|
119 |
+
|
120 |
+
|
121 |
+
Obligaciones generales: entre los Estados Partes.
|
122 |
+
|
123 |
+
|
124 |
+
2. Todos los Estados Partes en la presente Conven-
|
125 |
+
|
126 |
+
|
127 |
+
1. Cada Estado Parte adoptara. de conformidad con ciôn seran miembros de la Organizaciôn.
|
128 |
+
Ninglln Estado
|
129 |
+
|
130 |
+
sus procedimientos constitucionales. las medidas nece- Parte sera privado de su
|
131 |
+
calidad de miembro de la Orga-
|
132 |
+
|
133 |
+
sarias para cumplir las obligaciones contrafdas en virtud nizaciôn.
|
134 |
+
|
135 |
+
de la presente Convenciôn. En particular: 3: ''La Organizaciôn tendra su sede
|
136 |
+
en La Haya. Reino
|
137 |
+
|
138 |
+
|
139 |
+
de los Pafses Bajos.
|
140 |
+
|
141 |
+
|
142 |
+
a) Prohibira a las personas ffsicas y jurfdicas que
|
143 |
+
|
144 |
+
|
145 |
+
4. Por el presente artfculo. quedan establecidos
|
146 |
+
|
147 |
+
|
148 |
+
se encuentren el cualquier lugar de su territorio 0 en
|
149 |
+
|
150 |
+
|
151 |
+
como ôrganos de la Organizaciôn: la Conferencia de los
|
152 |
+
|
153 |
+
|
154 |
+
cualquier otro lugar bajo su jurisdicciôn. reconocido por
|
155 |
+
|
156 |
+
|
157 |
+
Estados Partes. el Consejo Ejecutivo y la Secretarfa Tac-
|
158 |
+
|
159 |
+
|
160 |
+
el'
|
161 |
+
- source_sentence: ¿En qué año y mes se aprobó la Ley general de Instrucción Pública?
|
162 |
+
sentences:
|
163 |
+
- 'I6n, 0 a la., adquıslci6n ymejol''a de D E LA'' G.O B E R N ACI 0 N
|
164 |
+
|
165 |
+
insta.laclol1es y elemeııtos para la producc16n y con§etyacl6n de
|
166 |
+
|
167 |
+
1as traviesas, _ . _ÔRDEN_ _de_ 23 de _1uniO_ _de_ 1961 _1''or_ _la_ _que_ _se_
|
168 |
+
acıarcm 10#
|
169 |
+
|
170 |
+
Art. 2.° El restant~ 60 por'' 100 se entregarti .. a. la D1recc16n _articulos
|
171 |
+
''segımdo_ _11_ _quinto_ _clel_ _DeC!Teto, cle_ 31 _de_ maııo
|
172 |
+
|
173 |
+
General de Montes, Caza y Pe.sca P1uvıaı para su Invel·s16n., aı _de_ _1957,_
|
174 |
+
sO,bre _cstabledmiento_ d.e _nUClla.s_ farmackı8.
|
175 |
+
|
176 |
+
tra.ves del Instltuto Forestal de Investlgac10nes y Experlencias, ''
|
177 |
+
|
178 |
+
en el dC$arroUo de un plan qulnquena.l, que, e.probado POl'' di· Ilustr~imoseiior:,
|
179 |
+
|
180 |
+
|
181 |
+
chıı. ''Dlreccl6n General,; abarque 108 e:ıtud1os necesar10s sobre
|
182 |
+
|
183 |
+
resl''sten<:ia. 1mpl''egnac.1ones, etc" de ıruı.derll8 Daclonıı.le& 0 exö- E1
|
184 |
+
Dcıereto de 31 de mayo de 195''1, POl'' eı que se cüctan nor·
|
185 |
+
|
186 |
+
t1cas de posible ap''lcacI611 paı''Q elaborartrııvlesa:., mas para cı e.5tablecim1euto
|
187 |
+
''de nuevas fıı.1''lılaclıı.s, ~spone en
|
188 |
+
|
189 |
+
|
190 |
+
EIIniıtituto Forestat de !n\''estigaclones y ExperlenCıas vle- su'' ıırt!culo
|
191 |
+
segurido qııe cı lo~al en que se, pretımda emplazar
|
192 |
+
|
193 |
+
ne obl1~do a fac1l1tar gratultamente. en- un- perlocio de dleı estas, en eı momento
|
194 |
+
de hacerse la petlcl'
|
195 |
+
- 'u labor más intensa se
|
196 |
+
|
197 |
+
|
198 |
+
ya la Ley general de Instrucción Pública de nueve de septiem
|
199 |
+
|
200 |
+
|
201 |
+
desarrolló en Oviedo, en cuya Universidad se licenció y doc
|
202 |
+
|
203 |
+
|
204 |
+
bre de mil ochocientos cincuenta y siete, la Ley de Reorgani
|
205 |
+
|
206 |
+
|
207 |
+
toró, y en la que ocupó, durante cuarenta años, la Cátedra de
|
208 |
+
|
209 |
+
|
210 |
+
zación del Consejo Nacional de Educación de quince de julio
|
211 |
+
|
212 |
+
|
213 |
+
Teología.
|
214 |
+
|
215 |
+
|
216 |
+
de mil novecientos cincuenta y dos y el Decreto mil seiscientos
|
217 |
+
|
218 |
+
|
219 |
+
Con su larga vida y sus amplios escritos, Feijoo llena casi
|
220 |
+
|
221 |
+
|
222 |
+
#### treinta y siete/mil novecientos cincuenta y nueve, de veinti
|
223 |
+
|
224 |
+
|
225 |
+
todo el siglo XVIII español. Las Ciencias Naturales, la Filo
|
226 |
+
|
227 |
+
|
228 |
+
trés de septiembre, se refieren a Centros docentes nó oficiales
|
229 |
+
|
230 |
+
|
231 |
+
sofía, la Literatura, la Lingüística, la Moral, las Artes, etcé
|
232 |
+
|
233 |
+
|
234 |
+
autorizados y reconocidos sin distinción de modalidades de en
|
235 |
+
|
236 |
+
|
237 |
+
tera, encuentran amplia resonancia en su obra en la cual se
|
238 |
+
|
239 |
+
|
240 |
+
señanza, es lo cierto que, en la de Enseñanzas Artísticas, como
|
241 |
+
|
242 |
+
|
243 |
+
atiende a toda la compleja problemática de su época, siendo
|
244 |
+
|
245 |
+
|
246 |
+
en algunas otras, estos preceptos legales no han tenido el
|
247 |
+
|
248 |
+
|
249 |
+
considerado la figura española más representativa de la prime
|
250 |
+
|
251 |
+
|
252 |
+
adecuado desarrollo reglamentario que ahora se hace preciso
|
253 |
+
|
254 |
+
|
255 |
+
#### ra mitad del siglo XVIII'
|
256 |
+
- 'enido los artículos 36 y 37 y la disposición final tercera.
|
257 |
+
|
258 |
+
4. Se modifica la disposición adicional primera, que queda redactada como sigue:
|
259 |
+
|
260 |
+
|
261 |
+
«Primera.
|
262 |
+
|
263 |
+
|
264 |
+
|
265 |
+
Excepcionalmente, cuando la aplicación de la ley afecte a inmuebles que
|
266 |
+
|
267 |
+
|
268 |
+
|
269 |
+
formen parte del patrimonio histórico, artístico, arquitectónico o arqueológico
|
270 |
+
de la
|
271 |
+
|
272 |
+
Comunidad Autónoma, los organismos competentes podrán, mediante una
|
273 |
+
|
274 |
+
resolución motivada, autorizar o no las modificaciones, de acuerdo con sus propios
|
275 |
+
|
276 |
+
criterios, con informe previo del órgano colegiado previsto en el artículo 35
|
277 |
+
de esta
|
278 |
+
|
279 |
+
ley.»
|
280 |
+
|
281 |
+
|
282 |
+
**Artículo 36.** _Modificación de la Ley 11/2002, de 10 de julio, de Juventud
|
283 |
+
de Castilla y_
|
284 |
+
|
285 |
+
|
286 |
+
|
287 |
+
_León._
|
288 |
+
|
289 |
+
|
290 |
+
1. Se modifica el apartado 2 del artículo 6, que queda redactado como sigue:
|
291 |
+
|
292 |
+
|
293 |
+
|
294 |
+
«2. Para asegurar la correcta aplicación, eficacia y seguimiento de las
|
295 |
+
|
296 |
+
|
297 |
+
obligaciones, acciones y servicios a que hace referencia la presente ley, existirá
|
298 |
+
un
|
299 |
+
|
300 |
+
órgano colegiado de carácter asesor.»
|
301 |
+
|
302 |
+
|
303 |
+
|
304 |
+
2. Se modifica el artículo 8, que queda redactado como sigue:
|
305 |
+
|
306 |
+
|
307 |
+
«Artículo 8. _Órgano colegiado de carácter asesor en materia de juventud._
|
308 |
+
|
309 |
+
|
310 |
+
|
311 |
+
1. En la Administración de la Comunidad de Castilla y León existirá un órgano
|
312 |
+
|
313 |
+
|
314 |
+
|
315 |
+
colegiado de carácter asesor en materia '
|
316 |
+
- source_sentence: ¿Cuál es el propósito de establecer las instrucciones para la representación
|
317 |
+
de la Administración en la negociación colectiva con el personal laboral?
|
318 |
+
sentences:
|
319 |
+
- 'fas, que habrán de incorporar las
|
320 |
+
|
321 |
+
cuotas de amortización de las obras.
|
322 |
+
|
323 |
+
4. Los concesionarios de la actividad de desalación que tengan inscritos sus derechos
|
324 |
+
en el Registro
|
325 |
+
|
326 |
+
de Aguas podrán participar en las operaciones de los
|
327 |
+
|
328 |
+
centros de intercambio de derechos de uso del agua.»
|
329 |
+
|
330 |
+
|
331 |
+
|
332 |
+
-----
|
333 |
+
|
334 |
+
|
335 |
+
21854 Jueves 23 junio 2005 BOE núm. 149
|
336 |
+
|
337 |
+
|
338 |
+
|
339 |
+
Tres. El apartado 4 del artículo 25 queda redactado
|
340 |
+
|
341 |
+
en los siguientes términos:
|
342 |
+
|
343 |
+
«4. Las Confederaciones Hidrográficas emitirán informe previo, en el plazo y supuestos
|
344 |
+
que
|
345 |
+
|
346 |
+
reglamentariamente se determinen, sobre los actos
|
347 |
+
|
348 |
+
y planes que las Comunidades Autónomas hayan de
|
349 |
+
|
350 |
+
aprobar en el ejercicio de sus competencias, entre
|
351 |
+
|
352 |
+
otras, en materia de medio ambiente, ordenación
|
353 |
+
|
354 |
+
del territorio y urbanismo, espacios naturales,
|
355 |
+
|
356 |
+
pesca, montes, regadíos y obras públicas de interés
|
357 |
+
|
358 |
+
regional, siempre que tales actos y planes afecten al
|
359 |
+
|
360 |
+
régimen y aprovechamiento de las aguas continentales o a los usos permitidos en
|
361 |
+
terrenos de dominio
|
362 |
+
|
363 |
+
público hidráulico y en sus zonas de servidumbre y
|
364 |
+
|
365 |
+
policía, teniendo en cuenta a estos efectos lo previsto en la planificación hidráulica
|
366 |
+
y en las planificaciones sectoriales aprobadas por el Gobierno.
|
367 |
+
|
368 |
+
Cuando los actos o planes de las Comunidades
|
369 |
+
|
370 |
+
Au'
|
371 |
+
- 'blico de sus condiciones de trabajo, así como darles
|
372 |
+
|
373 |
+
validez y eficacia a los acuerdos alcanzados mediante su
|
374 |
+
|
375 |
+
aprobación expresa y formal, estableciendo las condiciones de trabajo para los
|
376 |
+
casos en que no se produzca
|
377 |
+
|
378 |
+
acuerdo en la negociación.
|
379 |
+
|
380 |
+
4. Establecer las instrucciones a las que debe atenerse la representación de la
|
381 |
+
Administración de la comunidad en la negociación colectiva con el personal laboral.
|
382 |
+
|
383 |
+
5. Establecer anualmente los criterios para la aplicación del régimen retributivo
|
384 |
+
del personal funcionario
|
385 |
+
|
386 |
+
público y del personal al servicio de la Administración de
|
387 |
+
|
388 |
+
la Comunidad Autónoma de Galicia.
|
389 |
+
|
390 |
+
6. Determinar los intervalos de los niveles de puestos de trabajo que les corresponderán
|
391 |
+
a los cuerpos o
|
392 |
+
|
393 |
+
escalas del personal funcionario.
|
394 |
+
|
395 |
+
7. Aprobar las medidas de racionalización de efectivos así como los incentivos
|
396 |
+
a la excedencia voluntaria,
|
397 |
+
|
398 |
+
regulada en el artículo 57.5.º, y a la jubilación anticipada.
|
399 |
+
|
400 |
+
8. Aprobar la oferta de empleo público.
|
401 |
+
|
402 |
+
9. Aprobar las normas de clasificación y las relaciones de puestos de trabajo
|
403 |
+
de la Administración y acordar
|
404 |
+
|
405 |
+
su publicación.
|
406 |
+
|
407 |
+
|
408 |
+
|
409 |
+
-----
|
410 |
+
|
411 |
+
|
412 |
+
BOE núm. 167 Viernes 11 julio 2008 30449
|
413 |
+
|
414 |
+
|
415 |
+
|
416 |
+
10. Aprobar la adscripción de cuerpos o escalas a
|
417 |
+
|
418 |
+
una determinada c'
|
419 |
+
- " bueno del ............................, en .................., a ..... de .............\
|
420 |
+
\ de ...........\n\n_(Firma del Secretario/a)_\nVº.Bº.\nEl .........................\n\
|
421 |
+
\n### ANEXO IV\n\n Subvenciones para proyectos de obras de reparación o restitución\
|
422 |
+
\ de infraestructuras, equipamientos e instalaciones y servicios de titularidad\
|
423 |
+
\ municipal y de las mancomunidades, y a la red viaria de las diputaciones provinciales,\
|
424 |
+
\ dañados por las inundaciones contempladas en el Real Decreto-Ley 10/2007, de\
|
425 |
+
\ 19 de octubre.\n\n_LIQUIDACIONES DE LAS SUBVENCIONES_\n(importe en euros)\n\n\
|
426 |
+
Obra\n\nImporte de adjudicación Obras terminadas Fecha de\n\nNúcleo de terminación\n\
|
427 |
+
Entidad población de la obra\nNúmero Denominación\n\na) Total a) Total\n\nb) Subvención\
|
428 |
+
\ MAP b) Subvención MAP\n\na) a)\n\nb) b)\n\nDon/Doña ..........................................................\
|
429 |
+
\ en calidad de .........................................................................\n\
|
430 |
+
CERTIFICO: que según los documentos justificativos de la ejecución de las obras,\
|
431 |
+
\ éstas han sido terminadas con el importe y en la fecha que se han\nindicado\
|
432 |
+
\ anteriormente.\nY para que así conste, y para su remisión a la Dirección General\
|
433 |
+
\ de Cooperación Local del Ministerio de Admini"
|
434 |
+
- source_sentence: ¿Qué tipo de obras hidráulicas se busca regular mediante el establecimiento
|
435 |
+
de un marco general regulador?
|
436 |
+
sentences:
|
437 |
+
- 'ncias.
|
438 |
+
|
439 |
+
|
440 |
+
|
441 |
+
Se han registrado las incidencias que se detallan a continuación: __________________________
|
442 |
+
|
443 |
+
______________________________________________________________________________
|
444 |
+
|
445 |
+
______________________________________________________________________________
|
446 |
+
|
447 |
+
______________________________________________________________________________
|
448 |
+
|
449 |
+
|
450 |
+
_Espacio para la firma_
|
451 |
+
|
452 |
+
|
453 |
+
|
454 |
+
Nombre y apellidos
|
455 |
+
|
456 |
+
|
457 |
+
|
458 |
+
Cargo
|
459 |
+
|
460 |
+
|
461 |
+
_Espacio para la firma de los representantes de las candidaturas_
|
462 |
+
|
463 |
+
|
464 |
+
|
465 |
+
Nombre y apellidos
|
466 |
+
|
467 |
+
|
468 |
+
Candidatura
|
469 |
+
|
470 |
+
|
471 |
+
|
472 |
+
Nombre y apellidos
|
473 |
+
|
474 |
+
|
475 |
+
Candidatura
|
476 |
+
|
477 |
+
|
478 |
+
|
479 |
+
Nombre y apellidos
|
480 |
+
|
481 |
+
|
482 |
+
Candidatura
|
483 |
+
|
484 |
+
|
485 |
+
|
486 |
+
-----
|
487 |
+
|
488 |
+
|
489 |
+
# BOLETÍN OFICIAL DEL ESTADO
|
490 |
+
|
491 |
+
|
492 |
+
**Núm. 77** **Viernes 31 de marzo de 2023** **Sec. I. Pág. 46564**
|
493 |
+
|
494 |
+
|
495 |
+
|
496 |
+
b) Modelo de acta a utilizar en caso de remisión de sobres de votación (sin las
|
497 |
+
urnas)
|
498 |
+
|
499 |
+
y certificados de inscripción en el censo electoral
|
500 |
+
|
501 |
+
|
502 |
+
|
503 |
+
MINISTERIO
|
504 |
+
|
505 |
+
DE ASUNTOS EXTERIORES, UNIÓN EUROPEA
|
506 |
+
|
507 |
+
Y COOPERACIÓN
|
508 |
+
|
509 |
+
|
510 |
+
|
511 |
+
EMBAJADA/CONSULADO GENERAL
|
512 |
+
|
513 |
+
DE ESPAÑA EN
|
514 |
+
|
515 |
+
|
516 |
+
|
517 |
+
**ACTA DE RECEPCIÓN EN LA OFICINA CONSULAR DE CARRERA DE DOCUMENTACIÓN**
|
518 |
+
|
519 |
+
**ELECTORAL REMITIDA DESDE EL CENTRO HABILITADO PARA DEPÓSITO DE VOTO EN URNA**
|
520 |
+
|
521 |
+
(Orden AUC de 28 de marzo de 2023)
|
522 |
+
|
523 |
+
|
524 |
+
|
525 |
+
En ______________________, a las __:__ horas del día __ de ________________ de
|
526 |
+
20__, el/la J'
|
527 |
+
- '000209146757|32.898|
|
528 |
+
|
529 |
+
|9|6|18|0,000112408735|0,000144575987|0,000211827062|32.662|
|
530 |
+
|
531 |
+
|9|6|19|0,000113345687|0,000139307904|0,000201264183|32.150|
|
532 |
+
|
533 |
+
|9|6|20|0,000115888651|0,000132000039|0,000191407279|32.340|
|
534 |
+
|
535 |
+
|9|6|21|0,000134398747|0,000135403400|0,000195643678|33.133|
|
536 |
+
|
537 |
+
|9|6|22|0,000147899091|0,000128330323|0,000178671327|32.267|
|
538 |
+
|
539 |
+
|9|6|23|0,000132086082|0,000112255849|0,000143713253|29.518|
|
540 |
+
|
541 |
+
|9|6|24|0,000111907260|0,000099351433|0,000105678479|27.493|
|
542 |
+
|
543 |
+
|9|7|1|0,000092404838|0,000089742596|0,000077069270|26.075|
|
544 |
+
|
545 |
+
|9|7|2|0,000078472941|0,000083921614|0,000038664310|24.911|
|
546 |
+
|
547 |
+
|9|7|3|0,000071090397|0,000081231723|0,000027151940|24.165|
|
548 |
+
|
549 |
+
|9|7|4|0,000067353032|0,000080200060|0,000021447897|23.839|
|
550 |
+
|
551 |
+
|9|7|5|0,000065575619|0,000079787006|0,000020568841|23.847|
|
552 |
+
|
553 |
+
|9|7|6|0,000066139732|0,000082392750|0,000025391096|24.697|
|
554 |
+
|
555 |
+
|9|7|7|0,000072536990|0,000090886812|0,000025683205|26.974|
|
556 |
+
|
557 |
+
|9|7|8|0,000087224482|0,000107105007|0,000024130932|29.344|
|
558 |
+
|
559 |
+
|9|7|9|0,000094494057|0,000129584514|0,000088412381|30.679|
|
560 |
+
|
561 |
+
|9|7|10|0,000101086851|0,000152095401|0,000149138836|31.855|
|
562 |
+
|
563 |
+
|9|7|11|0,000107788354|0,000162918146|0,000201594512|32.657|
|
564 |
+
|
565 |
+
|9|7|12|0,000110707645|0,000167233450|0,000225304479|33.356|
|
566 |
+
|
567 |
+
|9|7|13|0,000115520428|0,0001'
|
568 |
+
- 'ato de concesión de construcción y explotación de obras hidráulicas, permitan
|
569 |
+
el
|
570 |
+
|
571 |
+
establecimiento de un marco general regulador de este
|
572 |
+
|
573 |
+
tipo de obras.
|
574 |
+
|
575 |
+
Al propio tiempo, resulta evidente la necesidad de
|
576 |
+
|
577 |
+
potenciar y apoyar a las Comunidades de Usuarios, a
|
578 |
+
|
579 |
+
fin de fomentar la participación y responsabilidad de los
|
580 |
+
|
581 |
+
diferentes protagonistas en la gestión del agua, y la conveniencia de aumentar
|
582 |
+
también el carácter participativo
|
583 |
+
|
584 |
+
de las Confederaciones Hidrográficas, con objeto de adecuar su régimen jurídico
|
585 |
+
a la jurisprudencia del Tribunal
|
586 |
+
|
587 |
+
Constitucional. Todo ello, sin perjuicio de fomentar, además, la colaboración
|
588 |
+
entre las distintas Administraciones
|
589 |
+
|
590 |
+
públicas competentes, teniendo en cuenta su especial
|
591 |
+
|
592 |
+
protagonismo en materia de ordenación del territorio,
|
593 |
+
|
594 |
+
usos del suelo y construcción y regulación de las obras
|
595 |
+
|
596 |
+
hidráulicas.
|
597 |
+
|
598 |
+
Todos estos objetivos, necesidades y demandas se
|
599 |
+
|
600 |
+
afrontan mediante el presente texto modificativo de la
|
601 |
+
|
602 |
+
Ley 29/1985, de forma que sin alterar sustantivamente
|
603 |
+
|
604 |
+
la legislación preexistente y manteniendo su espíritu
|
605 |
+
|
606 |
+
codificador, se dé respuesta a sus insuficiencias, a los
|
607 |
+
|
608 |
+
nuevos retos que exige la gestión del agua a las puertas
|
609 |
+
|
610 |
+
del siglo XXI, en concordancia con nuestra ple'
|
611 |
+
- source_sentence: ¿En qué subsistema de contabilidad se realizan las anotaciones
|
612 |
+
contables para la formalización de reintegros del presupuesto de gastos?
|
613 |
+
sentences:
|
614 |
+
- ' la columna de haber del concepto 51030 “Otros movimientos internos.
|
615 |
+
|
616 |
+
Formalización de ingresos por cuenta de relaciones internas”».
|
617 |
+
|
618 |
+
|
619 |
+
2. El número 41) FRPG.995, de formalización de reintegros del presupuesto de gastos
|
620 |
+
|
621 |
+
|
622 |
+
|
623 |
+
(minora reconocimientos de obligaciones, propuestas de pago, ordenaciones de pago
|
624 |
+
y
|
625 |
+
|
626 |
+
realizaciones de pago). Ejercicio corriente, queda redactado en los términos siguientes:
|
627 |
+
|
628 |
+
|
629 |
+
«41.–) FRPG.995, de formalización de reintegros del presupuesto de gastos
|
630 |
+
|
631 |
+
|
632 |
+
|
633 |
+
(minora reconocimientos de obligaciones, propuestas de pago, ordenaciones de
|
634 |
+
|
635 |
+
pago y realizaciones de pago). Ejercicio corriente. Las anotaciones contables
|
636 |
+
se
|
637 |
+
|
638 |
+
|
639 |
+
|
640 |
+
-----
|
641 |
+
|
642 |
+
|
643 |
+
# BOLETÍN OFICIAL DEL ESTADO
|
644 |
+
|
645 |
+
|
646 |
+
**Núm. 4** **Sábado 4 de enero de 2020** **Sec. I. Pág. 382**
|
647 |
+
|
648 |
+
|
649 |
+
|
650 |
+
realizan en los centros de gestión que expidieron las correspondientes propuestas
|
651 |
+
|
652 |
+
de reintegros y en las cajas pagadoras.
|
653 |
+
|
654 |
+
|
655 |
+
41.1 En el subsistema de contabilidad patrimonial.
|
656 |
+
|
657 |
+
|
658 |
+
|
659 |
+
41.1.1 En el centro de gestión que expidió la propuesta de reintegro. Por el
|
660 |
+
|
661 |
+
|
662 |
+
|
663 |
+
importe total íntegro del documento KRPG de referencia y de forma encadenada se
|
664 |
+
|
665 |
+
realizan los siguientes asientos con signo negativo:
|
666 |
+
|
667 |
+
|
668 |
+
a) Cargo, según proceda, a la subcuenta 40002 “Acreedores por obligaciones
|
669 |
+
|
670 |
+
|
671 |
+
|
672 |
+
rec'
|
673 |
+
- 'plina. En consecuencia,
|
674 |
+
|
675 |
+
resulta necesario contar con un marco específico de información reservada en esta
|
676 |
+
|
677 |
+
materia adecuado y suficiente para el correcto desarrollo de la referida función
|
678 |
+
de
|
679 |
+
|
680 |
+
supervisión, que viene a sustituir el contenido de la norma primera, así como
|
681 |
+
los anejos I
|
682 |
+
|
683 |
+
y II de la Circular 1/2009, de 18 de diciembre, del Banco de España.
|
684 |
+
|
685 |
+
|
686 |
+
Del mismo modo, los cambios normativos producidos desde la publicación de la
|
687 |
+
|
688 |
+
|
689 |
+
|
690 |
+
Circular 1/2009, de 18 de diciembre, del Banco de España hacen necesario derogar
|
691 |
+
la
|
692 |
+
|
693 |
+
norma segunda y el anejo III de dicha circular. En concreto, la disposición adicional
|
694 |
+
|
695 |
+
decimotercera de la Ley 26/2013, de 27 de diciembre, de cajas de ahorros y fundaciones
|
696 |
+
|
697 |
+
bancarias, establecía la amortización de las cuotas participativas emitidas por
|
698 |
+
las cajas de
|
699 |
+
|
700 |
+
ahorros, por lo que quedaban obsoletas las obligaciones de información sobre la
|
701 |
+
estructura
|
702 |
+
|
703 |
+
de cuotas participativas impuestas en la disposición transitoria tercera de la
|
704 |
+
Ley 10/2014,
|
705 |
+
|
706 |
+
de 26 de junio, de ordenación, supervisión y solvencia de entidades de crédito.
|
707 |
+
|
708 |
+
|
709 |
+
Por otro lado, en lo que se refiere a la inscripción en el Registro de Altos Cargos
|
710 |
+
y a
|
711 |
+
|
712 |
+
la remisión de información sobre los cargos que estos ostentan en ot'
|
713 |
+
- ' Subsecre-
|
714 |
+
|
715 |
+
Oficina de Control de Aproximación y Torre de Con taría de Aviación Civil.
|
716 |
+
|
717 |
+
##### trol de Aeródromo de Tenerife-Norte. 5.2.6. Estación de Comunicaciones de
|
718 |
+
la ENA.
|
719 |
+
|
720 |
+
|
721 |
+
Segunda: Torres de Control de Aeródromo de Almería, 5.3. Tendrá consideración
|
722 |
+
de periférico, dependiendo de
|
723 |
+
|
724 |
+
##### Sevilla, Alicante, lbiza, Gerona, Menorca, Valencia, San la Sección de
|
725 |
+
Telecomunicaciones Aeronáuticas, el
|
726 |
+
|
727 |
+
tiago, Bilbao, Zaragoza y Lanzarote. Centro de Retransmisión Automática de Madrid,
|
728 |
+
con
|
729 |
+
|
730 |
+
Tercera: Torres de Control de Aeródromo de Asturias, nivel orgánico de Sección.
|
731 |
+
|
732 |
+
Córdoba, Fuerteventura, Granada, Hierro, La Coruña, La Se estructurará en dos
|
733 |
+
Negociados:
|
734 |
+
|
735 |
+
Palma, Madrid-Cuatro Vientos, Melilla, Pampona,l Reus,
|
736 |
+
|
737 |
+
Sabadell, Santander, San Sebastián y Vigo. — Negociado de Comunicaciones Nacionales.
|
738 |
+
|
739 |
+
|
740 |
+
— Negociado de Comunicaciones Internacionales.
|
741 |
+
|
742 |
+
|
743 |
+
Cuando en un aeropuerto existen simultáneamente ofici
|
744 |
+
|
745 |
+
##### na de Control de Aproximación y Torre de Control de 6. Jefaturas de Mantenimiento,
|
746 |
+
enclavadas en los aeropuer
|
747 |
+
|
748 |
+
Aeródromo, la Jefatura es conjunta. tos y Centros de Control en que presten servicio,
|
749 |
+
depen
|
750 |
+
|
751 |
+
Las de categoría primera y segunda con nivel orgánico diendo orgánicamente de
|
752 |
+
la Subdirecci'
|
753 |
+
datasets:
|
754 |
+
- pablosi/boe-data-sintetic
|
755 |
+
pipeline_tag: sentence-similarity
|
756 |
+
library_name: sentence-transformers
|
757 |
+
metrics:
|
758 |
+
- cosine_accuracy@1
|
759 |
+
- cosine_accuracy@3
|
760 |
+
- cosine_accuracy@5
|
761 |
+
- cosine_accuracy@10
|
762 |
+
- cosine_precision@1
|
763 |
+
- cosine_precision@3
|
764 |
+
- cosine_precision@5
|
765 |
+
- cosine_precision@10
|
766 |
+
- cosine_recall@1
|
767 |
+
- cosine_recall@3
|
768 |
+
- cosine_recall@5
|
769 |
+
- cosine_recall@10
|
770 |
+
- cosine_ndcg@10
|
771 |
+
- cosine_mrr@10
|
772 |
+
- cosine_map@100
|
773 |
+
model-index:
|
774 |
+
- name: BGE large Legal Spanish Spa Law QA
|
775 |
+
results:
|
776 |
+
- task:
|
777 |
+
type: information-retrieval
|
778 |
+
name: Information Retrieval
|
779 |
+
dataset:
|
780 |
+
name: dim 1024
|
781 |
+
type: dim_1024
|
782 |
+
metrics:
|
783 |
+
- type: cosine_accuracy@1
|
784 |
+
value: 0.08747044917257683
|
785 |
+
name: Cosine Accuracy@1
|
786 |
+
- type: cosine_accuracy@3
|
787 |
+
value: 0.7494089834515366
|
788 |
+
name: Cosine Accuracy@3
|
789 |
+
- type: cosine_accuracy@5
|
790 |
+
value: 0.8226950354609929
|
791 |
+
name: Cosine Accuracy@5
|
792 |
+
- type: cosine_accuracy@10
|
793 |
+
value: 0.8888888888888888
|
794 |
+
name: Cosine Accuracy@10
|
795 |
+
- type: cosine_precision@1
|
796 |
+
value: 0.08747044917257683
|
797 |
+
name: Cosine Precision@1
|
798 |
+
- type: cosine_precision@3
|
799 |
+
value: 0.24980299448384552
|
800 |
+
name: Cosine Precision@3
|
801 |
+
- type: cosine_precision@5
|
802 |
+
value: 0.16453900709219857
|
803 |
+
name: Cosine Precision@5
|
804 |
+
- type: cosine_precision@10
|
805 |
+
value: 0.08888888888888888
|
806 |
+
name: Cosine Precision@10
|
807 |
+
- type: cosine_recall@1
|
808 |
+
value: 0.08747044917257683
|
809 |
+
name: Cosine Recall@1
|
810 |
+
- type: cosine_recall@3
|
811 |
+
value: 0.7494089834515366
|
812 |
+
name: Cosine Recall@3
|
813 |
+
- type: cosine_recall@5
|
814 |
+
value: 0.8226950354609929
|
815 |
+
name: Cosine Recall@5
|
816 |
+
- type: cosine_recall@10
|
817 |
+
value: 0.8888888888888888
|
818 |
+
name: Cosine Recall@10
|
819 |
+
- type: cosine_ndcg@10
|
820 |
+
value: 0.5557923762786463
|
821 |
+
name: Cosine Ndcg@10
|
822 |
+
- type: cosine_mrr@10
|
823 |
+
value: 0.442789598108747
|
824 |
+
name: Cosine Mrr@10
|
825 |
+
- type: cosine_map@100
|
826 |
+
value: 0.44693713228151144
|
827 |
+
name: Cosine Map@100
|
828 |
+
- task:
|
829 |
+
type: information-retrieval
|
830 |
+
name: Information Retrieval
|
831 |
+
dataset:
|
832 |
+
name: dim 768
|
833 |
+
type: dim_768
|
834 |
+
metrics:
|
835 |
+
- type: cosine_accuracy@1
|
836 |
+
value: 0.09456264775413711
|
837 |
+
name: Cosine Accuracy@1
|
838 |
+
- type: cosine_accuracy@3
|
839 |
+
value: 0.7328605200945626
|
840 |
+
name: Cosine Accuracy@3
|
841 |
+
- type: cosine_accuracy@5
|
842 |
+
value: 0.8156028368794326
|
843 |
+
name: Cosine Accuracy@5
|
844 |
+
- type: cosine_accuracy@10
|
845 |
+
value: 0.8888888888888888
|
846 |
+
name: Cosine Accuracy@10
|
847 |
+
- type: cosine_precision@1
|
848 |
+
value: 0.09456264775413711
|
849 |
+
name: Cosine Precision@1
|
850 |
+
- type: cosine_precision@3
|
851 |
+
value: 0.24428684003152085
|
852 |
+
name: Cosine Precision@3
|
853 |
+
- type: cosine_precision@5
|
854 |
+
value: 0.16312056737588654
|
855 |
+
name: Cosine Precision@5
|
856 |
+
- type: cosine_precision@10
|
857 |
+
value: 0.08888888888888888
|
858 |
+
name: Cosine Precision@10
|
859 |
+
- type: cosine_recall@1
|
860 |
+
value: 0.09456264775413711
|
861 |
+
name: Cosine Recall@1
|
862 |
+
- type: cosine_recall@3
|
863 |
+
value: 0.7328605200945626
|
864 |
+
name: Cosine Recall@3
|
865 |
+
- type: cosine_recall@5
|
866 |
+
value: 0.8156028368794326
|
867 |
+
name: Cosine Recall@5
|
868 |
+
- type: cosine_recall@10
|
869 |
+
value: 0.8888888888888888
|
870 |
+
name: Cosine Recall@10
|
871 |
+
- type: cosine_ndcg@10
|
872 |
+
value: 0.5548355507079873
|
873 |
+
name: Cosine Ndcg@10
|
874 |
+
- type: cosine_mrr@10
|
875 |
+
value: 0.44204097714736
|
876 |
+
name: Cosine Mrr@10
|
877 |
+
- type: cosine_map@100
|
878 |
+
value: 0.4461566961770718
|
879 |
+
name: Cosine Map@100
|
880 |
+
---
|
881 |
+
|
882 |
+
# BGE large Legal Spanish Spa Law QA
|
883 |
+
|
884 |
+
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3) on the [boe-data-sintetic](https://huggingface.co/datasets/pablosi/boe-data-sintetic) dataset. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
|
885 |
+
|
886 |
+
## Model Details
|
887 |
+
|
888 |
+
### Model Description
|
889 |
+
- **Model Type:** Sentence Transformer
|
890 |
+
- **Base model:** [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3) <!-- at revision 5617a9f61b028005a4858fdac845db406aefb181 -->
|
891 |
+
- **Maximum Sequence Length:** 8192 tokens
|
892 |
+
- **Output Dimensionality:** 1024 dimensions
|
893 |
+
- **Similarity Function:** Cosine Similarity
|
894 |
+
- **Training Dataset:**
|
895 |
+
- [boe-data-sintetic](https://huggingface.co/datasets/pablosi/boe-data-sintetic)
|
896 |
+
- **Language:** es
|
897 |
+
- **License:** apache-2.0
|
898 |
+
|
899 |
+
### Model Sources
|
900 |
+
|
901 |
+
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
|
902 |
+
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
|
903 |
+
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
|
904 |
+
|
905 |
+
### Full Model Architecture
|
906 |
+
|
907 |
+
```
|
908 |
+
SentenceTransformer(
|
909 |
+
(0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
|
910 |
+
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
|
911 |
+
(2): Normalize()
|
912 |
+
)
|
913 |
+
```
|
914 |
+
|
915 |
+
## Usage
|
916 |
+
|
917 |
+
### Direct Usage (Sentence Transformers)
|
918 |
+
|
919 |
+
First install the Sentence Transformers library:
|
920 |
+
|
921 |
+
```bash
|
922 |
+
pip install -U sentence-transformers
|
923 |
+
```
|
924 |
+
|
925 |
+
Then you can load this model and run inference.
|
926 |
+
```python
|
927 |
+
from sentence_transformers import SentenceTransformer
|
928 |
+
|
929 |
+
# Download from the 🤗 Hub
|
930 |
+
model = SentenceTransformer("pablosi/bge-m3-retrained")
|
931 |
+
# Run inference
|
932 |
+
sentences = [
|
933 |
+
'¿En qué subsistema de contabilidad se realizan las anotaciones contables para la formalización de reintegros del presupuesto de gastos?',
|
934 |
+
' la columna de haber del concepto 51030 “Otros movimientos internos.\nFormalización de ingresos por cuenta de relaciones internas”».\n\n2. El número 41) FRPG.995, de formalización de reintegros del presupuesto de gastos\n\n\n(minora reconocimientos de obligaciones, propuestas de pago, ordenaciones de pago y\nrealizaciones de pago). Ejercicio corriente, queda redactado en los términos siguientes:\n\n«41.–) FRPG.995, de formalización de reintegros del presupuesto de gastos\n\n\n(minora reconocimientos de obligaciones, propuestas de pago, ordenaciones de\npago y realizaciones de pago). Ejercicio corriente. Las anotaciones contables se\n\n\n-----\n\n# BOLETÍN OFICIAL DEL ESTADO\n\n**Núm. 4** **Sábado 4 de enero de 2020** **Sec. I. Pág. 382**\n\n\nrealizan en los centros de gestión que expidieron las correspondientes propuestas\nde reintegros y en las cajas pagadoras.\n\n41.1 En el subsistema de contabilidad patrimonial.\n\n\n41.1.1 En el centro de gestión que expidió la propuesta de reintegro. Por el\n\n\nimporte total íntegro del documento KRPG de referencia y de forma encadenada se\nrealizan los siguientes asientos con signo negativo:\n\na) Cargo, según proceda, a la subcuenta 40002 “Acreedores por obligaciones\n\n\nrec',
|
935 |
+
' Subsecre-\nOficina de Control de Aproximación y Torre de Con\xad taría de Aviación Civil.\n##### trol de Aeródromo de Tenerife-Norte. 5.2.6. Estación de Comunicaciones de la ENA.\n\nSegunda: Torres de Control de Aeródromo de Almería, 5.3. Tendrá consideración de periférico, dependiendo de\n##### Sevilla, Alicante, lbiza, Gerona, Menorca, Valencia, San\xad la Sección de Telecomunicaciones Aeronáuticas, el\ntiago, Bilbao, Zaragoza y Lanzarote. Centro de Retransmisión Automática de Madrid, con\nTercera: Torres de Control de Aeródromo de Asturias, nivel orgánico de Sección.\nCórdoba, Fuerteventura, Granada, Hierro, La Coruña, La Se estructurará en dos Negociados:\nPalma, Madrid-Cuatro Vientos, Melilla, Pampona,l Reus,\nSabadell, Santander, San Sebastián y Vigo. — Negociado de Comunicaciones Nacionales.\n\n— Negociado de Comunicaciones Internacionales.\n\nCuando en un aeropuerto existen simultáneamente ofici\xad\n##### na de Control de Aproximación y Torre de Control de 6. Jefaturas de Mantenimiento, enclavadas en los aeropuer\xad\nAeródromo, la Jefatura es conjunta. tos y Centros de Control en que presten servicio, depen\xad\nLas de categoría primera y segunda con nivel orgánico diendo orgánicamente de la Subdirecci',
|
936 |
+
]
|
937 |
+
embeddings = model.encode(sentences)
|
938 |
+
print(embeddings.shape)
|
939 |
+
# [3, 1024]
|
940 |
+
|
941 |
+
# Get the similarity scores for the embeddings
|
942 |
+
similarities = model.similarity(embeddings, embeddings)
|
943 |
+
print(similarities.shape)
|
944 |
+
# [3, 3]
|
945 |
+
```
|
946 |
+
|
947 |
+
<!--
|
948 |
+
### Direct Usage (Transformers)
|
949 |
+
|
950 |
+
<details><summary>Click to see the direct usage in Transformers</summary>
|
951 |
+
|
952 |
+
</details>
|
953 |
+
-->
|
954 |
+
|
955 |
+
<!--
|
956 |
+
### Downstream Usage (Sentence Transformers)
|
957 |
+
|
958 |
+
You can finetune this model on your own dataset.
|
959 |
+
|
960 |
+
<details><summary>Click to expand</summary>
|
961 |
+
|
962 |
+
</details>
|
963 |
+
-->
|
964 |
+
|
965 |
+
<!--
|
966 |
+
### Out-of-Scope Use
|
967 |
+
|
968 |
+
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
|
969 |
+
-->
|
970 |
+
|
971 |
+
## Evaluation
|
972 |
+
|
973 |
+
### Metrics
|
974 |
+
|
975 |
+
#### Information Retrieval
|
976 |
+
|
977 |
+
* Datasets: `dim_1024` and `dim_768`
|
978 |
+
* Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
|
979 |
+
|
980 |
+
| Metric | dim_1024 | dim_768 |
|
981 |
+
|:--------------------|:-----------|:-----------|
|
982 |
+
| cosine_accuracy@1 | 0.0875 | 0.0946 |
|
983 |
+
| cosine_accuracy@3 | 0.7494 | 0.7329 |
|
984 |
+
| cosine_accuracy@5 | 0.8227 | 0.8156 |
|
985 |
+
| cosine_accuracy@10 | 0.8889 | 0.8889 |
|
986 |
+
| cosine_precision@1 | 0.0875 | 0.0946 |
|
987 |
+
| cosine_precision@3 | 0.2498 | 0.2443 |
|
988 |
+
| cosine_precision@5 | 0.1645 | 0.1631 |
|
989 |
+
| cosine_precision@10 | 0.0889 | 0.0889 |
|
990 |
+
| cosine_recall@1 | 0.0875 | 0.0946 |
|
991 |
+
| cosine_recall@3 | 0.7494 | 0.7329 |
|
992 |
+
| cosine_recall@5 | 0.8227 | 0.8156 |
|
993 |
+
| cosine_recall@10 | 0.8889 | 0.8889 |
|
994 |
+
| **cosine_ndcg@10** | **0.5558** | **0.5548** |
|
995 |
+
| cosine_mrr@10 | 0.4428 | 0.442 |
|
996 |
+
| cosine_map@100 | 0.4469 | 0.4462 |
|
997 |
+
|
998 |
+
<!--
|
999 |
+
## Bias, Risks and Limitations
|
1000 |
+
|
1001 |
+
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
|
1002 |
+
-->
|
1003 |
+
|
1004 |
+
<!--
|
1005 |
+
### Recommendations
|
1006 |
+
|
1007 |
+
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
|
1008 |
+
-->
|
1009 |
+
|
1010 |
+
## Training Details
|
1011 |
+
|
1012 |
+
### Training Dataset
|
1013 |
+
|
1014 |
+
#### boe-data-sintetic
|
1015 |
+
|
1016 |
+
* Dataset: [boe-data-sintetic](https://huggingface.co/datasets/pablosi/boe-data-sintetic) at [eccbec3](https://huggingface.co/datasets/pablosi/boe-data-sintetic/tree/eccbec3391f27cd7a9b93c22c53dc1bfbe420d79)
|
1017 |
+
* Size: 4,221 training samples
|
1018 |
+
* Columns: <code>question</code> and <code>context</code>
|
1019 |
+
* Approximate statistics based on the first 1000 samples:
|
1020 |
+
| | question | context |
|
1021 |
+
|:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
|
1022 |
+
| type | string | string |
|
1023 |
+
| details | <ul><li>min: 3 tokens</li><li>mean: 28.61 tokens</li><li>max: 65 tokens</li></ul> | <ul><li>min: 6 tokens</li><li>mean: 312.36 tokens</li><li>max: 837 tokens</li></ul> |
|
1024 |
+
* Samples:
|
1025 |
+
| question | context |
|
1026 |
+
|:-----------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
1027 |
+
| <code>¿Cuál es el carácter de la Jornada Escolar sobre el día Universal del Niño?</code> | <code>ica DE EDUCACION Y CIENCIA Segundo.—La Jornada Escolar sobre el día Universal del<br><br>Niño, que se considerará lectiva a todos los efectos, tendrá<br>carácter didáctico y conmemorativo y se celebrará con la parti<br>cipación de toda la comunidad escolar.<br><br>###### 18723 dificaORDENla dede 146 dede abriljulio desobre1982convalidaciónpor la que sedelmotí Tercero —La Inspección de Educación Básica del Estado orien<br>_tulo_ _de_ _Profesor_ _de_ _Educación_ _Física_ _por_ _los_ _co_ tará y supervisará la realización de las actividades que se<br>_rrespondientes_ _a_ _que_ _hace_ _referencia_ _el_ _artículo_ _5.º_ organicen de acuerdo con las instrucciones que señale la Direc<br>_del_ _Real_ _Decreto_ _790/1981,_ _de_ _24_ _de_ _abril._ ción General de Educación Básica.<br><br>Cuarto.—La Constitución Española, la Declaración Universal<br><br>Ilustrísimo señor:<br><br>de los Derechos del Niño y los Pactos y Declaraciones Interna<br><br>La Orden ministerial de 6 de abril de 1982 («Boletín Oficial cionales ratificados por España c...</code> |
|
1028 |
+
| <code>¿Cuál es el salario correspondiente al cargo de Oficial Administrativo de 2.ª?</code> | <code>e Administrativo de 2.ª, Jefe de Negociado 2.ª|133,45|<br>|Oficial Administrativo de 1.ª|133,43|<br>|Oficial Administrativo de 2.ª|133,43|<br>|Programador.|131,05|<br><br><br>-----<br><br></code> |
|
1029 |
+
| <code>¿Qué cambio se realiza en la denominación de la partida presupuestaria en la Comunidad Autónoma de Andalucía y Extremadura en el anexo?</code> | <code>ecir: K .. quedan afectados creditos,<br><br>Arqueo bruto de los barcos destinados ...».<br><br>Fecha Artículo 1.0 5, quinta y sexta líneas, donde dice: «... y 3.142,0<br>de entradaen vigor deDuración la t5tancia o mferiorIgual ~ur~ Superiora 5.000 aSuperior 10.000 a Extremadura ...millones a Extremadura ... )~. )), debe decir: «... y 3.142,0 millones de pesetas<br><br>## - a 3.000 TRB o ei~f:~or o ei~f~~r TRB En el anexo, Sección 21 -Ministerio de Agricultura, Pesca y<br>a 5.000 TRB a IO.COO TRB Alimentación, Servicio/Organismo 109- Instituto Nacional de Reforma<br><br>y Desarrollo Agrario. _<br><br>###### Períodos Comunidad Autónoma de Andalucía, donde dice: «89211090030<br><br>comple~ Ordenación y transformación de regadíos», debe decir: «89211090040<br>###### tos de Ordenación y transformación de regadíos».<br>1 enero veinti- Comunidad Autónoma de Extremadura, donde dice: «89211090030<br>de 1990 cuatro Ordenación y transformación de regadíos~), debe decir: «89211090040<br>horas o Ordenación y transformación de regadíos)).<br>fracción<br>sup...</code> |
|
1030 |
+
* Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
|
1031 |
+
```json
|
1032 |
+
{
|
1033 |
+
"loss": "MultipleNegativesRankingLoss",
|
1034 |
+
"matryoshka_dims": [
|
1035 |
+
1024,
|
1036 |
+
768
|
1037 |
+
],
|
1038 |
+
"matryoshka_weights": [
|
1039 |
+
1,
|
1040 |
+
1
|
1041 |
+
],
|
1042 |
+
"n_dims_per_step": -1
|
1043 |
+
}
|
1044 |
+
```
|
1045 |
+
|
1046 |
+
### Evaluation Dataset
|
1047 |
+
|
1048 |
+
#### boe-data-sintetic
|
1049 |
+
|
1050 |
+
* Dataset: [boe-data-sintetic](https://huggingface.co/datasets/pablosi/boe-data-sintetic) at [eccbec3](https://huggingface.co/datasets/pablosi/boe-data-sintetic/tree/eccbec3391f27cd7a9b93c22c53dc1bfbe420d79)
|
1051 |
+
* Size: 4,221 evaluation samples
|
1052 |
+
* Columns: <code>question</code> and <code>context</code>
|
1053 |
+
* Approximate statistics based on the first 1000 samples:
|
1054 |
+
| | question | context |
|
1055 |
+
|:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
|
1056 |
+
| type | string | string |
|
1057 |
+
| details | <ul><li>min: 3 tokens</li><li>mean: 27.84 tokens</li><li>max: 61 tokens</li></ul> | <ul><li>min: 31 tokens</li><li>mean: 325.91 tokens</li><li>max: 932 tokens</li></ul> |
|
1058 |
+
* Samples:
|
1059 |
+
| question | context |
|
1060 |
+
|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
1061 |
+
| <code>¿Cuál es el motivo por el que el Gobierno del Reino de España considera que la Declaración del Gobierno de la República Islámica de Pakistán es incompatible con el objeto y el fin del Pacto?</code> | <code>stado constituye una reserva.<br>El Gobierno del Reino de España considera que la<br>Declaración del Gobierno de la República Islámica de<br>Pakistán mediante la cual subordina la aplicación de las<br>disposiciones del Pacto a las disposiciones de la constitución de la República Islámica de Pakistán constituye una<br>reserva que pretende limitar los efectos jurídicos del<br>Pacto en su aplicación a la República Islámica de Pakistán.<br>Una reserva que contiene una referencia general al derecho interno, sin precisar su contenido, no permite determinar con claridad en qué medida la República Islámica<br>de Pakistán ha aceptado las obligaciones derivadas del<br>Pacto y, en consecuencia, suscita dudas sobre el compromiso de la República Islámica de Pakistán con el objeto y<br>el fin del Pacto .<br>El Gobierno del Reino de España considera que la<br>Declaración del Gobierno de la República islámica de<br>Pakistán mediante la cual subordina las obligaciones derivadas del Pacto Internacional de Derechos Económicos,<br>Sociales y Cult...</code> |
|
1062 |
+
| <code>¿Qué Plan de Reestructuración se aprobó por Decreto seiscientos noventa y cuatro/mil novecientos setenta y cinco, de Tres de abril?</code> | <code>ro, y el apartado b) de este mismo<br>cuotas específicas de carácter social ya establecidas puedan punto, artículo y Decreto, modificado por el Decreto tres mil<br>ser recaudadas en periodo ejecutivo por la vía administrativa cuarenta y nueve/mil novecientos setenta y uno, de veinticinco<br>de apremio, habida cuenta, por lo demás, del precedente exis de noviembre, por los que se desarrolla la Ley setenta y ocho/<br>tente en favor del Plan de Reestructuración de la Industria mil novecientos sesenta y ocho, de cinco de diciembre, queda<br>Textil Lanera, aprobado por Decreto seiscientos noventa y cua rán redactados en la forma siguiente:<br>tro/mil novecientos setenta y cinco, de Tres de abril.<br><br>«Artículo dieciocho.—Dos. a) En los empleos de Capitán de<br><br>En su virtud, a propuesta de los Ministros de Hacienda, Tra<br><br>Navio y asimilados comprenderá a todos los cumplidos de con<br><br>bajo e Industria, con el informe favorable de las Comisiones<br><br>diciones generales y específicas. Caso de que este número no<br><br>Gestor...</code> |
|
1063 |
+
| <code>¿Cuál es la modalidad de pesca asignada a los buques censados en las modalidades mencionadas en el texto?</code> | <code>a Pérez. FE-2-2810 Camariñas Palangre de fondo.<br>E: Lnngitud 44~ 8' N~ latitud 8" 28' W. Nuevo Balbino. FE-2-2677 Finisterre _ Palangre de fondo.<br>F: Longitud 44' 8' N, latitud 8' 37' W. Nuevo Hermanos<br>G: Longitud 44" S' N, latitud 8" 37' W. Casina. FE-2-2954 Burela. Volanta.<br>H: Longitud 44' 5' N, latitud 8' 48' W. Nuevo Hermanos<br><br>Fraga. FE-2-2731 Burela. Volanta.<br><br> - Ql;leda reservada en forma exclusiva para el ejercicio de la pesca con Nuevo Jaime Balmes ST-3-1718 Cedeira. Volanta.<br>aparejos de palangre de fondo y artes de enmalle fijo de fondo, para Nuevo José Antonio. FE-3-1740 Cedeira. Volanta.<br>##### . buques censados en las citadas modalidades y con base oficialmente Nuevo Lozano. r Cü-3-1519 Cedeira. Volanta.<br><br><br>-----<br><br>10784 Martes 31 marzo 1992 BüE núm. 78 .,.<br><br>|Nombre dd buque|Matricula|Puerto base:|Modalidad|<br>|---|---|---|---|<br>|Vamos Indo 5. Vigo Blanco. Vulcano 11.|CQ..7-3447 CO-4-1754 Cü-4-1425|Camelle. Muxia. Camariñas|Palangre de fondo. Palangre de fondo. Palangre de fondo....</code> |
|
1064 |
+
* Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
|
1065 |
+
```json
|
1066 |
+
{
|
1067 |
+
"loss": "MultipleNegativesRankingLoss",
|
1068 |
+
"matryoshka_dims": [
|
1069 |
+
1024,
|
1070 |
+
768
|
1071 |
+
],
|
1072 |
+
"matryoshka_weights": [
|
1073 |
+
1,
|
1074 |
+
1
|
1075 |
+
],
|
1076 |
+
"n_dims_per_step": -1
|
1077 |
+
}
|
1078 |
+
```
|
1079 |
+
|
1080 |
+
### Training Hyperparameters
|
1081 |
+
#### Non-Default Hyperparameters
|
1082 |
+
|
1083 |
+
- `eval_strategy`: steps
|
1084 |
+
- `per_device_train_batch_size`: 32
|
1085 |
+
- `per_device_eval_batch_size`: 32
|
1086 |
+
- `gradient_accumulation_steps`: 8
|
1087 |
+
- `learning_rate`: 3e-05
|
1088 |
+
- `weight_decay`: 0.01
|
1089 |
+
- `num_train_epochs`: 12
|
1090 |
+
- `lr_scheduler_type`: cosine
|
1091 |
+
- `warmup_ratio`: 0.15
|
1092 |
+
- `bf16`: True
|
1093 |
+
- `tf32`: True
|
1094 |
+
- `dataloader_num_workers`: 4
|
1095 |
+
- `load_best_model_at_end`: True
|
1096 |
+
- `optim`: adamw_torch_fused
|
1097 |
+
- `gradient_checkpointing`: True
|
1098 |
+
- `batch_sampler`: no_duplicates
|
1099 |
+
|
1100 |
+
#### All Hyperparameters
|
1101 |
+
<details><summary>Click to expand</summary>
|
1102 |
+
|
1103 |
+
- `overwrite_output_dir`: False
|
1104 |
+
- `do_predict`: False
|
1105 |
+
- `eval_strategy`: steps
|
1106 |
+
- `prediction_loss_only`: True
|
1107 |
+
- `per_device_train_batch_size`: 32
|
1108 |
+
- `per_device_eval_batch_size`: 32
|
1109 |
+
- `per_gpu_train_batch_size`: None
|
1110 |
+
- `per_gpu_eval_batch_size`: None
|
1111 |
+
- `gradient_accumulation_steps`: 8
|
1112 |
+
- `eval_accumulation_steps`: None
|
1113 |
+
- `torch_empty_cache_steps`: None
|
1114 |
+
- `learning_rate`: 3e-05
|
1115 |
+
- `weight_decay`: 0.01
|
1116 |
+
- `adam_beta1`: 0.9
|
1117 |
+
- `adam_beta2`: 0.999
|
1118 |
+
- `adam_epsilon`: 1e-08
|
1119 |
+
- `max_grad_norm`: 1.0
|
1120 |
+
- `num_train_epochs`: 12
|
1121 |
+
- `max_steps`: -1
|
1122 |
+
- `lr_scheduler_type`: cosine
|
1123 |
+
- `lr_scheduler_kwargs`: {}
|
1124 |
+
- `warmup_ratio`: 0.15
|
1125 |
+
- `warmup_steps`: 0
|
1126 |
+
- `log_level`: passive
|
1127 |
+
- `log_level_replica`: warning
|
1128 |
+
- `log_on_each_node`: True
|
1129 |
+
- `logging_nan_inf_filter`: True
|
1130 |
+
- `save_safetensors`: True
|
1131 |
+
- `save_on_each_node`: False
|
1132 |
+
- `save_only_model`: False
|
1133 |
+
- `restore_callback_states_from_checkpoint`: False
|
1134 |
+
- `no_cuda`: False
|
1135 |
+
- `use_cpu`: False
|
1136 |
+
- `use_mps_device`: False
|
1137 |
+
- `seed`: 42
|
1138 |
+
- `data_seed`: None
|
1139 |
+
- `jit_mode_eval`: False
|
1140 |
+
- `use_ipex`: False
|
1141 |
+
- `bf16`: True
|
1142 |
+
- `fp16`: False
|
1143 |
+
- `fp16_opt_level`: O1
|
1144 |
+
- `half_precision_backend`: auto
|
1145 |
+
- `bf16_full_eval`: False
|
1146 |
+
- `fp16_full_eval`: False
|
1147 |
+
- `tf32`: True
|
1148 |
+
- `local_rank`: 0
|
1149 |
+
- `ddp_backend`: None
|
1150 |
+
- `tpu_num_cores`: None
|
1151 |
+
- `tpu_metrics_debug`: False
|
1152 |
+
- `debug`: []
|
1153 |
+
- `dataloader_drop_last`: False
|
1154 |
+
- `dataloader_num_workers`: 4
|
1155 |
+
- `dataloader_prefetch_factor`: None
|
1156 |
+
- `past_index`: -1
|
1157 |
+
- `disable_tqdm`: False
|
1158 |
+
- `remove_unused_columns`: True
|
1159 |
+
- `label_names`: None
|
1160 |
+
- `load_best_model_at_end`: True
|
1161 |
+
- `ignore_data_skip`: False
|
1162 |
+
- `fsdp`: []
|
1163 |
+
- `fsdp_min_num_params`: 0
|
1164 |
+
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
|
1165 |
+
- `fsdp_transformer_layer_cls_to_wrap`: None
|
1166 |
+
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
|
1167 |
+
- `deepspeed`: None
|
1168 |
+
- `label_smoothing_factor`: 0.0
|
1169 |
+
- `optim`: adamw_torch_fused
|
1170 |
+
- `optim_args`: None
|
1171 |
+
- `adafactor`: False
|
1172 |
+
- `group_by_length`: False
|
1173 |
+
- `length_column_name`: length
|
1174 |
+
- `ddp_find_unused_parameters`: None
|
1175 |
+
- `ddp_bucket_cap_mb`: None
|
1176 |
+
- `ddp_broadcast_buffers`: False
|
1177 |
+
- `dataloader_pin_memory`: True
|
1178 |
+
- `dataloader_persistent_workers`: False
|
1179 |
+
- `skip_memory_metrics`: True
|
1180 |
+
- `use_legacy_prediction_loop`: False
|
1181 |
+
- `push_to_hub`: False
|
1182 |
+
- `resume_from_checkpoint`: None
|
1183 |
+
- `hub_model_id`: None
|
1184 |
+
- `hub_strategy`: every_save
|
1185 |
+
- `hub_private_repo`: False
|
1186 |
+
- `hub_always_push`: False
|
1187 |
+
- `gradient_checkpointing`: True
|
1188 |
+
- `gradient_checkpointing_kwargs`: None
|
1189 |
+
- `include_inputs_for_metrics`: False
|
1190 |
+
- `include_for_metrics`: []
|
1191 |
+
- `eval_do_concat_batches`: True
|
1192 |
+
- `fp16_backend`: auto
|
1193 |
+
- `push_to_hub_model_id`: None
|
1194 |
+
- `push_to_hub_organization`: None
|
1195 |
+
- `mp_parameters`:
|
1196 |
+
- `auto_find_batch_size`: False
|
1197 |
+
- `full_determinism`: False
|
1198 |
+
- `torchdynamo`: None
|
1199 |
+
- `ray_scope`: last
|
1200 |
+
- `ddp_timeout`: 1800
|
1201 |
+
- `torch_compile`: False
|
1202 |
+
- `torch_compile_backend`: None
|
1203 |
+
- `torch_compile_mode`: None
|
1204 |
+
- `dispatch_batches`: None
|
1205 |
+
- `split_batches`: None
|
1206 |
+
- `include_tokens_per_second`: False
|
1207 |
+
- `include_num_input_tokens_seen`: False
|
1208 |
+
- `neftune_noise_alpha`: None
|
1209 |
+
- `optim_target_modules`: None
|
1210 |
+
- `batch_eval_metrics`: False
|
1211 |
+
- `eval_on_start`: False
|
1212 |
+
- `use_liger_kernel`: False
|
1213 |
+
- `eval_use_gather_object`: False
|
1214 |
+
- `average_tokens_across_devices`: False
|
1215 |
+
- `prompts`: None
|
1216 |
+
- `batch_sampler`: no_duplicates
|
1217 |
+
- `multi_dataset_batch_sampler`: proportional
|
1218 |
+
|
1219 |
+
</details>
|
1220 |
+
|
1221 |
+
### Training Logs
|
1222 |
+
| Epoch | Step | Training Loss | Validation Loss | dim_1024_cosine_ndcg@10 | dim_768_cosine_ndcg@10 |
|
1223 |
+
|:----------:|:------:|:-------------:|:---------------:|:-----------------------:|:----------------------:|
|
1224 |
+
| 0.6723 | 10 | 0.987 | - | - | - |
|
1225 |
+
| 1.3529 | 20 | 0.452 | - | - | - |
|
1226 |
+
| 2.0336 | 30 | 0.2283 | - | - | - |
|
1227 |
+
| 2.7059 | 40 | 0.0941 | - | - | - |
|
1228 |
+
| **3.3866** | **50** | **0.0624** | **0.1497** | **0.5937** | **0.5904** |
|
1229 |
+
| 4.0672 | 60 | 0.0381 | - | - | - |
|
1230 |
+
| 4.7395 | 70 | 0.0235 | - | - | - |
|
1231 |
+
| 5.4202 | 80 | 0.0204 | - | - | - |
|
1232 |
+
| 6.1008 | 90 | 0.0171 | - | - | - |
|
1233 |
+
| 6.7731 | 100 | 0.0085 | 0.1949 | 0.5714 | 0.5642 |
|
1234 |
+
| 7.4538 | 110 | 0.0107 | - | - | - |
|
1235 |
+
| 8.1345 | 120 | 0.0087 | - | - | - |
|
1236 |
+
| 8.8067 | 130 | 0.0049 | - | - | - |
|
1237 |
+
| 9.4874 | 140 | 0.0073 | - | - | - |
|
1238 |
+
| 10.1681 | 150 | 0.0074 | 0.2107 | 0.5558 | 0.5548 |
|
1239 |
+
| 10.8403 | 160 | 0.0047 | - | - | - |
|
1240 |
+
|
1241 |
+
* The bold row denotes the saved checkpoint.
|
1242 |
+
|
1243 |
+
### Framework Versions
|
1244 |
+
- Python: 3.10.14
|
1245 |
+
- Sentence Transformers: 3.3.0
|
1246 |
+
- Transformers: 4.46.2
|
1247 |
+
- PyTorch: 2.2.2
|
1248 |
+
- Accelerate: 1.1.1
|
1249 |
+
- Datasets: 3.1.0
|
1250 |
+
- Tokenizers: 0.20.3
|
1251 |
+
|
1252 |
+
## Citation
|
1253 |
+
|
1254 |
+
### BibTeX
|
1255 |
+
|
1256 |
+
#### Sentence Transformers
|
1257 |
+
```bibtex
|
1258 |
+
@inproceedings{reimers-2019-sentence-bert,
|
1259 |
+
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
|
1260 |
+
author = "Reimers, Nils and Gurevych, Iryna",
|
1261 |
+
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
|
1262 |
+
month = "11",
|
1263 |
+
year = "2019",
|
1264 |
+
publisher = "Association for Computational Linguistics",
|
1265 |
+
url = "https://arxiv.org/abs/1908.10084",
|
1266 |
+
}
|
1267 |
+
```
|
1268 |
+
|
1269 |
+
#### MatryoshkaLoss
|
1270 |
+
```bibtex
|
1271 |
+
@misc{kusupati2024matryoshka,
|
1272 |
+
title={Matryoshka Representation Learning},
|
1273 |
+
author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
|
1274 |
+
year={2024},
|
1275 |
+
eprint={2205.13147},
|
1276 |
+
archivePrefix={arXiv},
|
1277 |
+
primaryClass={cs.LG}
|
1278 |
+
}
|
1279 |
+
```
|
1280 |
+
|
1281 |
+
#### MultipleNegativesRankingLoss
|
1282 |
+
```bibtex
|
1283 |
+
@misc{henderson2017efficient,
|
1284 |
+
title={Efficient Natural Language Response Suggestion for Smart Reply},
|
1285 |
+
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
|
1286 |
+
year={2017},
|
1287 |
+
eprint={1705.00652},
|
1288 |
+
archivePrefix={arXiv},
|
1289 |
+
primaryClass={cs.CL}
|
1290 |
+
}
|
1291 |
+
```
|
1292 |
+
|
1293 |
+
<!--
|
1294 |
+
## Glossary
|
1295 |
+
|
1296 |
+
*Clearly define terms in order to be accessible across audiences.*
|
1297 |
+
-->
|
1298 |
+
|
1299 |
+
<!--
|
1300 |
+
## Model Card Authors
|
1301 |
+
|
1302 |
+
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
|
1303 |
+
-->
|
1304 |
+
|
1305 |
+
<!--
|
1306 |
+
## Model Card Contact
|
1307 |
+
|
1308 |
+
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
|
1309 |
+
-->
|
config.json
ADDED
@@ -0,0 +1,28 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"_name_or_path": "BAAI/bge-m3",
|
3 |
+
"architectures": [
|
4 |
+
"XLMRobertaModel"
|
5 |
+
],
|
6 |
+
"attention_probs_dropout_prob": 0.1,
|
7 |
+
"bos_token_id": 0,
|
8 |
+
"classifier_dropout": null,
|
9 |
+
"eos_token_id": 2,
|
10 |
+
"hidden_act": "gelu",
|
11 |
+
"hidden_dropout_prob": 0.1,
|
12 |
+
"hidden_size": 1024,
|
13 |
+
"initializer_range": 0.02,
|
14 |
+
"intermediate_size": 4096,
|
15 |
+
"layer_norm_eps": 1e-05,
|
16 |
+
"max_position_embeddings": 8194,
|
17 |
+
"model_type": "xlm-roberta",
|
18 |
+
"num_attention_heads": 16,
|
19 |
+
"num_hidden_layers": 24,
|
20 |
+
"output_past": true,
|
21 |
+
"pad_token_id": 1,
|
22 |
+
"position_embedding_type": "absolute",
|
23 |
+
"torch_dtype": "float32",
|
24 |
+
"transformers_version": "4.46.2",
|
25 |
+
"type_vocab_size": 1,
|
26 |
+
"use_cache": true,
|
27 |
+
"vocab_size": 250002
|
28 |
+
}
|
config_sentence_transformers.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"__version__": {
|
3 |
+
"sentence_transformers": "3.3.0",
|
4 |
+
"transformers": "4.46.2",
|
5 |
+
"pytorch": "2.2.2"
|
6 |
+
},
|
7 |
+
"prompts": {},
|
8 |
+
"default_prompt_name": null,
|
9 |
+
"similarity_fn_name": "cosine"
|
10 |
+
}
|
model.safetensors
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:0b687558f38f1b255323f011be846c96d80e7a786ebe084cebe039a4f918f317
|
3 |
+
size 2271064456
|
modules.json
ADDED
@@ -0,0 +1,20 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
[
|
2 |
+
{
|
3 |
+
"idx": 0,
|
4 |
+
"name": "0",
|
5 |
+
"path": "",
|
6 |
+
"type": "sentence_transformers.models.Transformer"
|
7 |
+
},
|
8 |
+
{
|
9 |
+
"idx": 1,
|
10 |
+
"name": "1",
|
11 |
+
"path": "1_Pooling",
|
12 |
+
"type": "sentence_transformers.models.Pooling"
|
13 |
+
},
|
14 |
+
{
|
15 |
+
"idx": 2,
|
16 |
+
"name": "2",
|
17 |
+
"path": "2_Normalize",
|
18 |
+
"type": "sentence_transformers.models.Normalize"
|
19 |
+
}
|
20 |
+
]
|
sentence_bert_config.json
ADDED
@@ -0,0 +1,4 @@
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"max_seq_length": 8192,
|
3 |
+
"do_lower_case": false
|
4 |
+
}
|
special_tokens_map.json
ADDED
@@ -0,0 +1,51 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"bos_token": {
|
3 |
+
"content": "<s>",
|
4 |
+
"lstrip": false,
|
5 |
+
"normalized": false,
|
6 |
+
"rstrip": false,
|
7 |
+
"single_word": false
|
8 |
+
},
|
9 |
+
"cls_token": {
|
10 |
+
"content": "<s>",
|
11 |
+
"lstrip": false,
|
12 |
+
"normalized": false,
|
13 |
+
"rstrip": false,
|
14 |
+
"single_word": false
|
15 |
+
},
|
16 |
+
"eos_token": {
|
17 |
+
"content": "</s>",
|
18 |
+
"lstrip": false,
|
19 |
+
"normalized": false,
|
20 |
+
"rstrip": false,
|
21 |
+
"single_word": false
|
22 |
+
},
|
23 |
+
"mask_token": {
|
24 |
+
"content": "<mask>",
|
25 |
+
"lstrip": true,
|
26 |
+
"normalized": false,
|
27 |
+
"rstrip": false,
|
28 |
+
"single_word": false
|
29 |
+
},
|
30 |
+
"pad_token": {
|
31 |
+
"content": "<pad>",
|
32 |
+
"lstrip": false,
|
33 |
+
"normalized": false,
|
34 |
+
"rstrip": false,
|
35 |
+
"single_word": false
|
36 |
+
},
|
37 |
+
"sep_token": {
|
38 |
+
"content": "</s>",
|
39 |
+
"lstrip": false,
|
40 |
+
"normalized": false,
|
41 |
+
"rstrip": false,
|
42 |
+
"single_word": false
|
43 |
+
},
|
44 |
+
"unk_token": {
|
45 |
+
"content": "<unk>",
|
46 |
+
"lstrip": false,
|
47 |
+
"normalized": false,
|
48 |
+
"rstrip": false,
|
49 |
+
"single_word": false
|
50 |
+
}
|
51 |
+
}
|
tokenizer.json
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:e4f7e21bec3fb0044ca0bb2d50eb5d4d8c596273c422baef84466d2c73748b9c
|
3 |
+
size 17083053
|
tokenizer_config.json
ADDED
@@ -0,0 +1,55 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"added_tokens_decoder": {
|
3 |
+
"0": {
|
4 |
+
"content": "<s>",
|
5 |
+
"lstrip": false,
|
6 |
+
"normalized": false,
|
7 |
+
"rstrip": false,
|
8 |
+
"single_word": false,
|
9 |
+
"special": true
|
10 |
+
},
|
11 |
+
"1": {
|
12 |
+
"content": "<pad>",
|
13 |
+
"lstrip": false,
|
14 |
+
"normalized": false,
|
15 |
+
"rstrip": false,
|
16 |
+
"single_word": false,
|
17 |
+
"special": true
|
18 |
+
},
|
19 |
+
"2": {
|
20 |
+
"content": "</s>",
|
21 |
+
"lstrip": false,
|
22 |
+
"normalized": false,
|
23 |
+
"rstrip": false,
|
24 |
+
"single_word": false,
|
25 |
+
"special": true
|
26 |
+
},
|
27 |
+
"3": {
|
28 |
+
"content": "<unk>",
|
29 |
+
"lstrip": false,
|
30 |
+
"normalized": false,
|
31 |
+
"rstrip": false,
|
32 |
+
"single_word": false,
|
33 |
+
"special": true
|
34 |
+
},
|
35 |
+
"250001": {
|
36 |
+
"content": "<mask>",
|
37 |
+
"lstrip": true,
|
38 |
+
"normalized": false,
|
39 |
+
"rstrip": false,
|
40 |
+
"single_word": false,
|
41 |
+
"special": true
|
42 |
+
}
|
43 |
+
},
|
44 |
+
"bos_token": "<s>",
|
45 |
+
"clean_up_tokenization_spaces": true,
|
46 |
+
"cls_token": "<s>",
|
47 |
+
"eos_token": "</s>",
|
48 |
+
"mask_token": "<mask>",
|
49 |
+
"model_max_length": 8192,
|
50 |
+
"pad_token": "<pad>",
|
51 |
+
"sep_token": "</s>",
|
52 |
+
"sp_model_kwargs": {},
|
53 |
+
"tokenizer_class": "XLMRobertaTokenizer",
|
54 |
+
"unk_token": "<unk>"
|
55 |
+
}
|