GbrlOl's picture
Add new SentenceTransformer model
5100898 verified
metadata
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:5005
  - loss:CoSENTLoss
base_model: sentence-transformers/all-MiniLM-L6-v2
widget:
  - source_sentence: el depósito presenta estudio sísmico deterministico?
    sentences:
      - "Fidel Oteiza 1971, of.202 - Providencia – Santiago-Chile.  Fono/Fax:  (56-2) 433 3200 - e-mail: contacto@vst.cl \ni\nMINERA LAS CENIZAS  S.A. \nDEPÓSITO DE RELAVES DE PASTA CABILDO \nPERMISO SECTORIAL PARA APROBACIÓN DEL PROYECTO \nTÉCNICO POR PARTE DEL SERNAGEOMIN SEGÚN EL D.S. 248 \nANÁLISIS DE ESTABILIDAD \n \n1136-ID-GE-IT-01-Rev.0 \nÍNDICE DE CONTENIDOS \n1.\_ INTRODUCCIÓN ............................................................................................. 1\_\n2.\_ REVISIÓN DE ANTECEDENTES ................................................................. 2\_\n2.1.\_ Geometría del Depósito ................................................................................. 2\_\n2.2.\_ Geología ......................................................................................................... 3\_\n2.3.\_ Geotecnia del Suelo Natural .......................................................................... 3\_\n2.4.\_ Geotecnia del Material de Estéril ................................................................... 4\_\n2.5.\_ Análisis de estabilidad ................................................................................... 5\_\n2.5.1.\_ Criterios generales .............................................................................. 5\_\n2.5.2.\_ Análisis pseudo-estático ...................................................................... 5\_\n2.5.3.\_ Casos de análisis ................................................................................. 6\_\n2.5.4.\_ Resultados del análisis de estabilidad ................................................. 6\_\n3.\_ ENSAYOS DE LABORATORIO RELAVE UG-2 ...................................... 10\_\n3.1.\_ Granulometría e Hidrometría ....................................................................... 10\_\n3.2.\_ Clasificación y Límites de Atterberg ........................................................... 12\_\n3.3.\_ Límite de Contracción .................................................................................. 12\_\n3.4.\_ Consolidación por Peso Propio .................................................................... 13\_\n3.5.\_ Proctor Modificado ...................................................................................... 15\_\n3.6."
      - >-
        Plan de Cierre - Faena Minera Salares Norte |   82 
         
        Se necesita de especial cuidado al depositar rocas estériles con menores
        propiedades g eotécnicas que las 

        consideradas como representativas en este informe, como materiales con
        alteración Steam Heated o materiales del 

        cuaternario. Estos materiales no deben ser depositados en los pies de
        los taludes del depósito, ni en el fondo de la 

        cuenca donde será emplazado el botadero Norte. En vez de eso, se deben
        depositar e n pilas horizontales cerca de 

        la parte posterior del botadero Norte, donde hay presencia de material
        rocoso de mejor calidad.  

        En el mismo sentido, los resultados de la modelación num érica en
        condiciones dinámicas indican que, para corto y 

        largo plazo, los desplazamientos dentro del depósito, en general, serían
        menores a 0,8 metros (80 centímetros). Los 

        mayores desplazamientos observados ocurrirán en los bancos de botadero
        Norte. La aplicación de un evento sísmico 

        causará desplazamientos en la superficie que  solo afectan los bancos y
        bermas del depósito. Las partículas se 

        deslizarán y quedarán en las bermas que tienen 20 metros de ancho.  
         Características Geoquímicas 
        Con el objeto de determinar la potencialidad de generación de drenajes
        desde el botadero Norte se ha desarrollado 

        un estudio de caracterización geoquímica de los materiales estériles y
        la disposición en el botadero Norte 

        considerando su máxima capacidad. 

        De las muestras analizadas (170 en total para material estéril) 146
        muestras serían representativas de los materiales 

        a depositar en el botadero Norte en su máxima capacidad, lo que
        significa que se ha podido representar un 94,8% 

        de los materiales en la fase final del botadero según los criterios de
        Litología, Alteración y Mineralización (LAM), ley 

        de Au y zona redox.
      - >-
        Sin perjuicio de ello, en este 

        plan de cierre temporal se ha hecho un análisis a nive l de juicio
        experto respecto de los riesgos 

        que se indican en la siguiente tabla.  

        Tabla 3-3: Riesgos evaluados Instalaciones Complementarias y
        Auxiliares. 

        Instalación Riesgos evaluados 

        Instalaciones 

        Complementarias 

        y Auxiliares 

        IA.1) Caída de Personas o animales a desnivel 

        IA.2) Caída de objetos o materiales sobre personas o animales 

        IA.3) Afectación a la salud de las personas por estructuras, 

        materiales y/o suelos contaminados 

        Fuente: Elaborado por MYMA, 2019 

        3.1 Evaluación de Riesgos 

        a) Evaluación de Riesgos previo a la definición de las medidas de
        cierre 

        Una vez establecida la probabilidad de ocurrencia de los eventos y la
        severidad de las 

        consecuencias para las personas y el medio ambiente, se debe catalogar
        el límite de aceptabilidad 

        del riesgo.
  - source_sentence: >-
      ¿Cuál es el correo electrónico de contacto de la empresa VST ubicada en
      Santiago, Chile?
    sentences:
      - "26 \n \n \n85/11382/13328     Proyecto de Cierre Tranque de Relave N°4 Planta Cabildo, Región de Valparaíso  \nPlan de Cierre \n7.2.9 Habilitación de Evacuador de Emergencia. \nDescrito ampliamente en el ítem 7.2.4.1. \n7.2.10  Cercado de las Torres Colectoras. \nPara la operación del Tranque de Relave N°4, se consideraron 6 cámaras colectoras de agua clara, unidas \npor tuberías HDPE. Se prevé sellar completamente las cámaras, a través de rellenos realizados con grava, \ncon arena y con relave. Posteriormente a dicho sello se demuele la porción que sobresale de las lamas \nevitándose los promontorios. \nPara que los rellenos queden estables y se elimine toda posibilidad de que haya migración de lamas o de \nlos rellenos, a través de la tubería, el sello de la cámara se realizará con los siguientes materiales y \nsecuencia constructiva: \n\x7F Se coloca una primera capa, de a lo menos un metro de altura, sobre el fondo de la cámara, con \nsobretamaño, superior a 6\". \n\x7F Inmediatamente después se realiza un relleno de grava arenosa con contenido de grava superior al \n50% y arena superior al 30%. Dicha capa debe presentar a lo menos una altura de un metro. \n\x7F Posteriormente, sobre la grava, se realiza un relleno con arena de relaves (proveniente del muro), \ntambién con una dimensión mínima de un metro. \n\x7F Finalmente se realiza un relleno con lamas (secas o con baja humedad) hasta el nivel de lamas \nexistentes en la cubeta. \n\x7F Todos los rellenos se colocan sin compactar."
      - >-
        En dicho proceso 

        es que se libera energía que se traduce en movimientos sísmicos en
        superficie. 

        El proyecto, al estar ubicado entre los 25°58’ L.S. y 26°’24 L.S., se
        relaciona con el segmento sismo tectónico de 

        Copiapó, el cual forma parte de la sección norte del llamado flat-slab.
        El flat-slab corresponde al segmento de la zona 

        de acoplamiento entre placas tectónicas de Nazca y Sudamericana que
        presenta menor ángulo de subducci ón, en 

        consecuencia, no hay un volcanismo activo relevante. 

        El segmento sismo tectónico de Copiapó se caracteriza por presentar
        sismos de grandes rupturas únic as y también, 

        en ocasiones, liberación de energía mediante grupos de sismos medios a
        grandes (Bar rientos, 2007). En este tramo, 

        los sismos de magnitud mayor a 6 se concentran costa afuera y paralelos
        a ella, con mecanismos de esfuerzo inverso 

        de bajo ángul o. Sismos con mecanismos de falla tensional se observan al
        interior del continente, en un número 

        bastante menor a los producidos mar afuera (Barrientos, 2007). Ambos
        tipos de sismos se producen en la región 

        acoplada de subducción entre las placas de Nazca y Sudamericana. La
        mayoría de los sismos destructivos registrados 

        en Chile concentran sus puntos focales cercanos al borde costero. A
        continuación, en la Tabla 4-7 se presentan 

        registros de eventos de magnitud mayor a 7 Mw entre los 24° y 28° L.S. y
        en la Figura 4-5 se muestran espacialmente 

        los registros mencionados anteriormente.
      - >-
        Fidel Oteiza 1971, of.202 - Providencia – Santiago-Chile.  Fono/Fax: 
        (56-2) 433 3200 - e-mail: contacto@vst.cl 

        ANEXO B: ESTUDIO DE PELIGR O SÍSMICO, ESPECTROS DE 

        RESPUESTA Y GENERACIÓN DE REGISTROS ARTIFICIALES 

        PARA EL DEPÓSITO DE PASTA, PLANTA CABILDO
  - source_sentence: >-
      ¿Cuál es la resistencia cíclica para un número de ciclos de 30 y una razón
      de confinamiento de 0,5 kg/cm2?
    sentences:
      - >-
        Plan de Cierre - Faena Minera Salares Norte |   111 
         
         
        Fuente: SRK 

        Figura 8-31: Distancia de Exclusión Entre el Pie del ROM STOCK y el
        Borde de la Plataforma 4.473  
         Características  
        El depósito de relaves consiste en un acopio de relaves previamente
        filtrados, los cuales serán depositados sobre la 

        plataforma intermedia del botadero Sur (plataforma 4.432 m.s.n.m.),
        autosoportante que se construirá en capas de 

        entre 30 a 40 c m compactadas mediante rodillo vibratorio, con un
        contenido de humedad menor al 20%. La base 

        del depósito de relaves filtrados, como  son las laderas de los cerros y
        las superficies inclinadas del botadero sobre 

        las que se apoyará el relave serán impermeabi lizadas mediante una
        geomembrana que cubrirá aproximadamente 

        533.672 m 2. La tasa de depositación promedio diaria de relaves es del o
        rden de 6 ktpd. Las características del 

        depósito de relaves se muestran a continuación. 

        Tabla 8-20: Características del Depósito de Relaves 

        Característica Valor Aproximado Unidad 

        Volumen 14,8 Mm3 

        Capacidad Máxima 24,1 Mt 

        Capacidad Proyectada 22,2 Mt 

        Superficie Máxima 54 ha 

        Superficie Proyectada 51,7 ha 

        Cota Máxima 4.472  m.s.n.m. 

        Cota Máxima Proyectada 4.469,2 m.s.n.m. 

        Cota Mínima 4.432 m.s.n.m.
      - >-
        Fidel Oteiza 1971, of.202 - Providencia – Santiago-Chile.  Fono/Fax: 
        (56-2) 433 3200 - e-mail: contacto@vst.cl 

        20
         
         
        Figura 11. Resistencia Cíclica vs  de Ciclos de Carga Relave UG-2 

        En términos generales, las curvas mostradas en la Figura 11  presentan
        un 

        comportamiento típico, en  donde para un nivel de confinamiento dado, a 

        medida que se aumenta la resistencia cíclica, disminuye el número de
        ciclos 

        necesarios para alcanzar la movilidad cíclica. Además, a medida que
        aumenta la 

        presión efectiva de confinamiento, para una misma resistencia cíclica, 

        disminuye el número de ciclos necesarios para alcanzar la movilidad
        cíclica 

        En este caso particular, se puede observa r que para un número de ciclos
        de 30, 

        la resistencia cíclica es aproximadamente 0,34 para una razón de
        confinamiento 

        de 0,5 kg/cm2, mientras que para un c onfinamiento de 1,0 kg/cm 2 la
        resistencia 

        cíclica es 0,23.
      - >-
        PLAN DE CIERRE  TEMPORAL – FAENA MINERA EL TOQUI  
         Sociedad Contractual Minera El Toqui 
        Capítulo 4 - Caracterización del Entorno 
          
         
        REVISIÓN [0]  

        4-46   
         
        Pilgerodendron, Macrachaeniun, Combera, entre otros. Hay también varios
        elementos de origen 

        tropical, como lo son Chusquea y Myrceugenella. 

        Desde el punto de vista fitogeográfico pueden distinguirse cinco
        distritos: Maulino, Valdiviano, 

        Magallánico, del Pehuén y del Bosque Caducifolio. 

        La Faena El Toqui se ubica en el distrito valdiviano, en donde se
        desarrollan numerosas 

        asociaciones boscosas que se distribuyen de acuerdo con la altitud, la
        orientación y el declive. En 

        casi todas ellas figura Nothof agus dombeyi (coigüe), asociado a veces
        con Eucryphia cordifolia 

        (ulmo), Gevuina avellana (avellano), Persea lingue (lingue), Aextoxicum
        punctatum (olivillo), 

        Weinmannia trichosperma (tineo), Laureliopsis philippiana (tepa) y
        Dasyphyllum diacanthoides 

        (palo santo). 

        Otras veces Nothofagus dombeyi se asocia con Nothofagus obliqua (roble)
        y Nothofagus procera 

        (raulí), acompañados de diversas especies arbóreas comunes a la
        comunidad anterior; o bien se 

        asocia con Fitzroya cupressoides (alerce), gigantesca coníf era que
        puede alcanzar 50 metros de 

        altura y 3 metros de diámetro, Podocarpus nubigena (mañiu),
        Pilgerodendron uvifera (ciprés de las 

        guaytecas) y Saxegothaea conspicua (mañiu hembra).
  - source_sentence: Se menciona en el documento que la planta presente cierres temporales?
    sentences:
      - >-
        Fidel Oteiza 1971, of.202 - Providencia – Santiago-Chile.  Fono/Fax: 
        (56-2) 433 3200 - e-mail: contacto@vst.cl 

        19

        La movilidad cíclica es un fenómeno que se origina en suelos solicitados
        con 

        carga cíclica y rápida como en un sismo, de tal manera que se desarrolla
        un 

        comportamiento no drenado y se genera un  gran incremento de las
        presiones de 

        poros. Como consecuencia, se produce una  disminución de rigidez, lo que
        se 

        traduce en grandes deformaciones. 

        La experiencia muestra que tanto los suel os sueltos (contractivos) como
        densos 

        (dilatantes) pueden desarro llar movilidad cíclica, pe ro las
        deformaciones en 

        cada ciclo son considerablemente mayores en el caso de suelos sueltos y
        además 

        son crecientes a medida que aumentan los ciclos (Ishihara, 1985) 

        Para verificar la eventual licuefacción por movilidad cíclica, que
        pudiese darse 

        en caso de un evento sísmico, su evalua ción se realizará mediante el
        método 

        simplificado de Seed (Seed & Idriss, 1971). 

        La Figura 11  muestra las curvas obtenidas  de resistencia cíclica Rc
        lab v/s el 

        número de ciclos necesarios para alcanzar la movilidad cíclica, para las
        distintas 

        presiones de confinamientos ensayadas. El criterio de falla utilizado
        para definir 

        la cantidad de ciclos en que  se tiene movilidad cíclica,   fue el 100 %
        de exceso 

        de presión de poros. 

        En la Figura 11  se muestra además gráficamente la resistencia cíclica,
        que 

        corresponde para cada presión de confin amiento ensayada y para un
        número de 

        ciclos de carga de 30, que representa un sismo severo magnitud 8,0 
        (Seed & 

        Idriss, 1971).
      - >-
        Junto al mineral de interés han aparecido 

        periódicamente  “bolones”  o rodad os de diferentes tamaños, situación
        importante de 

        conocer para el tratamiento final de los taludes. 

        La mediana altura del cerro  donde se ubica el Yacimiento, la
        depositación oportuna de 

        los lodos debido a la corta distancia de la Planta de Proceso y el ar
        ranque de mineral 

        ordenado haciendo bodega en la zona inferior del Rajo , han contribuido
        a que 

        morfológicamente el terreno no haya sufrido grandes alteraciones debido
        a la 

        intervención del suelo. Una comprobación del buen  trabajo realizado es
        la nula 

        desestabilización de laderas, taludes y Rampas después del Terremoto del
        27/F/2010. 
         
        6.2.- Diseño del talud final del Rajo 
         
        Será importante tener en cuenta que antes de disminuir el ángulo de
        talud final,  es 

        imperiosamente necesario, complementar el Relleno en la zona inferior
        del Rajo con la 

        máxima cantidad de m3 de lodos para asentar  su base, con esto se cumple
        lo señalado 

        en la aprobación ambiental y además se  facilitan los trabajos
        tendientes a suavizar la 

        pendiente. El ángulo del PIT final de talud en toda la cara externa del
        rajo no debe 

        sobrepasar los 45°. 

        Considerando la existencia de los Peñascos y Bolones que repentinamente
        aparecen 

        cuando se excavan los Bancos en el sentido del avance, desde el Norte
        hacia el Sur y 

        siguiendo las instrucciones ante riores, se obtendrá una estabilidad
        adecuada que 

        impedirá posibles Remociones en Masa después del Abandono. También se
        debe tener
      - >-
        PLAN DE CIERRE  TEMPORAL – FAENA MINERA EL TOQUI  
         Sociedad Contractual Minera El Toqui 
        Capítulo 7 – Análisis de las Instalaciones 
          
         
        REVISIÓN [0]  

        7-68   
         
        para el cierre a causa de un sismo”, debido a que el método Room & Pil
        lar no considera dejar 

        grandes cavidades que pudiesen generar subsidencias y producir algún
        colapso en superficie y 

        además el propio método incluye dejar pilares remanentes que soportan
        las cámaras luego de ser 

        explotadas. Mientras que el resto de los riesgos fueron evaluados y 
        luego se propuso sus 

        respectivas medidas de cierre para su control.
  - source_sentence: ¿Cuál es la población total de la comuna de Catemu según el Censo 2017?
    sentences:
      - >-
        Plan de Cierre PAG Planta Catemu 

        Compañía Explotadora de Minas (CEMIN) 
         
         
         Rev. 0 | 20-04-18 25 | 158 
        3.5 Medio humano 
         
        La localidad más próxima a a la planta corresponde a la localidad del
        mismo nombre. Catemu , comuna 

        perteneciente a la provincia de San Felipe de Aconcagua, de la Región de
        Valparaíso . La planta se encuentra 

        ubicada a 85 km al norte de Santiago y 95 km del puerto de Valparaíso. 
         
        Según información del Instituto Nacional de Estadísticas (I NE) para el
        Ce nso 2017, la población total de la 

        comuna Catemu es de 13.998 habitantes, correspondiendo a los totales de
        6.982 hombres y 7.016 mujeres. 

        El número total de viviendas es 5.171 y densidad de población de 38,8
        (Hab/km 2). 
         
        La actividad económica que  predomina en la comuna de Catemu corresponde
        al sector de A gricultura, caza, 

        ganadería y silvicultura  (correspondiendo a un total del 32,7%).
        Respecto a l a actividad minera , esta  

        representa solo el 2,8% de la mano de obra comunal. 
         
        El ingreso autónomo promedio del hogar es, en el caso de la comuna de
        Catemu, inferior al promedio 

        regional ($618.371 para la región de Valparaíso), alcanzando los
        $415.146. Los niveles de pobreza son, según 

        la encuesta CASEN del año 2009, son relativamente bajos, para la comuna
        de Catemu es de 8,17%, inferior al 

        promedio regional (15,04%). Los niveles de desocupación se encuentran
        bajo el promedio regional (12% en 

        la Región de Valparaíso) llegando a 9,5%.
      - >-
        4.1. Sismo de Diseño 

        Como parte del proyecto, VST solicitó a SyS Ingenieros Consultores
        Ltda. 

        (SyS) el desarrollo de un estudio sísmico, con el objeto de determinar
        el sismo 

        de diseño del proyecto. El informe emitido sepresenta en el ANEXO B. 

        En este estudio, se establece el marco sismogénico de la zona del
        proyecto, 

        caracterizándose las fuentes sísmicas de la región. Para definir el
        sismo de 

        diseño, se revisa la sismicidad histórica e instrumental en la zona. El
        análisis
      - >-
        [7]. VST Ingenieros Ltda. (2006). Informe Analisis de Estabilidad.  

        Documento  1005-IB-GE-IT-03, Preparado para Minera Las Cenizas 

        S.A., Proyecto Ingeniería Básica Depó sito en Pasta, Planta Cabildo, 

        Santiago. 

        [8]. SYS Ingenieros Consultores Ltda. (2008). Estudio de Peligro
        Sísmico, 

        Espectros de Respuesta y Generación de Registros Artificiales, para el 

        Depósito en Pasta, Planta Cabildo, V Región. Documento  SS-08011-

        01e, Preparado para Minera Las Cenizas S.A., Proyecto Ingeniería Básica 

        Depósito en Pasta, Planta Cabildo, Santiago.
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
  - pearson_cosine
  - spearman_cosine
  - pearson_euclidean
  - spearman_euclidean
  - pearson_manhattan
  - spearman_manhattan
  - pearson_dot
  - spearman_dot
  - pearson_max
  - spearman_max
  - cosine_accuracy
  - cosine_accuracy_threshold
  - cosine_f1
  - cosine_f1_threshold
  - cosine_precision
  - cosine_recall
  - cosine_ap
  - euclidean_accuracy
  - euclidean_accuracy_threshold
  - euclidean_f1
  - euclidean_f1_threshold
  - euclidean_precision
  - euclidean_recall
  - euclidean_ap
  - manhattan_accuracy
  - manhattan_accuracy_threshold
  - manhattan_f1
  - manhattan_f1_threshold
  - manhattan_precision
  - manhattan_recall
  - manhattan_ap
  - dot_accuracy
  - dot_accuracy_threshold
  - dot_f1
  - dot_f1_threshold
  - dot_precision
  - dot_recall
  - dot_ap
  - max_accuracy
  - max_accuracy_threshold
  - max_f1
  - max_f1_threshold
  - max_precision
  - max_recall
  - max_ap
model-index:
  - name: SentenceTransformer based on sentence-transformers/all-MiniLM-L6-v2
    results:
      - task:
          type: semantic-similarity
          name: Semantic Similarity
        dataset:
          name: sts dev
          type: sts_dev
        metrics:
          - type: pearson_cosine
            value: 0.5831932863030391
            name: Pearson Cosine
          - type: spearman_cosine
            value: 0.5906194729573898
            name: Spearman Cosine
          - type: pearson_euclidean
            value: 0.5756994845513362
            name: Pearson Euclidean
          - type: spearman_euclidean
            value: 0.5906194729573898
            name: Spearman Euclidean
          - type: pearson_manhattan
            value: 0.5770566145594384
            name: Pearson Manhattan
          - type: spearman_manhattan
            value: 0.5928811030247982
            name: Spearman Manhattan
          - type: pearson_dot
            value: 0.5831933080761252
            name: Pearson Dot
          - type: spearman_dot
            value: 0.5906193987619038
            name: Spearman Dot
          - type: pearson_max
            value: 0.5831933080761252
            name: Pearson Max
          - type: spearman_max
            value: 0.5928811030247982
            name: Spearman Max
      - task:
          type: binary-classification
          name: Binary Classification
        dataset:
          name: quora duplicates dev
          type: quora_duplicates_dev
        metrics:
          - type: cosine_accuracy
            value: 0.7702297702297702
            name: Cosine Accuracy
          - type: cosine_accuracy_threshold
            value: 0.5348124504089355
            name: Cosine Accuracy Threshold
          - type: cosine_f1
            value: 0.7889160554197229
            name: Cosine F1
          - type: cosine_f1_threshold
            value: 0.46667712926864624
            name: Cosine F1 Threshold
          - type: cosine_precision
            value: 0.7223880597014926
            name: Cosine Precision
          - type: cosine_recall
            value: 0.8689407540394973
            name: Cosine Recall
          - type: cosine_ap
            value: 0.8889059831012722
            name: Cosine Ap
          - type: euclidean_accuracy
            value: 0.5554445554445554
            name: Euclidean Accuracy
          - type: euclidean_accuracy_threshold
            value: -0.5359790325164795
            name: Euclidean Accuracy Threshold
          - type: euclidean_f1
            value: 0.714193962748876
            name: Euclidean F1
          - type: euclidean_f1_threshold
            value: -0.5359790325164795
            name: Euclidean F1 Threshold
          - type: euclidean_precision
            value: 0.556
            name: Euclidean Precision
          - type: euclidean_recall
            value: 0.9982046678635548
            name: Euclidean Recall
          - type: euclidean_ap
            value: 0.383504836147922
            name: Euclidean Ap
          - type: manhattan_accuracy
            value: 0.5554445554445554
            name: Manhattan Accuracy
          - type: manhattan_accuracy_threshold
            value: -8.377983093261719
            name: Manhattan Accuracy Threshold
          - type: manhattan_f1
            value: 0.714193962748876
            name: Manhattan F1
          - type: manhattan_f1_threshold
            value: -8.377983093261719
            name: Manhattan F1 Threshold
          - type: manhattan_precision
            value: 0.556
            name: Manhattan Precision
          - type: manhattan_recall
            value: 0.9982046678635548
            name: Manhattan Recall
          - type: manhattan_ap
            value: 0.383634100548808
            name: Manhattan Ap
          - type: dot_accuracy
            value: 0.7702297702297702
            name: Dot Accuracy
          - type: dot_accuracy_threshold
            value: 0.5348123908042908
            name: Dot Accuracy Threshold
          - type: dot_f1
            value: 0.7889160554197229
            name: Dot F1
          - type: dot_f1_threshold
            value: 0.46667706966400146
            name: Dot F1 Threshold
          - type: dot_precision
            value: 0.7223880597014926
            name: Dot Precision
          - type: dot_recall
            value: 0.8689407540394973
            name: Dot Recall
          - type: dot_ap
            value: 0.8889059831012722
            name: Dot Ap
          - type: max_accuracy
            value: 0.7702297702297702
            name: Max Accuracy
          - type: max_accuracy_threshold
            value: 0.5348124504089355
            name: Max Accuracy Threshold
          - type: max_f1
            value: 0.7889160554197229
            name: Max F1
          - type: max_f1_threshold
            value: 0.46667712926864624
            name: Max F1 Threshold
          - type: max_precision
            value: 0.7223880597014926
            name: Max Precision
          - type: max_recall
            value: 0.9982046678635548
            name: Max Recall
          - type: max_ap
            value: 0.8889059831012722
            name: Max Ap

SentenceTransformer based on sentence-transformers/all-MiniLM-L6-v2

This is a sentence-transformers model finetuned from sentence-transformers/all-MiniLM-L6-v2 on the json dataset. It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: sentence-transformers/all-MiniLM-L6-v2
  • Maximum Sequence Length: 256 tokens
  • Output Dimensionality: 384 dimensions
  • Similarity Function: Cosine Similarity
  • Training Dataset:
    • json

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("GbrlOl/finetune-embedding-all-MiniLM-L6-v2-geotechnical-test-v3")
# Run inference
sentences = [
    '¿Cuál es la población total de la comuna de Catemu según el Censo 2017?',
    'Plan de Cierre PAG Planta Catemu \nCompañía Explotadora de Minas (CEMIN) \n \n \n Rev. 0 | 20-04-18 25 | 158 \n3.5 Medio humano \n \nLa localidad más próxima a a la planta corresponde a la localidad del mismo nombre. Catemu , comuna \nperteneciente a la provincia de San Felipe de Aconcagua, de la Región de Valparaíso . La planta se encuentra \nubicada a 85 km al norte de Santiago y 95 km del puerto de Valparaíso. \n \nSegún información del Instituto Nacional de Estadísticas (I NE) para el Ce nso 2017, la población total de la \ncomuna Catemu es de 13.998 habitantes, correspondiendo a los totales de 6.982 hombres y 7.016 mujeres. \nEl número total de viviendas es 5.171 y densidad de población de 38,8 (Hab/km 2). \n \nLa actividad económica que  predomina en la comuna de Catemu corresponde al sector de A gricultura, caza, \nganadería y silvicultura  (correspondiendo a un total del 32,7%). Respecto a l a actividad minera , esta  \nrepresenta solo el 2,8% de la mano de obra comunal. \n \nEl ingreso autónomo promedio del hogar es, en el caso de la comuna de Catemu, inferior al promedio \nregional ($618.371 para la región de Valparaíso), alcanzando los $415.146. Los niveles de pobreza son, según \nla encuesta CASEN del año 2009, son relativamente bajos, para la comuna de Catemu es de 8,17%, inferior al \npromedio regional (15,04%). Los niveles de desocupación se encuentran bajo el promedio regional (12% en \nla Región de Valparaíso) llegando a 9,5%.',
    '[7]. VST Ingenieros Ltda. (2006). Informe Analisis de Estabilidad.  \nDocumento N° 1005-IB-GE-IT-03, Preparado para Minera Las Cenizas \nS.A., Proyecto Ingeniería Básica Depó sito en Pasta, Planta Cabildo, \nSantiago. \n[8]. SYS Ingenieros Consultores Ltda. (2008). Estudio de Peligro Sísmico, \nEspectros de Respuesta y Generación de Registros Artificiales, para el \nDepósito en Pasta, Planta Cabildo, V Región. Documento N° SS-08011-\n01e, Preparado para Minera Las Cenizas S.A., Proyecto Ingeniería Básica \nDepósito en Pasta, Planta Cabildo, Santiago.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 384]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Semantic Similarity

Metric Value
pearson_cosine 0.5832
spearman_cosine 0.5906
pearson_euclidean 0.5757
spearman_euclidean 0.5906
pearson_manhattan 0.5771
spearman_manhattan 0.5929
pearson_dot 0.5832
spearman_dot 0.5906
pearson_max 0.5832
spearman_max 0.5929

Binary Classification

Metric Value
cosine_accuracy 0.7702
cosine_accuracy_threshold 0.5348
cosine_f1 0.7889
cosine_f1_threshold 0.4667
cosine_precision 0.7224
cosine_recall 0.8689
cosine_ap 0.8889
euclidean_accuracy 0.5554
euclidean_accuracy_threshold -0.536
euclidean_f1 0.7142
euclidean_f1_threshold -0.536
euclidean_precision 0.556
euclidean_recall 0.9982
euclidean_ap 0.3835
manhattan_accuracy 0.5554
manhattan_accuracy_threshold -8.378
manhattan_f1 0.7142
manhattan_f1_threshold -8.378
manhattan_precision 0.556
manhattan_recall 0.9982
manhattan_ap 0.3836
dot_accuracy 0.7702
dot_accuracy_threshold 0.5348
dot_f1 0.7889
dot_f1_threshold 0.4667
dot_precision 0.7224
dot_recall 0.8689
dot_ap 0.8889
max_accuracy 0.7702
max_accuracy_threshold 0.5348
max_f1 0.7889
max_f1_threshold 0.4667
max_precision 0.7224
max_recall 0.9982
max_ap 0.8889

Training Details

Training Dataset

json

  • Dataset: json
  • Size: 5,005 training samples
  • Columns: query, sentence, and label
  • Approximate statistics based on the first 1000 samples:
    query sentence label
    type string string int
    details
    • min: 8 tokens
    • mean: 27.85 tokens
    • max: 66 tokens
    • min: 34 tokens
    • mean: 233.48 tokens
    • max: 256 tokens
    • 0: ~45.30%
    • 1: ~54.70%
  • Samples:
    query sentence label
    ¿Cuál es la aceleración máxima obtenida para el sismo máximo probable según las fórmulas de atenuación de Ruiz y Saragoni (2005)? Las aceleraciones máximas obtenidas para cada uno de los sismos de diseño considerados, se
    determinaron a partir de las fórmulas de atenuación propuestas por Ruiz, S. y Saragoni, R. (2005),
    alcanzando un valor de 0,79g para el sismo de operación y de 0,86g para el sismo máximo probable,
    ver Figura 4.10.
    1
    ¿Qué tipo de información estratégica no se identifica como de utilidad pública para la faena minera El Toqui? PLAN DE CIERRE TEMPORAL – FAENA MINERA EL TOQUI
    Sociedad Contractual Minera El Toqui
    Capítulo 9 – Información Estratégica


    REVISIÓN [0]
    9-123

    9. INFORMACIÓN ESTRATÉGICA
    Para faena El Toqui , no se identifica información técnica que sea considerada de utilidad pública, tal
    como la relativa la infraestructura, monumentos nacionales, según definición de la ley 17.288, sitios de
    valor antropológico, arqueológico, histórico y, en general, los perte necientes al patrimonio
    arquitectónico y natural, en el área de influencia del proyecto.
    1
    ¿Qué condiciones se deben verificar al momento del cierre del tranque de relaves según el compromiso RES 1219-2013? 6
    1.2.3 Tranque de Relaves
    Se incorporan los compromisos asociados a Sectoriales, desde el punto de vista de Estabilidad Física.
    Los compromisos de Sectoriales asociados al Tranque de Relaves son los siguientes:
    RES 1219-2013. Plan de Cierre 2009
    • Al momento del cierre, se verificarán que las condiciones de estabilidad de los taludes de los
    muros estén de acuerdo a los coeficientes de sismicidad. Si esta condición no se cumple, se
    evaluará la instalación de un muro de protección al pie del talud, así como la compactación
    de berma de coronamiento.
    • Se manejarán las aguas superficiales para asegurar estabilidad del depósito en el largo
    plazo y el control de la erosión. Este manejo podrá incluir, entre otras, el reperfilamiento de la
    superficie del depósito para permitir un drenaje natural positivo o una infiltración aceptable, la
    evaporación de lagunas de aguas claras, un programa de manejo de cubeta, etc.
    En función de que los compromisos adquiridos por Anglo American, O...
    1
  • Loss: CoSENTLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "pairwise_cos_sim"
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • learning_rate: 2e-05
  • num_train_epochs: 100
  • warmup_ratio: 0.1
  • fp16: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: no
  • prediction_loss_only: True
  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 2e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 100
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Click to expand
Epoch Step Training Loss sts_dev_spearman_max quora_duplicates_dev_max_ap
0 0 - 0.5929 0.8889
0.7937 100 5.4081 - -
1.5794 200 4.5952 - -
2.3651 300 3.8915 - -
3.1508 400 3.397 - -
3.9444 500 3.0268 - -
4.7302 600 2.4922 - -
5.5159 700 2.0998 - -
6.3016 800 1.7355 - -
7.0873 900 1.4673 - -
7.8810 1000 1.3359 - -
8.6667 1100 0.8865 - -
9.4524 1200 0.9228 - -
10.2381 1300 0.5653 - -
11.0238 1400 0.6117 - -
11.8175 1500 0.4088 - -
12.6032 1600 0.4279 - -
13.3889 1700 0.4085 - -
14.1746 1800 0.2934 - -
14.9683 1900 0.288 - -
15.7540 2000 0.2059 - -
16.5397 2100 0.2632 - -
17.3254 2200 0.2341 - -
18.1111 2300 0.2264 - -
18.9048 2400 0.2186 - -
19.6905 2500 0.1205 - -
20.4762 2600 0.192 - -
21.2619 2700 0.1249 - -
22.0476 2800 0.132 - -
22.8413 2900 0.1026 - -
23.6270 3000 0.1111 - -
24.4127 3100 0.117 - -
25.1984 3200 0.0843 - -
25.9921 3300 0.1367 - -
26.7778 3400 0.1702 - -
27.5635 3500 0.1249 - -
28.3492 3600 0.0918 - -
29.1349 3700 0.0203 - -
29.9286 3800 0.0965 - -
30.7143 3900 0.0638 - -
31.5 4000 0.0965 - -
32.2857 4100 0.0948 - -
33.0714 4200 0.0115 - -
33.8651 4300 0.0336 - -
34.6508 4400 0.0784 - -
35.4365 4500 0.0265 - -
36.2222 4600 0.0127 - -
37.0079 4700 0.02 - -
37.8016 4800 0.0905 - -
38.5873 4900 0.0184 - -
39.3730 5000 0.0222 - -
40.1587 5100 0.0341 - -
40.9524 5200 0.0373 - -
41.7381 5300 0.0154 - -
42.5238 5400 0.0518 - -
43.3095 5500 0.0225 - -
44.0952 5600 0.0355 - -
44.8889 5700 0.0088 - -
45.6746 5800 0.0143 - -
46.4603 5900 0.0274 - -
47.2460 6000 0.0104 - -
48.0317 6100 0.0142 - -
48.8254 6200 0.0032 - -
49.6111 6300 0.0139 - -
50.3968 6400 0.0328 - -
51.1825 6500 0.0011 - -
51.9762 6600 0.0051 - -
52.7619 6700 0.0016 - -
53.5476 6800 0.0032 - -
54.3333 6900 0.0018 - -
55.1190 7000 0.004 - -
55.9127 7100 0.0023 - -
56.6984 7200 0.0011 - -
57.4841 7300 0.0009 - -
58.2698 7400 0.0042 - -
59.0556 7500 0.0018 - -
59.8492 7600 0.001 - -
60.6349 7700 0.0004 - -
61.4206 7800 0.0074 - -
62.2063 7900 0.003 - -
63.0 8000 0.0007 - -
63.7857 8100 0.0013 - -
64.5714 8200 0.002 - -
65.3571 8300 0.0007 - -
66.1429 8400 0.0004 - -
66.9365 8500 0.0006 - -
67.7222 8600 0.0007 - -
68.5079 8700 0.0051 - -
69.2937 8800 0.0001 - -
70.0794 8900 0.0006 - -
70.8730 9000 0.0001 - -
71.6587 9100 0.0002 - -
72.4444 9200 0.0001 - -
73.2302 9300 0.0003 - -
74.0159 9400 0.0002 - -
74.8095 9500 0.0002 - -
75.5952 9600 0.0006 - -
76.3810 9700 0.0 - -
77.1667 9800 0.0001 - -
77.9603 9900 0.0002 - -
78.7460 10000 0.0 - -
79.5317 10100 0.0001 - -
80.3175 10200 0.0002 - -
81.1032 10300 0.0 - -
81.8968 10400 0.0001 - -
82.6825 10500 0.0001 - -
83.4683 10600 0.0 - -
84.2540 10700 0.0001 - -
85.0397 10800 0.0 - -
85.8333 10900 0.0001 - -
86.6190 11000 0.0001 - -
87.4048 11100 0.0001 - -
88.1905 11200 0.0 - -
88.9841 11300 0.0001 - -
89.7698 11400 0.0001 - -
90.5556 11500 0.0001 - -
91.3413 11600 0.0001 - -
92.1270 11700 0.0 - -
92.9206 11800 0.0 - -
93.7063 11900 0.0 - -
94.4921 12000 0.0 - -
95.2778 12100 0.0001 - -
96.0635 12200 0.0 - -
96.8571 12300 0.0 - -
97.6429 12400 0.0 - -
98.4286 12500 0.0 - -
99.2143 12600 0.0 - -

Framework Versions

  • Python: 3.10.16
  • Sentence Transformers: 3.3.1
  • Transformers: 4.48.1
  • PyTorch: 2.5.1+cu124
  • Accelerate: 1.3.0
  • Datasets: 3.2.0
  • Tokenizers: 0.21.0

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

CoSENTLoss

@online{kexuefm-8847,
    title={CoSENT: A more efficient sentence vector scheme than Sentence-BERT},
    author={Su Jianlin},
    year={2022},
    month={Jan},
    url={https://kexue.fm/archives/8847},
}