Edit model card

SentenceTransformer based on sentence-transformers/multi-qa-mpnet-base-dot-v1

This is a sentence-transformers model finetuned from sentence-transformers/multi-qa-mpnet-base-dot-v1. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: MPNetModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("mustozsarac/finetuned-one-epoch-multi-qa-mpnet-base-dot-v1")
# Run inference
sentences = [
    "AKP'li vekilin traktör açıklamasına tepki",
    'Cumhuriyet Halk Partisi (CHP) Niğde Milletvekili Ömer Fethi Gürer, “Türkiye’de AK Parti’den önce traktör yoktu” diyen AK Parti Grup Başkanvekili ve Ankara Milletvekili Leyla Şahin Usta’ya tepki gösterdi. Usta’nın Meclis Genel Kurulu’ndaki konuşmasını, “İnkarcılığın bu kadara da pes” diyerek eleştiren CHP Milletvekili ve TBMM Tarım, Orman ve Köyişleri Komisyon Üyesi Ömer Fethi Gürer, Osmanlı Döneminde bile 4 traktörün olduğunu anımsattı. “ATATÜRK’ÜN TRAKTÖR ÜZERİNDEKİ FOTOĞRAFLARINA İYİ BAKIN” 1923 yılında Cumhuriyet kurulduğunda, Büyük Önder Mustafa Kemal Atatürk’ün ilk talimatlarından birinin de tarımda makineleşmenin gerçekleşmesi yönünde olduğunu hatırlatan Milletvekili Gürer, “Bu nedenle 221 traktör ithal edildi. Atatürk’ün de üzerinde olduğu traktör fotoğrafları arşivlere girildiğinde görülebilir” dedi. ATATÜRK ASKERE GİDEN ÇOCUKLARA TRAKTÖR EĞİTİMİ VERİLMESİNİ İSTEMİŞTİ CHP Milletvekili Ömer Fethi Gürer, Atatürk’ün askere giden köylü çocuklarına traktör kursu verilerek, ileride traktör sayısı artacağı için gençlerin köylerine döndüklerinde, traktör kullanıyor olmalarının sağlanmasını istediğini de ifade etti. 1980’LERDE TRAKTÖR ÜRETİMI HIZLA ARTTI Türkiye’de 1944 yılında 956 traktörün bulunduğuna işaret eden CHP Milletvekili Ömer Fethi Gürer, “1960 yılında ülkemizde 42 bin 136 traktör vardı ki, Türkiye o dönemde traktör üretimine de başlamıştı. 1980’lere kadar traktör üretimi hızla arttı. 1980’lerden sonra traktör fabrikalarından birinde ben de genel müdür olarak görev yaptım. Ama AK Parti Grup Başkanvekilinin sözlerini duyunca, insana ‘Bu kadar da olmaz’ dedirtiyor. Sanayi ve Teknoloji Bakanı da bu konuşma olurken Mecliste genel kurulunda idi. En azından Bakan bir düzeltme yapmalı idi. Grup Başkanvekili Usta bu sözlerinden sonra da konuştu ancak bir düzeltme yapmadı. Görünen o ki sözlerini düzeltme yerine hala öyle sanıyor. Cumhuriyet tarihi bilmemek de böyle bir şey” diye konuştu. 2000 YILINDA 1 MİLYONA YAKIN TRAKTÖR VARDI “Türkiye’de traktörün olmadığını iddia etmenin, iddia sahibinin ülkemizin dününün sanayide gelişmelerini de bilmediğini gösterir” diyen Milletvekili Gürer, “Çünkü 2000 yılına gelindiğinde ülkemizde traktör sayısı 941 bin 843 adetti. 1 tane değil, 5 tane değil, 10 tane değil, neredeyse 1 milyon traktör vardı ülkemizde” dedi. Gürer bir traktör fabrikasında 1980 sonrası yönetici olarak çalıştığını da ifade ederek 1960’lardan sonra ülkede üretimi yapılan traktörler ile Türkiye’nin önemli bir aşamaya geldiğini ifade etti. Gürer, “AKP’den önce bir şey yoktu masalının iş yaptığı sanısı bundan sonra da benzer açıklamaların olmasını olası kılıyor. Cumhuriyet tarihini bilmeyenler sanayi ununun, şekerin, bezin ithal olduğunu ve ülkemizde Cumhuriyetin ilk yıllarında yapılan fabrikalarla üretildiğini öğrenmeyenler, fabrika yapan fabrika olduğu gibi tiyatro salonlarına dahi sahip şeker fabrikalarını yapmak değil satmaktan anlayanların, ülkenin dünü-bugünü arasında kamuda sata sata bitiremedikleri varlıkların nasıl oluştuğunu ve halen dünya Endüstri 5.0 geçmişken Endüstri 3.5’te debelendiğini göstermemek için her türlü ifadeyi rahatlıkla kullanabiliyorlar” diye konuştu.',
    "Milli Eğitim Bakanı Tekin, 24 Kasım Öğretmenler Günü dolayısıyla sosyal medya hesabından bir mesaj yayımladı. Mesajında, 100 yıldır var olan şanlı Cumhuriyet'in ilelebet payidar kalmasında öğretmenlerin her zaman en önemli görevi üstlendiğini belirten Tekin, ”Aziz milletimiz, en çetin ve en mihver zamanlarda dahi görevini özveriyle ifa eden, vatan evlatlarının yarınları için canı gönülden çalışarak daha müreffeh bir geleceği tahayyül eden meslektaşlarımın omuzlarında yükselecek.” değerlendirmesinde bulundu. 100 yıldır var olan şanlı Cumhuriyetimizin ilelebet payidar kalmasında her zaman en önemli görevi üstlenen kıymetli Öğretmenim! Aziz milletimiz, en çetin ve en mihver zamanlarda dahi görevini özveriyle ifa eden, vatan evlatlarının yarınları için canıgönülden çalışarak daha… pic.twitter.com/074mzguYYn — Yusuf Tekin (@Yusuf__Tekin) November 22, 2023 Bakan Tekin, şunları kaydetti: ”Türkiye Yüzyılı'nın mimarları olmanız, evlatlarımızın ülkemize faydalı bir nesil olarak yetişmesinde sarf ettiğiniz emek ve maarif davamıza ruh katan vakur duruşunuz için sizlere minnettarım. Uhdenize emanet edilen öğrencilerinizi, bir anne, bir baba şefkatiyle benimseyip her daim onları düşündüğünüzü biliyorum. O sebepledir ki ülkemizin tüm başarısı, Sayende Öğretmenim.” Tekin, Bakanlık tarafından hazırlanan ”Sayende” adlı kısa filmi de paylaştı. Sanatçılar filmde gönüllü olarak yer aldı Milli Eğitim Bakanlığının 24 Kasım Öğretmenler Günü kutlamaları içi hazırladığı ”Sayende” adlı kısa filmde Gülen Karaman, Ziya Kürküt, Zuhal Yalçın, Sefa Zengin, Gülçin Gülrek ve Özge İnce rol aldı. Arzu Balkan'ın seslendirdiği filmde müzik, edebiyat, tiyatro ve sporla ilgilenen dört öğrencinin sorunlarını, kendi evlatlarının sorunlarıymış gibi benimseyen öğretmenlerin, onların hayatlarına dokunuşu konu edildi. Dört öğrencinin farklı alanlarda çalışma yaparken yaşadıkları zorluklar ekrana yansıtılırken öğretmenlerinin bu sorunlara çözüm bulmak için düşüncelerine yer verildi. Öğretmenler odasındaki mutlu finalde öğrenciler, onlara yol gösteren öğretmenleri ile buluşup Öğretmenler Günü'nü kutladı. Tüm sanatçıların gönüllü olarak rol aldığı projenin çekimleri Kabataş Lisesi, Maçka Mesleki ve Teknik Anadolu Lisesi ile Nişantaşı Anadolu Lisesi'nde gerçekleştirildi.",
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Training Details

Training Dataset

Unnamed Dataset

  • Size: 62,964 training samples
  • Columns: sentence_0, sentence_1, and label
  • Approximate statistics based on the first 1000 samples:
    sentence_0 sentence_1 label
    type string string float
    details
    • min: 4 tokens
    • mean: 25.67 tokens
    • max: 70 tokens
    • min: 3 tokens
    • mean: 439.19 tokens
    • max: 512 tokens
    • min: 1.0
    • mean: 1.0
    • max: 1.0
  • Samples:
    sentence_0 sentence_1 label
    “Case pentru generali” O teribilă afacere, pusă la cale la vîrful Armatei, a fost dezvăluită de Jurnalul Naţional în decembrie 1999. Mărimile oştirii au pus mîna pe locuinţe de lux, din cota MApN, chiar în centrul Capitalei, deşi mai aveau şi alte date de stat şi Armată. Operaţiunea, dovedită de cotidianul nostru, a fost anchetată de Parchetul Militar şi, după o primă spălare pe mîini, dosarul a fost redeschis la cinci ani de la articolele noastre. MApN • Afacerea care a ştirbit imaginea morală a armatei O teribilă afacere, pusă la cale la vîrful Armatei, a fost dezvăluită de Jurnalul Naţional în decembrie 1999. Mărimile oştirii au pus mîna pe locuinţe de lux, din cota MApN, chiar în centrul Capitalei, deşi mai aveau şi alte case date de stat şi Armată. Operaţiunea, dovedită de cotidianul nostru, a fost anchetată de Parchetul Militar şi, după o primă spălare pe mîini, dosarul a fost redeschis la cinci ani de la articolele noastre. Trecuseră, deja, cîteva luni de cînd o anonimă care a ajuns pe masa procurorilor militari, conduşi atunci de generalul Dan Voinea, dădea frisoa­ne. Mai mulţi ofiţeri din Garnizoana Bucureşti erau scandalizaţi de faptul că un grup de generali, care-i avea în frunte pe şeful Statului Ma­jor General de la acea vreme, genera­lul Constantin Degeratu, obţinuse al doilea şi chiar al treilea rînd de apartamente din cota MApN, deşi 20.000 de cadre militare trăiau, atunci, în condiţii mizere. Locuinţele de serviciu vizate erau în Centrul Civic. Faptele sesizate erau descrise foarte explicit şi trimiteau direct la do­vezi. Anonima fusese scrisă de cîţiva ofiţeri ce au avut acces la docu­mente şi care se temeau foarte tare de represalii. Ca de obicei, nu se în­tîm­pla nimic. Dezvăluirile din de­cembrie 1999 din Jurnalul Naţional despre acest subiect, publicate într-un serial cu nouă episoade, au im­pulsionat investigaţiile, atît la Parchetul Militar, cît şi în interiorul ministerului. Abia atunci, Victor Ba­biuc, ministrul Apărării, a ordonat ver­bal “verificarea aspectelor semna­late în ziarul Jurnalul Naţional din 16-20 decembrie 1999, referitoare la «re­partizarea şi vînzarea locuinţe­lor de serviciu unor colonei şi gene­rali cu funcţii importante»“ de către o comisie din Inspectoratul General al Ministerului Apărării Naţionale. De altfel, cînd a demisionat Victor Babiuc a recunoscut într-un interviu acordat nouă: “În legătură cu Afa­ce­rea «Case pentru generali», într-adevăr, sînt nereguli”. RAPORTUL. La începutul anului 2000, an electoral, nimeni nu se grăbea să găsească eventuali vinovaţi. În toamna acelui an, cotidia­nul nostru a oferit şi dovada afacerii. Comisia Inspectoratului MApN confirma re­zultatele articolelor noastre şi arăta şi adevărata amploare a ope­raţiunii: peste 60 de generali şi colonei implicaţi. Raportul Inspectoratului MApN a fost dosit la cel mai înalt nivel, dar am reuşit să intrăm în posesia lui şi, astfel, să-l publicăm. Atunci, în urma articolelor, la adresa subsemnatului au fost făcute presiuni foarte mari. Inclusiv insinuări adresate vecinilor că aş fi traficant de dro­guri, iar locuinţa mi-a fost spartă demonstrativ. Nu lipsea nimic. In­vestigaţiile făcute de ofiţerii Inspec­toratului MApN spuneau că locuinţe de serviciu din cota Armatei au fost luate la preţ de nimic, cu mult sub cel al pieţei, de generali şi colonei cu funcţiile cele mai mari în Ministerul Apărării Naţionale, deşi aceştia nu aveau dreptul, conform legilor, şi dădu­seră declaraţii în fals la notariate. “Apreciem că repartizarea unor locuinţe de serviciu unor ofiţeri care deţin sau au deţinut şi îns­tră­­inat copiilor locuinţe proprie­ta­te perso­nală reprezintă încăl­carea legislaţiei în vigoare”, era una dintre conclu­ziile ra­portului. Mai mult, unii îşi cumpă­ra­seră în rate, deşi nici acest lucru nu era permis de lege, potri­vit ofiţerilor Inspectoratului MApN. Pe lista Inspectoratului se afla şi viitorul şef al Statului Major General, ge­nera­lul Eugen Bădălan. PUNCT. Pentru declanşarea şi de­rularea afacerii s-au făcut presiuni şi asupra ofiţerilor care aveau atri­buţii de verificare a legalităţii re­partiţiei din Comenduirea Garnizoanei Bucureşti, care au priceput ime­diat: “A aprobat ministrul!”. Deloc surprinzătoare a fost viteza cu care în noiembrie 2000 dosarul “de la Parchetul Militar” a şi fost în­chis. Nimeni nu era vinovat. “Actele premergătoare administrate în cau­ză nu au confirmat învinuirile tendenţioase aduse unor cadre militare, cu funcţii de conducere, din structurile MApN. De asemenea, nu este sarcina urmăririi penale de a lua po­ziţii critice faţă de anumite iniţia­ti­ve legislative ale ministerului, ori de a interpreta corectitudinea sau moralitatea unuia sau altuia din actele normative ce au stat la baza procesului de vînzare a locuinţelor de serviciu din administrarea MapN”, spunea rezoluţia semnată de pro­curorul militar, col. Dumitru Carp. DE LA CAPĂT. La bilanţul Ser­viciului de Telecomunicaţii Speciale pe anul 2001, şeful serviciului, Tudor Tănase, a prezentat ce a găsit Curtea de Conturi în “ograda” pe care tocmai o prelua. Astfel, Curtea de Conturi atrăgea atenţia asupra achiziţiei de către STS tocmai a apartamentului de patru camere din Cluj-Napoca pe care generalul Constantin Degeratu, fostul şef al Sta­tului Major General, o deţinea. E taman dovada că generalul Degeratu n-avea cum să-şi cumpere locuinţa de serviciu în 1999. Conducerii din momentul achiziţiei a STS i se imputa faptul că suma de 42.000 de dolari, cu care s-a plătit apartamentul, de­păşea cotaţia pieţei de la acea vreme, iar legislaţia privind achizi­ţionarea de imobile pentru STS a fost în­călcată. De atunci şi pînă în 2005 nu s-a mai întîmplat nimic. De pe po­ziţia de consilier de stat la Admi­nistraţia Prezidenţială, generalul Constantin Degeratu ne declara că nimic n-a fost în neregulă. “Nu a existat nici o ilegalitate. La mutarea mea de la Cluj aici, în Capitală, am stat un timp, provizoriu, cu familia, la un cămin de garnizoană. Apoi, la un moment dat, s-a pus chiar pro­ble­ma trecerii mele în rezervă, că, dacă nu, mă mut definitiv în Bu­cu­reşti. Mai întîi mi s-a oferit o altă lo­cu­inţă, care, chiar dacă se afla într-o po­ziţie centrală, nu i-a plăcut soţiei mele. A doua, cea în care locuim şi acum, i-a plăcut, chiar dacă avea unele probleme. Ne-am mutat, iar apoi, ani la rînd, a tot trebuit să facem reparaţii pentru că, practic, ori de cate ori ploua, se produceau infiltraţii. Asta este locuinţa cu pricina. Ştiu că la un moment dat a existat o cercetare a Parchetului, dar, concret, nimeni nu a fost acuzat de vreo încălcare a legii”, spunea Degeratu în 2005. Locuinţa de care se plîngea generalul este un apartament duplex pe B-dul Unirii. Poveste fără sfîrşit În 2005, accesul la Dosarul “Ca­­­se pentru generali”, era deja închis. Generalul Samoilă Joar­ză, şeful Secţiei Parchetelor Militare, mirat că ne-aducem amin­te de o aşa anchetă, ne-a spus că nu poate să ne permită accesul la el fiindcă are documen­te secrete. Mai mult, ne-a mai zis că, dacă tot întrebăm de el, îl va reciti pentru a vedea cum s-au pus soluţiile. La scurt timp, şeful pro­curorilor militari a decis infirma­rea soluţiei de NUP date în anul 2000. Fapt care demonstrea­ză că şi generalului i s-a părut ceva în neregulă în cazul respectiv. Joar­ză ne-a de­cla­rat atunci că Jur­na­lul Na­ţio­nal a avut mai multe informaţii decît procurorii militari. Din 2005 şi pînă astăzi au mai trecut încă trei ani. Dosa­rul a fost repartizat la procurori militari care erau în prag de trecere în rezervă şi an­che­ta a continuat, normal, cu sincope. Un alt procu­ror, o nouă fa­miliarizare cu cazul şi tot aşa. Cert este că la nouă ani de cînd am publicat pri­mul articol nimeni nu a fost găsit vinovat, nici măcar moral, pentru afacerea cu lo­cu­inţele de serviciu ale Armatei. Şi nimeni, după toate probabilităţile, nici n-o să fie. Citiţi şi: Monarhistul a devenit republican în trei zile Epopeea ”Mineriadei” din ianuarie 1999 Reportaj fără vestă antiglonţ Bebe Carabină s-a înţepat la Ghimpaţi Prindeţi bestia! La 20 august 1996, Jurnalul Naţional a stîrnit un iureş politic preluînd un interviu acordat de Emil Constantinescu revistei Micro Magazin, revistă de limbă română ce apărea în Statele Unite ale Americii. Interviul fusese luat în timpul unei vizite pe care candidatul de atunci al CDR la Preşedinţie o făcuse în comunităţile româneşti Los Angeles, Chicago şi New York.Aprilie 1998, primăvara în care Armata, M.I. şi serviciile secrete au fost implicate într-un scandal imens, care a ricoşat şi în clasa politică: Ţigareta II. Atunci, Jurnalul Naţional a relatat zi de zi amănuntele acestei afaceri extrem de încîlcite. Aflaţi, de multe ori, cu un pas înaintea anchetatorilor, reporterii noştri au dezvăluit informaţii spectaculoase pe care autorităţile le-ar fi dorit ascunse pentru totdeauna.Ianuarie 1999, luna în care România s-a aflat în pragul dezastrului. Ieşiţi din bezna galeriilor, minerii din Valea Jiului s-au răzvrătit împotriva Guvernului şi au fost la un pas de a arunca ţara în haos. Au fost zile şi nopţi dramatice, în cursul cărora reporterii Jurnalului Naţional s-au aflat în ”linia întîi” a evenimentelor, martori ai dezastrului de la Costeşti, dar şi ai ”Păcii de la Cozia”.”De nouă ani, Iugoslavia nu mai are pace. Se strecoară printre războaie, dar nu vrea să recunoască. Nu vrea să se lase doborîtă. Îmbină pacea şi războiul aşa de bine, încît nu mai ştii să faci diferenţa”.”Ghimpaţi, un sătuc liniştit din Giurgiu, a intrat în istorie cu tot cu vajnicii săi paznici comunali, care au reuşit performanţa de a-l prinde pe unul dintre cei mai căutaţi bandiţi din România. Ce n-a putut face Poliţia atîta amar de vreme s-a întîmplat sîmbătă noaptea datorită sănătosului spirit al ţăranului român.””Jurnalul Naţional oferă recompensă 5 milioane de lei pentru informaţiile ce vor duce la prinderea şoferului criminal” – anunţa ziarul de luni, 17 iulie 2000, anul VIII, nr. 2178. Campania a avut succes. Bestiile care au accidentat un copil pe o stradă din Bucureşti, apoi l-au răpit şi l-au lăsat să moară pe un teren viran în zona Vitan au fost identificate cu ajutorul martorilor. 1.0
    Filenin Efeleri'nin rakibi Belarus CEV Avrupa Altın Ligi'nde ilk etap karşılaşmalarında 3'te 3 yapan ”Filenin Efeleri”, 4-6 Haziran 2021 tarihlerinde Portekiz'de oynanacak ikinci etap karşılaşmaları öncesinde son antrenmanını İstanbul'da yaptı. TVF Burhan Felek Vestel Voleybol Salonu'nda başantrenör Nedim Özbey yönetiminde yapılan antrenmanda milliler, hücum ve savunma üzerine taktik uygulamalar çalıştı. Milli kafile, ikinci etap karşılaşmalarını oynamak üzere bugün Portekiz'e hareket edecek. C Grubu'nda Belarus, Çekya ve Portekiz ile mücadele edecek milli takımın maçları TRT Spor ve TRT Spor Yıldız'da yayınlanacak. 4 Haziran Cuma: 18.00 Türkiye-Belarus 5 Haziran Cumartesi: 20.00 Portekiz-Türkiye 6 Haziran Pazar: 17.00 Çekya-Türkiye Statü İki ayrı turnuva şeklinde düzenlenecek Avrupa Altın Ligi'nin sonunda gruplarını ilk sırada tamamlayan 3 takım ve final grubuna ev sahipliği yapacak ülke (Belçika), Dörtlü Final oynamaya hak kazanacak. 1.0
    Ankara için fırtına ve kuvvetli yağış uyarısı Meteoroloji Genel Müdürlüğü tarafından yapılan son değerlendirmelere göre, yarın kuvvetli yağış beklenen Ankara'da rüzgarın da güney (lodos) yönlerden fırtına (50-70 km/saat), yer yer kuvvetli fırtına şeklinde esmesi bekleniyor. Ankara Valiliği, yarından itibaren beklenen sağanak ve kuvvetli fırtına nedeniyle dikkatli ve tedbirli olunması uyarısında bulundu. Valilikten yapılan açıklamada, Meteoroloji Genel Müdürlüğünden alınan son verilere göre, yarından itibaren Balkanlar üzerinden gelecek yağışlı havanın etkisiyle Ankara genelinde sağanak ve yer yer gök gürültülü sağanak beklendiği, yağışların cumartesi, pazar ve pazartesi yer yer kuvvetli olacağının tahmin edildiği belirtildi. Açıklamada, ”Cumartesi günü rüzgarın güney yönlerden fırtına, yer yer kısa süreli kuvvetli fırtına, yüksek kesimlerde tam fırtına şeklinde eseceği ve mevsim normallerinin üzerinde olması beklenen hava sıcaklıklarının pazar gününden itibaren yağışlarla beraber hissedilir derecede azalarak mevsim normalleri civarına düşmesi bekleniyor. Rüzgar ve fırtına sebebiyle ulaşımda aksamalar, çatı uçması, ağaç ve direk devrilmesi, soba ve doğal gaz kaynaklı zehirlenmeler gibi olumsuzluklara karşı dikkatli ve tedbirli olunmalıdır.” uyarısına yer verildi. AFAD, SMS ile uyardı Afet ve Acil Durum Yönetimi Başkanlığı (AFAD) ise cep telefonlarına gönderdiği SMS'te, ”Meteorolojiye göre yarın Ankara'da kuvvetli lodos ve yağış bekleniyor. Baca zehirlenmesi, ulaşımda aksamalar ve çatı uçmasına karşı dikkatli olun.” uyarısı yaptı. 1.0
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • num_train_epochs: 1
  • multi_dataset_batch_sampler: round_robin

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: no
  • prediction_loss_only: True
  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1
  • num_train_epochs: 1
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.0
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: round_robin

Training Logs

Epoch Step Training Loss
0.1270 500 0.3574
0.2541 1000 0.3181
0.3811 1500 0.2846
0.5081 2000 0.2585
0.6352 2500 0.2455
0.7622 3000 0.235
0.8892 3500 0.2324

Framework Versions

  • Python: 3.10.12
  • Sentence Transformers: 3.0.1
  • Transformers: 4.41.2
  • PyTorch: 2.3.0+cu121
  • Accelerate: 0.31.0
  • Datasets: 2.20.0
  • Tokenizers: 0.19.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply}, 
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}
Downloads last month
0
Safetensors
Model size
109M params
Tensor type
F32
·
Inference API
This model can be loaded on Inference API (serverless).

Finetuned from