lm1

Browse files

Files changed (13) hide show

lm1/language_model_config.json → language_model_config.json +0 -1
lm2/language_model.bin +0 -3
lm2/language_model_config.json +0 -34
passage/tokenizer_config.json +0 -1
prediction_head_0.bin +0 -3
prediction_head_0_config.json +0 -1
processor_config.json +0 -1
lm1/language_model.bin → pytorch_model.bin +0 -0
query/special_tokens_map.json +0 -1
query/vocab.txt +0 -0
passage/special_tokens_map.json → special_tokens_map.json +0 -0
query/tokenizer_config.json → tokenizer_config.json +0 -0
passage/vocab.txt → vocab.txt +0 -0

lm1/language_model_config.json → language_model_config.json RENAMED Viewed

@@ -1,5 +1,4 @@
 {
-  "_name_or_path": "sentence-transformers/LaBSE",
   "architectures": [
     "BertModel"
   ],

 {
   "architectures": [
     "BertModel"
   ],

lm2/language_model.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:d293ec78f56a8c0f471480fe13916b7055836e89f5fa1774b48cf1bc35228e7b
-size 1883803575

lm2/language_model_config.json DELETED Viewed

@@ -1,34 +0,0 @@
-{
-  "_name_or_path": "sentence-transformers/LaBSE",
-  "architectures": [
-    "BertModel"
-  ],
-  "attention_probs_dropout_prob": 0.1,
-  "directionality": "bidi",
-  "gradient_checkpointing": false,
-  "hidden_act": "gelu",
-  "hidden_dropout_prob": 0.1,
-  "hidden_size": 768,
-  "initializer_range": 0.02,
-  "intermediate_size": 3072,
-  "language": "english",
-  "layer_norm_eps": 1e-12,
-  "max_position_embeddings": 512,
-  "model_type": "dpr",
-  "name": "DPRContextEncoder",
-  "num_attention_heads": 12,
-  "num_hidden_layers": 12,
-  "pad_token_id": 0,
-  "pooler_fc_size": 768,
-  "pooler_num_attention_heads": 12,
-  "pooler_num_fc_layers": 3,
-  "pooler_size_per_head": 128,
-  "pooler_type": "first_token_transform",
-  "position_embedding_type": "absolute",
-  "projection_dim": 0,
-  "revision": null,
-  "transformers_version": "4.6.0.dev0",
-  "type_vocab_size": 2,
-  "use_cache": true,
-  "vocab_size": 501153
-}

passage/tokenizer_config.json DELETED Viewed

@@ -1 +0,0 @@

- {"do_lower_case": false, "do_basic_tokenize": true, "never_split": null, "unk_token": "[UNK]", "sep_token": "[SEP]", "pad_token": "[PAD]", "cls_token": "[CLS]", "mask_token": "[MASK]", "tokenize_chinese_chars": true, "strip_accents": null, "model_max_length": 512, "special_tokens_map_file": "C:\\Users\\DiarS/.cache\\huggingface\\transformers\\5fb4590a69eca214db9d31f0a4e90637a90fab773b17d382309a27f2a34da5be.dd8bd9bfd3664b530ea4e645105f557769387b3da9f79bdb55ed556bdd80611d", "name_or_path": "../input/mexdpr/LaBSE-BERT/tokenizer", "tokenizer_class": "DPRContextEncoderTokenizer", "vocab_size": 501153}

prediction_head_0.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:339cf0a79d42b8a0e283632633b8c7c079101ef627869b4b27f743462db4ecf9
-size 495

prediction_head_0_config.json DELETED Viewed

	@@ -1 +0,0 @@
1	- {"training": false, "similarity_function": "dot_product", "task_name": "text_similarity", "model_type": "text_similarity", "ph_output_type": "per_sequence", "global_loss_buffer_size": 150000, "label_tensor_name": "label_ids", "label_list": ["hard_negative", "positive"], "metric": "text_similarity_metric", "name": "TextSimilarityHead"}

processor_config.json DELETED Viewed

@@ -1 +0,0 @@

- {"baskets": [], "data_dir": "../input/mexdpr/fifths", "dev_filename": "nq-dev.json", "dev_split": 0.0, "embed_title": true, "max_samples": null, "max_seq_len": null, "max_seq_len_passage": 256, "max_seq_len_query": 64, "num_hard_negatives": 1, "num_positives": 1, "proxies": null, "shuffle_negatives": true, "shuffle_positives": false, "tasks": {"text_similarity": {"label_list": ["hard_negative", "positive"], "metric": "text_similarity_metric", "label_tensor_name": "label_ids", "label_name": "label", "label_column_name": null, "text_column_name": null, "task_type": "text_similarity"}}, "test_filename": "nq-test.json", "tokenizer": null, "train_filename": "nq-train.json", "query_tokenizer": "DPRQuestionEncoderTokenizer", "passage_tokenizer": "DPRContextEncoderTokenizer", "processor": "TextSimilarityProcessor"}

lm1/language_model.bin → pytorch_model.bin RENAMED Viewed

File without changes

query/special_tokens_map.json DELETED Viewed

	@@ -1 +0,0 @@
1	- {"unk_token": "[UNK]", "sep_token": "[SEP]", "pad_token": "[PAD]", "cls_token": "[CLS]", "mask_token": "[MASK]"}

query/vocab.txt DELETED Viewed

The diff for this file is too large to render. See raw diff

passage/special_tokens_map.json → special_tokens_map.json RENAMED Viewed

File without changes

query/tokenizer_config.json → tokenizer_config.json RENAMED Viewed

File without changes

passage/vocab.txt → vocab.txt RENAMED Viewed

File without changes