Training in progress, step 500

Files changed (5) hide show

config.json ADDED Viewed

+{
+  "_name_or_path": "BridgeTower/bridgetower-large-itm-mlm-itc",
+  "architectures": [
+    "BridgeTowerForContrastiveLearning"
+  ],
+  "contrastive_hidden_size": 512,
+  "drop_rate": 0.1,
+  "head_hidden_scale": 2,
+  "hidden_act": "gelu",
+  "hidden_size": 1024,
+  "init_layernorm_from_vision_encoder": false,
+  "initializer_factor": 1,
+  "layer_norm_eps": 1e-05,
+  "link_tower_type": "add",
+  "logit_scale_init_value": 2.6592,
+  "model_type": "bridgetower",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 6,
+  "share_cross_modal_transformer_layers": true,
+  "share_link_tower_layers": false,
+  "text_config": {
+    "architectures": [
+      "BridgeTowerTextModel"
+    ],
+    "classifier_dropout": null,
+    "hidden_size": 1024,
+    "initializer_range": 0.02,
+    "intermediate_size": 4096,
+    "model_type": "bridgetower_text_model",
+    "num_attention_heads": 16,
+    "num_hidden_layers": 24
+  },
+  "tie_word_embeddings": false,
+  "torch_dtype": "float32",
+  "transformers_version": "4.43.4",
+  "vision_config": {
+    "architectures": [
+      "BridgeTowerVisionModel"
+    ],
+    "hidden_size": 1024,
+    "image_size": 294,
+    "model_type": "bridgetower_vision_model",
+    "num_hidden_layers": 24,
+    "patch_size": 14
+  }
+}

gaudi_config.json ADDED Viewed

+{
+  "autocast_bf16_ops": null,
+  "autocast_fp32_ops": null,
+  "optimum_version": "1.23.1",
+  "transformers_version": "4.43.4",
+  "use_dynamic_shapes": true,
+  "use_fused_adam": true,
+  "use_fused_clip_norm": true,
+  "use_torch_autocast": true
+}

model.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:62267308dc0dfc1cd693dc5e0aefd597441428ade7c3385e09774c90259cc25d
+size 3462397716

runs/Oct14_22-43-32_workload-ai-workshop/events.out.tfevents.1728945829.workload-ai-workshop.3947.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:b81fd62ac8061dc44df0f27d6da66667b7ce21333817bf1399956519154fa580
+size 26794

training_args.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:cefd04cd2f66ca3f4d8dc275cce721601bc71dfc6d7221c880524b6c40fbd412
+size 4984