Jeong-su
/

car

+{
+    "model_type": "llava",
+    "architectures": ["LLaVAForVideoClassification"],
+    "learning_rate": 5e-05,
+    "train_batch_size": 2,
+    "eval_batch_size": 8,
+    "seed": 42,
+    "distributed_type": "multi-GPU",
+    "num_devices": 2,
+    "gradient_accumulation_steps": 8,
+    "total_train_batch_size": 32,
+    "total_eval_batch_size": 16,
+    "optimizer": "AdamW_Torch",
+    "betas": [0.9, 0.999],
+    "epsilon": 1e-08,
+    "lr_scheduler_type": "cosine",
+    "lr_scheduler_warmup_steps": 100,
+    "num_epochs": 1.0,
+    "framework_versions": {
+      "PEFT": "0.12.0",
+      "Transformers": "4.46.1",
+      "Pytorch": "2.3.1+cu121",
+      "Datasets": "3.1.0",
+      "Tokenizers": "0.20.3"
+    },
+    "description": "This model is a fine-tuned version of llava-hf/LLaVA-NeXT-Video-7B-hf on the merger, the LLM_dataset(4o) and the LLM_dataset(4mini) datasets.",
+    "training_data": {
+      "dataset_names": ["merger", "LLM_dataset(4o)", "LLM_dataset(4mini)"]
+    },
+    "training_hyperparameters": {
+      "learning_rate": 5e-05,
+      "train_batch_size": 2,
+      "eval_batch_size": 8,
+      "seed": 42,
+      "distributed_type": "multi-GPU",
+      "num_devices": 2,
+      "gradient_accumulation_steps": 8,
+      "total_train_batch_size": 32,
+      "total_eval_batch_size": 16,
+      "optimizer": "AdamW_Torch",
+      "betas": [0.9, 0.999],
+      "epsilon": 1e-08,
+      "lr_scheduler_type": "cosine",
+      "lr_scheduler_warmup_steps": 100,
+      "num_epochs": 1.0
+    }
+  }