salma-remyx commited on Mar 8, 2024

Commit

a927b42

1 Parent(s): b2d6090

Add files including subdirectories

Browse files

Files changed (17) hide show

.gitattributes +3 -35
README.md +3 -50
config.json +3 -0
generation_config.json +3 -0
ggml-model-f16.gguf +3 -0
ggml-model-q4_0.gguf +3 -0
mmproj-model-f16.gguf +3 -0
model-00001-of-00006.safetensors +3 -0
model-00002-of-00006.safetensors +3 -0
model-00003-of-00006.safetensors +3 -0
model-00004-of-00006.safetensors +3 -0
model-00005-of-00006.safetensors +3 -0
model-00006-of-00006.safetensors +3 -0
model.safetensors.index.json +3 -0
special_tokens_map.json +3 -0
tokenizer.model +3 -0
tokenizer_config.json +3 -0

.gitattributes CHANGED Viewed

@@ -1,35 +1,3 @@
-*.7z filter=lfs diff=lfs merge=lfs -text
-*.arrow filter=lfs diff=lfs merge=lfs -text
-*.bin filter=lfs diff=lfs merge=lfs -text
-*.bz2 filter=lfs diff=lfs merge=lfs -text
-*.ckpt filter=lfs diff=lfs merge=lfs -text
-*.ftz filter=lfs diff=lfs merge=lfs -text
-*.gz filter=lfs diff=lfs merge=lfs -text
-*.h5 filter=lfs diff=lfs merge=lfs -text
-*.joblib filter=lfs diff=lfs merge=lfs -text
-*.lfs.* filter=lfs diff=lfs merge=lfs -text
-*.mlmodel filter=lfs diff=lfs merge=lfs -text
-*.model filter=lfs diff=lfs merge=lfs -text
-*.msgpack filter=lfs diff=lfs merge=lfs -text
-*.npy filter=lfs diff=lfs merge=lfs -text
-*.npz filter=lfs diff=lfs merge=lfs -text
-*.onnx filter=lfs diff=lfs merge=lfs -text
-*.ot filter=lfs diff=lfs merge=lfs -text
-*.parquet filter=lfs diff=lfs merge=lfs -text
-*.pb filter=lfs diff=lfs merge=lfs -text
-*.pickle filter=lfs diff=lfs merge=lfs -text
-*.pkl filter=lfs diff=lfs merge=lfs -text
-*.pt filter=lfs diff=lfs merge=lfs -text
-*.pth filter=lfs diff=lfs merge=lfs -text
-*.rar filter=lfs diff=lfs merge=lfs -text
-*.safetensors filter=lfs diff=lfs merge=lfs -text
-saved_model/**/* filter=lfs diff=lfs merge=lfs -text
-*.tar.* filter=lfs diff=lfs merge=lfs -text
-*.tar filter=lfs diff=lfs merge=lfs -text
-*.tflite filter=lfs diff=lfs merge=lfs -text
-*.tgz filter=lfs diff=lfs merge=lfs -text
-*.wasm filter=lfs diff=lfs merge=lfs -text
-*.xz filter=lfs diff=lfs merge=lfs -text
-*.zip filter=lfs diff=lfs merge=lfs -text
-*.zst filter=lfs diff=lfs merge=lfs -text
-*tfevents* filter=lfs diff=lfs merge=lfs -text

+version https://git-lfs.github.com/spec/v1
+oid sha256:e951524a8b55d3792e37bc5821527f995d41219fbefd55c39adbe569086a41db
+size 2391

README.md CHANGED Viewed

@@ -1,50 +1,3 @@
----
-license: apache-2.0
----
-![image/png](https://cdn-uploads.huggingface.co/production/uploads/647777304ae93470ffc28913/iVKgqK6vTzCpCLVnWxmjA.png)
-# Model Card for SpaceLLaVA
-**SpaceLLaVA** uses LoRA to fine-tune [LLaVA](https://github.com/haotian-liu/LLaVA/tree/main) on a dataset designed with [VQASynth](https://github.com/remyxai/VQASynth/tree/main) to enhance spatial reasoning as in [SpatialVLM](https://spatial-vlm.github.io/)
-## Model Details
-### Model Description
-This model uses data synthesis techniques and publically available models to reproduce the work described in SpatialVLM to enhance the spatial reasoning of multimodal models.
-With a pipeline of expert models, we can infer spatial relationships between objects in a scene to create VQA dataset for spatial reasoning.
-- **Developed by:** remyx.ai
-- **Model type:** MultiModal Model, Vision Language Model, LLaVA
-- **License:** Apache-2.0
-- **Finetuned from model:** LLaVA
-### Model Sources
-- **Repository:** [VQASynth](https://github.com/remyxai/VQASynth/tree/main)
-- **Paper:** [SpatialVLM](https://arxiv.org/abs/2401.12168)
-## Uses
-Use this model to query spatial relationships between objects in a scene.
-## Citation
-```
-@article{chen2024spatialvlm,
-  title = {SpatialVLM: Endowing Vision-Language Models with Spatial Reasoning Capabilities},
-  author = {Chen, Boyuan and Xu, Zhuo and Kirmani, Sean and Ichter, Brian and Driess, Danny and Florence, Pete and Sadigh, Dorsa and Guibas, Leonidas and Xia, Fei},
-  journal = {arXiv preprint arXiv:2401.12168},
-  year = {2024},
-  url = {https://arxiv.org/abs/2401.12168},
-}
-@misc{liu2023llava,
-      title={Visual Instruction Tuning},
-      author={Liu, Haotian and Li, Chunyuan and Wu, Qingyang and Lee, Yong Jae},
-      publisher={NeurIPS},
-      year={2023},
-}
-```

+version https://git-lfs.github.com/spec/v1
+oid sha256:f8ea4eabb1259d4e862a6cd3c00b5cdcf28239a0b6d08e092a87a40d61834fd7
+size 1803

config.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:578885be8f66b03539a7f5e088c7379b2983e42962ddfc64526e33824e038def
+size 1395

generation_config.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f08b1ec30ce67f8c85e45853bcc5486639df57ff573cff0dd6b0e14efa7bca80
+size 154

ggml-model-f16.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4aa5e862c4a7c97fb617ed70a94ef6f5876dce2127fe0f1df12d6277d95d65e6
+size 26033303520

ggml-model-q4_0.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8d34cbb74271253ea69f32662f29611c8b6f2e4e784d95e139a2272141f84aa3
+size 7365834752

mmproj-model-f16.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1c8e0aa019d51f9529385ce87692f2fba40c679429b9af849ffbdce71b4b9366
+size 645414080

model-00001-of-00006.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bf813981eb324008586dc1f2643fe73e1c921d1305ef8af26037afcf37a8ae24
+size 4978265728

model-00002-of-00006.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:edf5d42738f2ddcc846e20484cee3e3776a3aefc34789c1702a09f96057bd650
+size 4970422160

model-00003-of-00006.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f05799392dd6d891aad87ac1778ce908e3c1bb21a1780cd97166106b84534c89
+size 4970422184

model-00004-of-00006.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8d6e5620ca84513a80337f909c5ad2d4f56173c8c91cc2bec0197c3d75b9bcd1
+size 4933701432

model-00005-of-00006.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f30ec13d596bcfb2b11ca34bf65ae011f3b0663dfd4bdaa18bb0edc2fe150bd4
+size 4933722144

model-00006-of-00006.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f5fae337a06c0c8481a848813586edfa919ac1ba495ad6433218318e4b4c0bb2
+size 1915248256

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:340636c562e772c515c3275553a697876135d82b2bb5c62e1d8c355e94c62eba
+size 79096

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4859e5dbde90e059988a0a2136d8df3f2773d4d2fc4c4543690028f0b2166e7f
+size 552

tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e556afd44213b6bd1be2b850ebbbd98f5481437a8021afaf58ee7fb1818d347
+size 499723

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b9dbbc4e94fa11210a21800939bd17da1e91b43f083833fb031b394111de6a9a
+size 936