Upload folder using huggingface_hub

Browse files

Files changed (9) hide show

.gitattributes +1 -0
README.md +28 -0
assets/tokenizer/vocabulary.spm +3 -0
config.json +25 -0
metadata.json +6 -0
model.weights.h5 +3 -0
preprocessor.json +39 -0
task.json +72 -0
tokenizer.json +19 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+assets/tokenizer/vocabulary.spm filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,28 @@

+---
+library_name: keras-nlp
+pipeline_tag: text-generation
+---
+This is a [`Gemma` model](https://keras.io/api/keras_nlp/models/gemma) uploaded using the KerasNLP library and can be used with JAX, TensorFlow, and PyTorch backends.
+This model is related to a `CausalLM` task.
+Model config:
+* **name:** gemma_backbone
+* **trainable:** True
+* **vocabulary_size:** 256000
+* **num_layers:** 26
+* **num_query_heads:** 8
+* **num_key_value_heads:** 4
+* **hidden_dim:** 2304
+* **intermediate_dim:** 18432
+* **head_dim:** 256
+* **layer_norm_epsilon:** 1e-06
+* **dropout:** 0
+* **query_head_dim_normalize:** True
+* **use_post_ffw_norm:** True
+* **use_post_attention_norm:** True
+* **final_logit_soft_cap:** 30.0
+* **attention_logit_soft_cap:** 50.0
+* **sliding_window_size:** 4096
+* **use_sliding_window_attention:** True
+This model card has been generated automatically and should be completed by the model author. See [Model Cards documentation](https://huggingface.co/docs/hub/model-cards) for more information.

assets/tokenizer/vocabulary.spm ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:61a7b147390c64585d6c3543dd6fc636906c9af3865a5548f27f31aee1d4c8e2
+size 4241003

config.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+    "module": "keras_nlp.src.models.gemma.gemma_backbone",
+    "class_name": "GemmaBackbone",
+    "config": {
+        "name": "gemma_backbone",
+        "trainable": true,
+        "vocabulary_size": 256000,
+        "num_layers": 26,
+        "num_query_heads": 8,
+        "num_key_value_heads": 4,
+        "hidden_dim": 2304,
+        "intermediate_dim": 18432,
+        "head_dim": 256,
+        "layer_norm_epsilon": 1e-06,
+        "dropout": 0,
+        "query_head_dim_normalize": true,
+        "use_post_ffw_norm": true,
+        "use_post_attention_norm": true,
+        "final_logit_soft_cap": 30.0,
+        "attention_logit_soft_cap": 50.0,
+        "sliding_window_size": 4096,
+        "use_sliding_window_attention": true
+    },
+    "registered_name": "keras_nlp>GemmaBackbone"
+}

metadata.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+    "keras_version": "3.5.0",
+    "keras_nlp_version": "0.14.4",
+    "parameter_count": 2617270528,
+    "date_saved": "2024-08-27@07:09:24"
+}

model.weights.h5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:571dc3744ca25e9ace9f136d26f03b864222180646ccf3ab858f50f07fc1510c
+size 10458288832

preprocessor.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+    "module": "keras_nlp.src.models.gemma.gemma_causal_lm_preprocessor",
+    "class_name": "GemmaCausalLMPreprocessor",
+    "config": {
+        "name": "gemma_causal_lm_preprocessor",
+        "trainable": true,
+        "dtype": {
+            "module": "keras",
+            "class_name": "DTypePolicy",
+            "config": {
+                "name": "float32"
+            },
+            "registered_name": null
+        },
+        "tokenizer": {
+            "module": "keras_nlp.src.models.gemma.gemma_tokenizer",
+            "class_name": "GemmaTokenizer",
+            "config": {
+                "name": "gemma_tokenizer",
+                "trainable": true,
+                "dtype": {
+                    "module": "keras",
+                    "class_name": "DTypePolicy",
+                    "config": {
+                        "name": "int32"
+                    },
+                    "registered_name": null
+                },
+                "proto": null,
+                "sequence_length": null
+            },
+            "registered_name": "keras_nlp>GemmaTokenizer"
+        },
+        "sequence_length": 128,
+        "add_start_token": true,
+        "add_end_token": true
+    },
+    "registered_name": "keras_nlp>GemmaCausalLMPreprocessor"
+}

task.json ADDED Viewed

	@@ -0,0 +1,72 @@

+{
+    "module": "keras_nlp.src.models.gemma.gemma_causal_lm",
+    "class_name": "GemmaCausalLM",
+    "config": {
+        "backbone": {
+            "module": "keras_nlp.src.models.gemma.gemma_backbone",
+            "class_name": "GemmaBackbone",
+            "config": {
+                "name": "gemma_backbone",
+                "trainable": true,
+                "vocabulary_size": 256000,
+                "num_layers": 26,
+                "num_query_heads": 8,
+                "num_key_value_heads": 4,
+                "hidden_dim": 2304,
+                "intermediate_dim": 18432,
+                "head_dim": 256,
+                "layer_norm_epsilon": 1e-06,
+                "dropout": 0,
+                "query_head_dim_normalize": true,
+                "use_post_ffw_norm": true,
+                "use_post_attention_norm": true,
+                "final_logit_soft_cap": 30.0,
+                "attention_logit_soft_cap": 50.0,
+                "sliding_window_size": 4096,
+                "use_sliding_window_attention": true
+            },
+            "registered_name": "keras_nlp>GemmaBackbone"
+        },
+        "preprocessor": {
+            "module": "keras_nlp.src.models.gemma.gemma_causal_lm_preprocessor",
+            "class_name": "GemmaCausalLMPreprocessor",
+            "config": {
+                "name": "gemma_causal_lm_preprocessor",
+                "trainable": true,
+                "dtype": {
+                    "module": "keras",
+                    "class_name": "DTypePolicy",
+                    "config": {
+                        "name": "float32"
+                    },
+                    "registered_name": null
+                },
+                "tokenizer": {
+                    "module": "keras_nlp.src.models.gemma.gemma_tokenizer",
+                    "class_name": "GemmaTokenizer",
+                    "config": {
+                        "name": "gemma_tokenizer",
+                        "trainable": true,
+                        "dtype": {
+                            "module": "keras",
+                            "class_name": "DTypePolicy",
+                            "config": {
+                                "name": "int32"
+                            },
+                            "registered_name": null
+                        },
+                        "proto": null,
+                        "sequence_length": null
+                    },
+                    "registered_name": "keras_nlp>GemmaTokenizer"
+                },
+                "sequence_length": 128,
+                "add_start_token": true,
+                "add_end_token": true
+            },
+            "registered_name": "keras_nlp>GemmaCausalLMPreprocessor"
+        },
+        "name": "gemma_causal_lm"
+    },
+    "registered_name": "keras_nlp>GemmaCausalLM"
+}

tokenizer.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+    "module": "keras_nlp.src.models.gemma.gemma_tokenizer",
+    "class_name": "GemmaTokenizer",
+    "config": {
+        "name": "gemma_tokenizer",
+        "trainable": true,
+        "dtype": {
+            "module": "keras",
+            "class_name": "DTypePolicy",
+            "config": {
+                "name": "int32"
+            },
+            "registered_name": null
+        },
+        "proto": null,
+        "sequence_length": null
+    },
+    "registered_name": "keras_nlp>GemmaTokenizer"
+}