introvoyz041
/

Ministral-3-14B-Reasoning-2512-ShiningValiant3-mlx-4Bit

Text Generation

shining-valiant

shining-valiant-3

ministral-3-14b

science-reasoning

machine-learning

artificial-intelligence

computer-science

information-theory

self-improvement

complex-systems

knowledge-management

problem-solving

4-bit precision

Model card Files Files and versions

introvoyz041 commited on 6 days ago

Commit

58a07cc

·

verified ·

1 Parent(s): fdecd2c

Upload config.json with huggingface_hub

Files changed (1) hide show

config.json +53 -0

config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+    "architectures": [
+        "Mistral3ForConditionalGeneration"
+    ],
+    "dtype": "bfloat16",
+    "image_token_index": 10,
+    "model_type": "mistral3",
+    "multimodal_projector_bias": false,
+    "projector_hidden_act": "gelu",
+    "quantization": {
+        "group_size": 64,
+        "bits": 4,
+        "mode": "affine"
+    },
+    "quantization_config": {
+        "group_size": 64,
+        "bits": 4,
+        "mode": "affine"
+    },
+    "spatial_merge_size": 2,
+    "text_config": {
+        "attention_dropout": 0.0,
+        "head_dim": 128,
+        "hidden_act": "silu",
+        "hidden_size": 5120,
+        "initializer_range": 0.02,
+        "intermediate_size": 16384,
+        "max_position_embeddings": 262144,
+        "model_type": "ministral3",
+        "num_attention_heads": 32,
+        "num_hidden_layers": 40,
+        "num_key_value_heads": 8,
+        "rms_norm_eps": 1e-05,
+        "rope_parameters": {
+            "beta_fast": 32.0,
+            "beta_slow": 1.0,
+            "factor": 16.0,
+            "llama_4_scaling_beta": 0.1,
+            "mscale": 1.0,
+            "mscale_all_dim": 1.0,
+            "original_max_position_embeddings": 16384,
+            "rope_theta": 1000000000.0,
+            "rope_type": "yarn",
+            "type": "yarn"
+        },
+        "sliding_window": null,
+        "use_cache": true,
+        "vocab_size": 131072,
+        "tie_word_embeddings": false
+    },
+    "transformers_version": "5.0.0.dev0",
+    "vision_feature_layer": -1
+}