flashresearch
/

FlashResearch-4B-Thinking

Model card Files Files and versions

sumo43 commited on Oct 27

Commit

c4e1fe0

·

verified ·

1 Parent(s): 187f858

Update README.md

Files changed (1) hide show

README.md +8 -8

README.md CHANGED Viewed

@@ -6,7 +6,7 @@ datasets:
-# CheapResearch-4B-Thinking
 <img src='cheap.png' width='700'>
@@ -19,7 +19,7 @@ datasets:
 * **Base**: Qwen 4B (dense)
 * **Teacher**: Tongyi DeepResearch 30B A3B (MoE)
 * **Method**: SFT distillation on **33k** curated deep-research examples
-* **Dataset**: [`cheapresearch/CheapResearch-DS-33k`](https://huggingface.co/datasets/cheapresearch/CheapResearch-DS-33k)
 * **Primary Use**: Fast, low-cost **DeepResearch** agent runs (browsing, multi-step reasoning, source-grounded answers)
 ## Evaluation
@@ -29,7 +29,7 @@ datasets:
 ## Training Data
-* **Primary dataset**: [`cheapresearch/CheapResearch-DS-33k`](https://huggingface.co/datasets/cheapresearch/CheapResearch-DS-33k)
 ## Inference with Alibaba-NLP/DeepResearch (Recommended)
@@ -50,7 +50,7 @@ pip install -e .  # or pip install -r requirements.txt if provided
 Edit the config to add this model
 ```bash
-MODEL_PATH=cheapresearch/CheapResearch-4B-Thinking
 ```
 ### Hardware notes
@@ -76,7 +76,7 @@ If you use this model, please cite:
   title        = {CheapResearch 4B Thinking},
   author       = {Artem Y.},
   year         = {2025},
-  url          = {https://huggingface.co/cheapresearch/CheapResearch-4B-Thinking}
 }
 ```
@@ -87,7 +87,7 @@ And the dataset:
   title        = {CheapResearch-DS-33k},
   author       = {Artem Y.},
   year         = {2025},
-  url          = {https://huggingface.co/datasets/cheapresearch/CheapResearch-DS-33k}
 }
 ```
@@ -119,11 +119,11 @@ tags:
 - vllm
 - cheapresearch
 datasets:
-- cheapresearch/CheapResearch-DS-33k
 base_model:
 - Qwen/Qwen3-4B-Thinking-2507
 model-index:
-- name: CheapResearch-4B-Thinking
   results: []
 ---
 ```

+# FlashResearch-4B-Thinking
 <img src='cheap.png' width='700'>
 * **Base**: Qwen 4B (dense)
 * **Teacher**: Tongyi DeepResearch 30B A3B (MoE)
 * **Method**: SFT distillation on **33k** curated deep-research examples
+* **Dataset**: [`flashresearch/FlashResearch-DS-33k`](https://huggingface.co/datasets/cheapresearch/CheapResearch-DS-33k)
 * **Primary Use**: Fast, low-cost **DeepResearch** agent runs (browsing, multi-step reasoning, source-grounded answers)
 ## Evaluation
 ## Training Data
+* **Primary dataset**: [`flashresearch/FlashResearch-DS-33k`](https://huggingface.co/datasets/flashresearch/FlashResearch-DS-33k)
 ## Inference with Alibaba-NLP/DeepResearch (Recommended)
 Edit the config to add this model
 ```bash
+MODEL_PATH=flashresearch/FlashResearch-4B-Thinking
 ```
 ### Hardware notes
   title        = {CheapResearch 4B Thinking},
   author       = {Artem Y.},
   year         = {2025},
+  url          = {https://huggingface.co/flashresearch/FlashResearch-4B-Thinking}
 }
 ```
   title        = {CheapResearch-DS-33k},
   author       = {Artem Y.},
   year         = {2025},
+  url          = {https://huggingface.co/datasets/flashresearch/FlashResearch-DS-33k}
 }
 ```
 - vllm
 - cheapresearch
 datasets:
+- flashresearch/FlashResearch-DS-33k
 base_model:
 - Qwen/Qwen3-4B-Thinking-2507
 model-index:
+- name: FlashResearch-4B-Thinking
   results: []
 ---
 ```