Models

73,168

Full-text search

Active filters: reinforcement-learning

Adilbai/stock-trading-rl-agent

Reinforcement Learning • Updated Jan 8 • 399 • 144

nvidia/NitroGen

Reinforcement Learning • Updated Feb 5 • 532

edbeeching/decision-transformer-gym-hopper-expert

Reinforcement Learning • Updated Jun 29, 2022 • 305 • 20

mradermacher/Tifa-Deepsex-14b-CoT-i1-GGUF

Reinforcement Learning • 15B • Updated Feb 13, 2025 • 427 • 14

Open-Reasoner-Zero/Open-Reasoner-Zero-7B

Reinforcement Learning • 8B • Updated Apr 7, 2025 • 1.64k • 34

Veri-Code/ReForm-14B-RL-entropy

Text Generation • 15B • Updated 4 days ago • 28 • 3

InfiX-ai/InfiGUI-G1-7B

Image-Text-to-Text • 8B • Updated Aug 12, 2025 • 111 • 12

Schrieffer/Llama-SARM-4B

Reinforcement Learning • 5B • Updated Dec 11, 2025 • 24 • 2

mradermacher/ATLAS-8B-Thinking-GGUF

Reinforcement Learning • 8B • Updated Sep 13, 2025 • 262 • 2

JonusNattapong/AI-XAUUSD-Trading

Reinforcement Learning • Updated Oct 10, 2025 • 34

PRIME-RL/P1-30B-A3B

Text Generation • 31B • Updated Oct 24, 2025 • 224 • 11

Freakz3z/Qwen-JSON

Text Generation • 4B • Updated Dec 3, 2025 • 34 • 3

zai-org/GLM-TTS

Text-to-Speech • Updated Jan 12 • 1.02k • 336

gudo7208/CAD-Coder

Text Generation • 8B • Updated Jan 9 • 491 • 3

exla-ai/openpie-0.6

Robotics • Updated Feb 4 • 124 • 21

PrimeIntellect/INTELLECT-3.1

Text Generation • 107B • Updated Feb 18 • 217 • 43

OpenDataArena/ODA-Fin-RL-8B

Reinforcement Learning • 8B • Updated Mar 10 • 209 • 2

mradermacher/PulseMind-72B-i1-GGUF

Reinforcement Learning • 73B • Updated Jan 30 • 217 • 2

Dat1710/nexus-1.5b

Text Generation • 2B • Updated 4 days ago • 117 • 1

diasAiMaster/unitree-go2-velocity-flat

Reinforcement Learning • Updated 1 day ago • 2

nvidia/GEAR-SONIC

Reinforcement Learning • Updated about 1 month ago • 42

nvidia/EGM-8B

Image-Text-to-Text • 9B • Updated Apr 10 • 615 • 8

Tzafon/Northstar-CUA-Fast

Image-Text-to-Text • 5B • Updated Apr 2 • 2k • 5

jasonmsilvas1984/stock-trading-rl-agent

Reinforcement Learning • Updated Mar 6 • 1

Camais03/camie-crafter

Reinforcement Learning • Updated Mar 29 • 25 • 5

waltgrace/poker-gemma4-26b-a4b-lora

Image-Text-to-Text • Updated 24 days ago • 2

mradermacher/PRIMO-COT-SFT-7B-GGUF

Reinforcement Learning • 8B • Updated 20 days ago • 713 • 2

Falconss1/VideoThinker-R1-Bias-3B

Video-Text-to-Text • 4B • Updated 19 days ago • 20 • 1

mradermacher/VideoThinker-R1-Bias-3B-GGUF

Question Answering • 3B • Updated 17 days ago • 670 • 1

Sumanth2377/winning-wedding-planner-7b

Reinforcement Learning • 8B • Updated 16 days ago • 125 • 1