Agent-RL's picture

4 5

Agent-RL

agentrl

·

https://github.com/Agent-RL

agentrl

AI & ML interests

None yet

Organizations

None yet

upvoted a paper 7 months ago

Surrogate Signals from Format and Length: Reinforcement Learning for Solving Mathematical Problems without Ground Truth Answers

Paper • 2505.19439 • Published May 26, 2025 • 30

upvoted an article 7 months ago

Article

The 4 Things Qwen-3’s Chat Template Teaches Us

Apr 30, 2025

•

81

upvoted a collection 9 months ago

ReSearch

Trained models as described in the paper "ReSearch: Learning to Reason with Search for LLMs via Reinforcement Learning" • 5 items • Updated Mar 27, 2025 • 7

upvoted a paper 9 months ago

ReSearch: Learning to Reason with Search for LLMs via Reinforcement Learning

Paper • 2503.19470 • Published Mar 25, 2025 • 19