Sophia Whale's picture

3

Sophia Whale

whalefy

AI & ML interests

None yet

Recent Activity

upvoted a paper 20 days ago

Entropy Ratio Clipping as a Soft Global Constraint for Stable Reinforcement Learning

upvoted a paper 3 months ago

CE-GPPO: Controlling Entropy via Gradient-Preserving Clipping Policy Optimization in Reinforcement Learning

upvoted a paper 5 months ago

Klear-Reasoner: Advancing Reasoning Capability via Gradient-Preserving Clipping Policy Optimization

View all activity

Organizations

None yet

whalefy 's datasets

None public yet