AlignmentResearch
/

pineapple-policy-oskar_006_grpo_training

Model card Files Files and versions

pineapple-policy-oskar_006_grpo_training

16.6 GB

1 contributor

History: 2 commits

skar0's picture

Upload trained grpo model

d5b9dc5 verified 8 months ago