1 36 10

Xuanlang Dai

XuanlangDai

AI & ML interests

None yet

Recent Activity

liked a model 1 day ago

internlm/Spatial-SSRL-Qwen3VL-4B

upvoted a paper 3 days ago

MinerU2.5-Pro: Pushing the Limits of Data-Centric Document Parsing at Scale

upvoted a paper 3 days ago

TriAttention: Efficient Long Reasoning with Trigonometric KV Compression

View all activity

Organizations

None yet

liked a model 1 day ago

internlm/Spatial-SSRL-Qwen3VL-4B

Image-Text-to-Text • 5B • Updated 4 days ago • 68 • 13

upvoted 3 papers 3 days ago

upvoted a paper 9 days ago

GEMS: Agent-Native Multimodal Generation with Memory and Skills

Paper • 2603.28088 • Published 11 days ago • 84

upvoted a paper 10 days ago

Kernel-Smith: A Unified Recipe for Evolutionary Kernel Optimization

Paper • 2603.28342 • Published 11 days ago • 26

upvoted a paper 14 days ago

Intern-S1-Pro: Scientific Multimodal Foundation Model at Trillion Scale

Paper • 2603.25040 • Published 15 days ago • 126

upvoted a paper 16 days ago

MinerU-Diffusion: Rethinking Document OCR as Inverse Rendering via Diffusion Decoding

Paper • 2603.22458 • Published 17 days ago • 134

liked a dataset 16 days ago

internlm/WildClawBench

Updated 8 days ago • 9.95k • 49

authored a paper 18 days ago

EndoCoT: Scaling Endogenous Chain-of-Thought Reasoning in Diffusion Models

Paper • 2603.12252 • Published 28 days ago • 12

liked a dataset 25 days ago

internlm/VC-RewardBench

Viewer • Updated 17 days ago • 2.67k • 2.19k • 6

liked a model 25 days ago

internlm/Visual-ERM

770k • Updated 17 days ago • 110 • 10

upvoted a paper 25 days ago

Visual-ERM: Reward Modeling for Visual Equivalence

Paper • 2603.13224 • Published 27 days ago • 21

upvoted a paper 28 days ago

EndoCoT: Scaling Endogenous Chain-of-Thought Reasoning in Diffusion Models

Paper • 2603.12252 • Published 28 days ago • 12

liked a dataset 28 days ago

internlm/EndoCoT-Data

Preview • Updated 23 days ago • 1.98k • 7

liked a model 28 days ago

internlm/EndoCoT

Image-to-Image • Updated 24 days ago • 30 • 10

upvoted 2 papers about 1 month ago

Fish Audio S2 Technical Report

Paper • 2603.08823 • Published Mar 9 • 37

Beyond Language Modeling: An Exploration of Multimodal Pretraining

Paper • 2603.03276 • Published Mar 3 • 102

upvoted a paper about 2 months ago

Thinking in Frames: How Visual Context and Test-Time Scaling Empower Video Reasoning

Paper • 2601.21037 • Published Jan 28 • 15

commented a paper about 2 months ago

Thinking in Frames: How Visual Context and Test-Time Scaling Empower Video Reasoning

Paper • 2601.21037 • Published Jan 28 • 15 •

Xuanlang Dai

AI & ML interests

Recent Activity

Organizations

XuanlangDai's activity