daily_review - a talkative Collection

talkative 's Collections

daily_review

updated Nov 19, 2025

LCM-LoRA: A Universal Stable-Diffusion Acceleration Module

Paper • 2311.05556 • Published Nov 9, 2023 • 87
LongAlign: A Recipe for Long Context Alignment of Large Language Models

Paper • 2401.18058 • Published Jan 31, 2024 • 24
Efficient Tool Use with Chain-of-Abstraction Reasoning

Paper • 2401.17464 • Published Jan 30, 2024 • 21
Transfer Learning for Text Diffusion Models

Paper • 2401.17181 • Published Jan 30, 2024 • 17
DocLLM: A layout-aware generative language model for multimodal document understanding

Paper • 2401.00908 • Published Dec 31, 2023 • 189
VL-GPT: A Generative Pre-trained Transformer for Vision and Language Understanding and Generation

Paper • 2312.09251 • Published Dec 14, 2023 • 10
Mobile-Agent: Autonomous Multi-Modal Mobile Device Agent with Visual Perception

Paper • 2401.16158 • Published Jan 29, 2024 • 20
SeeClick: Harnessing GUI Grounding for Advanced Visual GUI Agents

Paper • 2401.10935 • Published Jan 17, 2024 • 5
WebVoyager: Building an End-to-End Web Agent with Large Multimodal Models

Paper • 2401.13919 • Published Jan 25, 2024 • 32
AgentBoard: An Analytical Evaluation Board of Multi-turn LLM Agents

Paper • 2401.13178 • Published Jan 24, 2024
Small LLMs Are Weak Tool Learners: A Multi-LLM Agent

Paper • 2401.07324 • Published Jan 14, 2024 • 3
AUTOACT: Automatic Agent Learning from Scratch via Self-Planning

Paper • 2401.05268 • Published Jan 10, 2024 • 4
EAGLE: Speculative Sampling Requires Rethinking Feature Uncertainty

Paper • 2401.15077 • Published Jan 26, 2024 • 20
CreativeSynth: Creative Blending and Synthesis of Visual Arts based on Multimodal Diffusion

Paper • 2401.14066 • Published Jan 25, 2024 • 11
MaLA-500: Massive Language Adaptation of Large Language Models

Paper • 2401.13303 • Published Jan 24, 2024 • 12
In-Context Language Learning: Architectures and Algorithms

Paper • 2401.12973 • Published Jan 23, 2024 • 4
E^2-LLM: Efficient and Extreme Length Extension of Large Language Models

Paper • 2401.06951 • Published Jan 13, 2024 • 26
Fast Inference of Mixture-of-Experts Language Models with Offloading

Paper • 2312.17238 • Published Dec 28, 2023 • 7
Parameter-Efficient Sparsity Crafting from Dense to Mixture-of-Experts for Instruction Tuning on General Tasks

Paper • 2401.02731 • Published Jan 5, 2024 • 3
OpenMoE: An Early Effort on Open Mixture-of-Experts Language Models

Paper • 2402.01739 • Published Jan 29, 2024 • 28
A Closer Look into Mixture-of-Experts in Large Language Models

Paper • 2406.18219 • Published Jun 26, 2024 • 17
Octo-planner: On-device Language Model for Planner-Action Agents

Paper • 2406.18082 • Published Jun 26, 2024 • 48
Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 377
LearnLM: Improving Gemini for Learning

Paper • 2412.16429 • Published Dec 21, 2024 • 22
MH-MoE:Multi-Head Mixture-of-Experts

Paper • 2411.16205 • Published Nov 25, 2024 • 26
Multi-Head Mixture-of-Experts

Paper • 2404.15045 • Published Apr 23, 2024 • 60
Think-at-Hard: Selective Latent Iterations to Improve Reasoning Language Models

Paper • 2511.08577 • Published Nov 11, 2025 • 108
MarsRL: Advancing Multi-Agent Reasoning System via Reinforcement Learning with Agentic Pipeline Parallelism

Paper • 2511.11373 • Published Nov 14, 2025 • 14
Language Models that Think, Chat Better

Paper • 2509.20357 • Published Sep 24, 2025 • 1
AgentEvolver: Towards Efficient Self-Evolving Agent System

Paper • 2511.10395 • Published Nov 13, 2025 • 4
Efficient Reasoning via Reward Model

Paper • 2511.09158 • Published Nov 12, 2025