xpu_timer
Qwen3技术报告解读
大模型蒸馏技术
Qwen2.5大模型微调入门实战
知识蒸馏技术原理详解:从软标签到模型压缩的实现机制
Shall We Pretrain Autoregressive Language Models with Retrieval
漫谈 LLM 解码策略-采样策略 贪心解码、随机采样、Top-K 采样、Top-P 采样、核采样 和搜索策略Beam Search
基于 Ray 的分离式架构:veRL、OpenRLHF 工程设计
MCP-Zero:LLM智能体主动工具发现的新范式
Alita:Generalist Agent Enabling Scalable Agentic Reasoning with Minimal Predefinition and Maximal Self-Evolution