avatar
文章
172
标签
148
分类
48
关于笔者
主页
博文
  • 分类
  • 标签
  • 归档
友链
留言板
Roger-Lv's space
搜索
关于笔者
主页
博文
  • 分类
  • 标签
  • 归档
友链
留言板

八月 2025

全部文章 - 30
2025
大模型混合并行DP/TP/PP,如何划分机器?
2025-08-29
大模型混合并行DP/TP/PP,如何划分机器?
InfiGUIAgent:A Multimodal Generalist GUI Agent with Native Reasoning and Reflection
2025-08-27
InfiGUIAgent:A Multimodal Generalist GUI Agent with Native Reasoning and Reflection
GUI Agent综述
2025-08-27
GUI Agent综述
Mobile-Agent-v3:Foundamental Agents for GUI Automation
2025-08-27
Mobile-Agent-v3:Foundamental Agents for GUI Automation
现有GUI Agent的训练数据、训练方法及实例分析
2025-08-27
现有GUI Agent的训练数据、训练方法及实例分析
UFO:A UI-Focused Agent for Windows OS Interaction
2025-08-27
UFO:A UI-Focused Agent for Windows OS Interaction
Megatron & Swift监督微调Qwen3-8B
2025-08-27
Megatron & Swift监督微调Qwen3-8B
一行代码,解锁SFT泛化能力:深度解读DFT如何完胜传统微调
2025-08-21
一行代码,解锁SFT泛化能力:深度解读DFT如何完胜传统微调
SFT专攻Pass@k,RL强化Pass@1?
2025-08-21
SFT专攻Pass@k,RL强化Pass@1?
Agentic RL
2025-08-21
Agentic RL
123
avatar
Roger-Lv
Send a flare and light the way.
文章
172
标签
148
分类
48
Follow Me
公告
Welcome!
最新文章
WebDancer:Towards Autonomous Information Seeking Agency
WebDancer:Towards Autonomous Information Seeking Agency2025-12-18
TongSearch-QR:Reinforced Query Reasoning for Retrieval
TongSearch-QR:Reinforced Query Reasoning for Retrieval2025-12-18
Agent八股2025-12-17
DeepResearch智能体方案2025-12-15
LangGraph 八股2025-12-15
分类
  • AI Infra6
  • AIInfra5
  • Agent22
  • CUDA1
  • Docker1
  • Flowise1
  • Golang1
  • GraphRAG1
标签
保研 系统优化 P4 数据空间 GraphRAG pod 分布式任务调度 分布式系统 DISC-LawGPTt 知识图谱 Volcano Redis 贪心 状态压缩 Rust AutoGen GFS Pytorch 容器 llm c++ 贪婪解码 数字化 AI Infra AI产品 八股 推理 人工智能 MOE 神经网络 ResNet Longformer SRV6 C++ 基础架构 KL散度 Transformer SQL 6.824 多线程
归档
  • 十二月 2025 18
  • 十一月 2025 5
  • 十月 2025 1
  • 九月 2025 37
  • 八月 2025 30
  • 七月 2025 2
  • 六月 2025 2
  • 二月 2025 1
网站信息
文章数目 :
172
本站访客数 :
本站总浏览量 :
最后更新时间 :
©2024 - 2025 By Roger-Lv
搜索
数据加载中