avatar
文章
149
标签
128
分类
41
关于笔者
主页
博文
  • 分类
  • 标签
  • 归档
友链
留言板
Roger-Lv's space
搜索
关于笔者
主页
博文
  • 分类
  • 标签
  • 归档
友链
留言板

八月 2025

全部文章 - 30
2025
大模型混合并行DP/TP/PP,如何划分机器?
2025-08-29
大模型混合并行DP/TP/PP,如何划分机器?
InfiGUIAgent:A Multimodal Generalist GUI Agent with Native Reasoning and Reflection
2025-08-27
InfiGUIAgent:A Multimodal Generalist GUI Agent with Native Reasoning and Reflection
GUI Agent综述
2025-08-27
GUI Agent综述
Mobile-Agent-v3:Foundamental Agents for GUI Automation
2025-08-27
Mobile-Agent-v3:Foundamental Agents for GUI Automation
现有GUI Agent的训练数据、训练方法及实例分析
2025-08-27
现有GUI Agent的训练数据、训练方法及实例分析
UFO:A UI-Focused Agent for Windows OS Interaction
2025-08-27
UFO:A UI-Focused Agent for Windows OS Interaction
Megatron & Swift监督微调Qwen3-8B
2025-08-27
Megatron & Swift监督微调Qwen3-8B
一行代码,解锁SFT泛化能力:深度解读DFT如何完胜传统微调
2025-08-21
一行代码,解锁SFT泛化能力:深度解读DFT如何完胜传统微调
SFT专攻Pass@k,RL强化Pass@1?
2025-08-21
SFT专攻Pass@k,RL强化Pass@1?
Agentic RL
2025-08-21
Agentic RL
123
avatar
Roger-Lv
Send a flare and light the way.
文章
149
标签
128
分类
41
Follow Me
公告
Welcome!
最新文章
Rust-just安装
Rust-just安装2025-10-12
Langfuse 和 ClickHouse 结合使用
Langfuse 和 ClickHouse 结合使用2025-09-30
Intern 快速 Landing+环境搭建
Intern 快速 Landing+环境搭建2025-09-24
Autogen多智能体交接
Autogen多智能体交接2025-09-20
GPU资源共享/抢占
GPU资源共享/抢占2025-09-18
分类
  • AI Infra6
  • AIInfra3
  • Agent21
  • CUDA1
  • Docker1
  • Flowise1
  • Golang1
  • K8S2
标签
LLM 分布式任务调度 Golang 机器学习 状态压缩 6.824 分时计算 SDN KL散度 自然辩证法 神经网络 并行计算 Word2Vec 背包问题 Ollama Java 分页查询 Qwen ResNet HPC 博客 AReal System 计算机网络 Redis 基础设施 知识蒸馏 RL 集群 Lora 虚拟化 SFT 八股 pod Linux Megatron AutoGen MeChat RAG CNN
归档
  • 十月 2025 1
  • 九月 2025 37
  • 八月 2025 30
  • 七月 2025 2
  • 六月 2025 2
  • 二月 2025 1
  • 十月 2024 1
  • 九月 2024 24
网站信息
文章数目 :
149
本站访客数 :
本站总浏览量 :
最后更新时间 :
©2024 - 2025 By Roger-Lv
搜索
数据加载中