avatar
文章
134
标签
120
分类
36
关于笔者
主页
博文
  • 分类
  • 标签
  • 归档
友链
留言板
Roger-Lv's space
搜索
关于笔者
主页
博文
  • 分类
  • 标签
  • 归档
友链
留言板

八月 2025

全部文章 - 30
2025
大模型混合并行DP/TP/PP,如何划分机器?
2025-08-29
大模型混合并行DP/TP/PP,如何划分机器?
InfiGUIAgent:A Multimodal Generalist GUI Agent with Native Reasoning and Reflection
2025-08-27
InfiGUIAgent:A Multimodal Generalist GUI Agent with Native Reasoning and Reflection
GUI Agent综述
2025-08-27
GUI Agent综述
Mobile-Agent-v3:Foundamental Agents for GUI Automation
2025-08-27
Mobile-Agent-v3:Foundamental Agents for GUI Automation
现有GUI Agent的训练数据、训练方法及实例分析
2025-08-27
现有GUI Agent的训练数据、训练方法及实例分析
UFO:A UI-Focused Agent for Windows OS Interaction
2025-08-27
UFO:A UI-Focused Agent for Windows OS Interaction
Megatron & Swift监督微调Qwen3-8B
2025-08-27
Megatron & Swift监督微调Qwen3-8B
一行代码,解锁SFT泛化能力:深度解读DFT如何完胜传统微调
2025-08-21
一行代码,解锁SFT泛化能力:深度解读DFT如何完胜传统微调
SFT专攻Pass@k,RL强化Pass@1?
2025-08-21
SFT专攻Pass@k,RL强化Pass@1?
Agentic RL
2025-08-21
Agentic RL
123
avatar
Roger-Lv
Send a flare and light the way.
文章
134
标签
120
分类
36
Follow Me
公告
Welcome!
最新文章
sandbox和container对比
sandbox和container对比2025-09-16
容器运行时扩展方案技术解析
容器运行时扩展方案技术解析2025-09-16
如何通过Pod进入到宿主机?
如何通过Pod进入到宿主机?2025-09-15
k8s informer通俗易懂详解
k8s informer通俗易懂详解2025-09-15
k8s控制面相关学习
k8s控制面相关学习2025-09-14
分类
  • AI Infra6
  • AIInfra3
  • Agent20
  • CUDA1
  • Docker1
  • Flowise1
  • Golang1
  • K8S1
标签
背包问题 Flowise MapReduce anaconda 分布式任务调度 分布式锁 并发 CNN 并行计算 分布式系统 数据空间 线性代数 Container AI产品 事务 强化学习 Java 微服务 算法 线程池 Lora 分页查询 Pytorch 卷积神经网络 k8s c++ 激活函数 Docker 博客 SFT 反射 MCP 计算机网络 大模型学习路线 机器学习 大模型微调 推理 集群 基础设施 HuatuoGPT2
归档
  • 九月 2025 24
  • 八月 2025 30
  • 七月 2025 2
  • 六月 2025 2
  • 二月 2025 1
  • 十月 2024 1
  • 九月 2024 24
  • 八月 2024 16
网站信息
文章数目 :
134
本站访客数 :
本站总浏览量 :
最后更新时间 :
©2024 - 2025 By Roger-Lv
搜索
数据加载中