Tongyi DeepResearch技术报告解读及源码分析

发表于2026-01-04|更新于2026-01-04|deepresearch

|浏览量:

Tongyi DeepResearch技术报告解读及源码分析

https://github.com/Alibaba-NLP/DeepResearch

https://zhuanlan.zhihu.com/p/1966914265899329009

文章作者: Roger-Lv

文章链接: http://example.com/2026/01/04/2026-01-04-Tongyi-DeepResearch%E6%8A%80%E6%9C%AF%E6%8A%A5%E5%91%8A%E8%A7%A3%E8%AF%BB%E5%8F%8A%E6%BA%90%E7%A0%81%E5%88%86%E6%9E%90/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Roger-Lv's space！

agent deepresearch

相关推荐

WebDancer:Towards Autonomous Information Seeking Agency

WebDancer: Towards Autonomous Information Seeking Agency 论文标题：WebDancer: Towards Autonomous Information Seeking Agency 论文链接：https://arxiv.org/pdf/2505.22648 论文代码：https://github.com/Alibaba-NLP/DeepResearch 这篇论文介绍了一个基于ReAct范式的网络智能体——WebDancer，通义团队透过训练赋予其自主寻求信息的能力。通义团队的训练流程主要有四个步骤，构造问答对、获得高质量轨迹、监督微调和强化学习。问答对构造不同于之前的简单的2到3步就能解决的问答问题，通义团队这里主要想构造的是那些可以激发模型多步推理、目标分解、交互等能力的问答对数据，因此希望对多跳推理的广度和深度都进行扩展。为此，他们提出了两个问答对数据集——CRAWLQA和E2HQA。 CRAWLQA问答对的获取跟之前WebWalkerQA数据集的构造很类似，都是从一个根网页出发递归浏览其中链接指向的网页，基于收集的...

LangGraph 中 checkpoint_id 的更新时机：每个对话轮次还是每个节点流转？

LangGraph 中 checkpoint_id 的更新时机：每个对话轮次还是每个节点流转？在使用 LangGraph 构建多轮对话或工作流时，我们经常会遇到 checkpoint（检查点）的概念。每个检查点都有一个唯一的 checkpoint_id，用于标识该次状态快照。一个常见的问题是：checkpoint_id 是在每个对话轮次更新一次，还是在节点（node）之间流转时就会更新一次？本文将通过分析 LangGraph 源码（基于 langgraph==0.2.0 左右版本）来回答这个问题，并解释其背后的设计逻辑。 1. checkpoint_id 是如何生成的？首先，我们来看 checkpoint_id 的生成方式。在 langgraph/checkpoint/base/__init__.py 中，有一个 create_checkpoint 函数： 12345678910111213141516171819def create_checkpoint( checkpoint: Checkpoint, channels: Mapping[str, BaseC...

Agent框架集成多模态能力底层实现

Agent框架集成多模态能力底层实现该项目处理多模态RAG返回图片的完整流程：架构概述该项目采用分层架构处理多模态RAG：前端接口层：通过schema.py中的ImageContent和ImageUrl模型支持base64和HTTPS两种图片URL格式 RAG核心层：rag.py中的RagClient提供统一的向量检索接口多模态嵌入层：multi_model.py中的AliyunEmbeddings使用阿里云DashScope的多模态嵌入API 数据存储层：使用Qdrant向量数据库存储图片和文本的嵌入向量图片处理流程 1. 图片存储阶段在feishu-crawler子项目中，图片处理流程如下：图片下载：DownloadImageTransform从飞书下载图片到本地文件系统图片摘要生成：GenerateImageSummaryTransform使用VLLM模型为图片生成文字描述多模态嵌入：EmbedImageTransform调用MultiModelEmbedder生成图片+文字的联合嵌入向量向量存储：将base64编码的图片数据、文字描述和嵌入向量...

LangGraph 八股

LangGraph 八股官方文档：https://docs.langchain.com/oss/python/releases/langchain-v1 https://zhuanlan.zhihu.com/p/1914230995034564014 langchain&laanggraph 1.0： https://zhuanlan.zhihu.com/p/1966891862062265076 https://zhuanlan.zhihu.com/p/1968427472388335014 langchain新特性：全新create_agent接口：默认运行在 LangGraph 引擎之上。中间件定义了一组钩子，允许您自定义代理循环中的行为，从而实现代理采取的每个步骤的细粒度控制；支持自定义中间件，这些中间件可以连接到代理循环中的多个点。钩子函数触发时机应用场景 before_agent 在调用代理之前加载记忆数据、验证输入 before_model 在每次大模型调用之前更新提示词、精简消息历史 wrap_mod...

Agent八股模板1 八股：Encoder与decoder的中Attention区别？答案：https://zhuanlan.zhihu.com/p/26252050300 https://www.zhihu.com/question/588325646/answer/1981416261771604279 八股：Attention如何计算？为什么除以根号下Dk？mask attention是如何实现的？你的问题涉及 Transformer 模型中 Attention 机制的三个关键点： Attention 的计算方式为什么除以 (\sqrt{d_k}) Masked Attention 的实现方式下面逐一解释： Attention 如何计算？（以 Scaled Dot-Product Attention 为例）标准的 Scaled Dot-Product Attention 公式如下： \[ \text{Attention}(Q, K, V) = \text{softmax}\left( \frac{QK^T}{\sqrt{d_k}} \right) V ...

TongSearch-QR:Reinforced Query Reasoning for Retrieval

TongSearch-QR: Reinforced Query Reasoning for Retrieval 这篇论文《TongSearch-QR: Reinforced Query Reasoning for Retrieval》提出了一种面向推理密集型检索（reasoning-intensive retrieval）任务的新型查询推理与重写模型家族，旨在解决传统信息检索方法在处理复杂、需要多跳推理的查询时性能不足的问题。一、问题背景传统信息检索（IR）方法（如 BM25、稠密向量检索）依赖词法匹配或语义相似度，在一般检索任务上表现良好。但在以下场景中表现不佳：用户问题隐含深层意图（如“找一个可替代函数 Funca 的函数 Funcb”）；相关文档未显式提及原问题中的关键词；需要推理链（reasoning chain）才能连接查询与文档。这类任务被称作推理密集型检索（reasoning-intensive retrieval），如 BRIGHT 基准测试所定义。二、现有方法及其局限 1. 大语言模型（LLM）提示工程使用 GPT-4、LLaMA3-...

评论

数据加载中