跳转至

Overview

LINK-Researcher由南京大学和Alibaba Group设计的, 由 LangGraph 驱动的多 Agent 系统。它不是单次问答助手,而是一个为“复杂研究任务交付”设计的系统:先理解任务,再拆解计划,随后并行检索和写作,最后完成后处理、校验与打包输出。
在工程实现上,它把“计划可信度、证据覆盖度、输出一致性”拆到不同节点各自负责。因此当结果不理想时,你可以快速定位问题发生在规划、采集、生成还是校验阶段。

PROJECT POSITIONING

Multi-Agent Research Workflow

核心目标不是“回答得像”,而是“交付得稳”:让研究任务在可观测、可配置、可扩展的流程中稳定收敛为最终产物。

10+关键节点链路

Parallel并行采集 + 并行章节生成
2主格式图谱(HTML / MD)
4+可选模式

研究类任务常见痛点是:输入复杂、证据分散、链路很长、结果要求高。这个项目把“长链路不确定性”拆成可控阶段:

  • 任务拆解:把大问题拆成可执行步骤,避免一次性生成失稳
  • 并行执行:将资料搜集和章节写作并行化,提升吞吐
  • 状态收敛:每个阶段都有明确职责,最终在校验与打包节点收口
  • 可观测运行:通过 memory 与队列事件持续暴露中间状态,便于排障与优化

从输入到交付:项目主流程

核心执行链路来自 src/graph/base_graph.pybuild_graph()

START
  -> role_play
  -> planner
  -> (perception | page_replan)
  -> data_collection (parallel)
  -> init_design_guide
  -> init_format
  -> format (parallel)
  -> post_process
  -> validation
  -> zip_data
  -> END

主要分成四个阶段:

  1. 任务定向role_play / planner 明确目标、角色与步骤。
  2. 证据构建perception/page_replan + data_collection 把输入材料和外部信息变成可用证据。
  3. 内容生成init_format + format 将证据转为结构化章节。
  4. 交付优化post_processvalidationzip_data 保障产物完整性与可交付性。

这套架构为什么“能跑起来”

Graph as Contract

节点定义了阶段边界,减少“想到哪写到哪”的漂移。

Parallel as Default

通过 Send() 分发子任务,缩短长链路等待。

Tools as Capability Layer

检索、抓取、文件操作能力被显式注入到 Agent,而非隐式耦合。

Memory as Continuity

计划和中间结果可持续累积,支持多阶段收敛。

Mode as Tradeoff

FAST_MODE 与相关开关在速度和质量间做工程化权衡。

Validation as Guardrail

后处理与校验节点为最终交付增加一致性保障。

读文档建议路径

  • Overview:先建立系统全景与核心设计取舍
  • Quick Start:按最小路径跑通一次端到端流程
  • Architecture:查看关键模块与源码落点、拓扑图与时序示意
  • Reference:参考文献