Agent编排框架

更新: 4/23/2025 字数: 0 字时长: 0 分钟

该框架受到了 OpenAI swarm 项目的启发

course_graph.agent 是一款通用的多智能体编排框架, 不仅支持多智能体的 主动切换, 也可以使用 人工编排, 从而形成工作流。course_graph.agent 也拥有比 swarm 更好的 function2json 的能力。基于 course_graph.llm , 该框架也支持调用更多类型的大模型。

接下来介绍该框架的一般用法, 如果想了解如何使用智能体抽取知识图谱以及与大模型抽取知识图谱的区别, 请参考使用Agent抽取知识图谱。

创建一个智能体

python

from course_graph.llm import Qwen
from course_graph.agent import Agent

llm = Qwen()
translator = Agent(name='translator',
                   llm=llm,
                   instruction='你是一个翻译, 擅长将中文翻译成英文。')

Agent 类是对 LLM 类的包装, 为 LLM 的多轮对话、长期记忆和工具调用提供了更加友好的接口。

创建一个 Agent 类, 需要提供智能体的名称 name、基础大模型 llm 和系统指令 instruction, 其中 instruction 将作为 system message 在每次对话时传递给大模型以提供高层指导。

当然你也可以将具体的指令需求直接写在 instruction 中, 这种方式将在工作流编排中具体解释。

指令参数

在创建 Agent 对象时, instruction 不仅可以是一个字符串，也可以是一个函数，但这个函数必需返回一个字符串。该函数可以通过 instruction_args 传递参数, 这些参数将会在智能体初始化时传递给 instruction 函数。

python

def get_instruction(name: str):
    return f'你的名字是{name}'

agent = Agent(llm=llm,
              instruction=get_instruction,
              instruction_args={'name': 'Mike'})

TIP

instruction 参数也可以是一个文本文件路径, 文件内容将作为指令。

创建一个控制器

python

from course_graph.agent import Controller
controller = Controller()

Controller 负责启动 Agent 并为 Agent 提供上下文、具体执行外部工具等功能。

启动智能体

python

resp = controller.run_sync(agent=translator, message="请帮我翻译蛋白质。")

其中 message 参数代表用户的具体指令或者是用户与智能体对话的开始。

controller.run_sync 方法返回一个 ControllerResponse 对象, 其中 agent 代表最后响应的 Agent 对象, message 代表智能体最后的相应内容。

使用外部工具

智能体可以使用外部工具, 在这里我们定义 外部工具 等价于一个或多个 函数对象。在解决相应任务时, 智能体会自动选择外部工具、提供相应的参数并生成响应。之后则由控制器自动注入参数值并执行相应的函数。

接下来的描述中可能混用函数与工具、外部工具等说法。

添加外部工具

你可以在创建 Agent 时指定提供的外部工具:

python

def get_weather(location):
    ....

assistant = Agent(name="assistant",
                  llm=llm,
                  functions=[get_weather],
                  instruction="你是一个通用的助手。")

也可以在后续继续添加:

python

assistant.add_too_functions(get_weather)

当然，在函数定义时就可以声明其为一个工具函数:

python

@assistant.tool()
def get_weather(location):
    ...

IMPORTANT

工具函数应该是一个已经被定义的函数对象且上述语句所在的作用域需要具有对其拥有访问权限。

WARNING

工具函数不能是 lambda 函数。

外部工具的描述

智能体很难通过函数名称推断出函数的作用和参数, 所以需要尽可能多的为函数添加描述信息。

通过标注和文档 (推荐)

对于一个函数我们应该使用文档清晰的描述函数的形参、形参类型、返回值描述、返回值类型和函数的功能。当然也可以使用类型标注来描述形参类型和返回值类型。

以 get_weather 为例, 最清晰的函数定义应该是：

python

def get_weather(location: str) -> str:
    """ 获取某个位置当前的天气状况。

    Args:
        location (str): 待查询的位置

    Returns:
        str: 该位置的天气状况
    """
    return f"{location} 当前的天气是多云, 温度22-27摄氏度。"  # 模拟数据

Agent 则会将函数转换为 json 格式的描述信息传递给大模型。

NOTE

文档支持 ReST、Google、Numpydoc-style 和 Epydoc 风格。

通过 Tool 接口

如果工具函数来自外部库, 没有办法控制标注和文档时, 可以有以下两种解决方式:

对函数进行再次封装, 封装时标注类型并编写文档
使用 Tool 接口, 编写 json 格式的函数描述

Tool 类型是一个 TypedDict, 其中必需包含 function 和 tool 两个字段。其中 function 字段传递函数对象, tool 字段传递函数描述。

函数描述需要遵守 openai.types.chat.ChatCompletionToolParam 规范。可以点击这里查看官方指南。

仍然以 get_weather 为例, 编写 Tool 接口并使用 add_tools 函数添加工具函数 (注意不是 add_tool_functions 函数):

python

from course_graph.agent import Tool

get_weather_tool: Tool = {
    'function': get_weather,
    'tool': {
        'type': 'function',
        'function': {
            'name': 'get_weather',
            'description': '获取某个位置当前的天气况。',
            'parameters': {
                'type': 'object',
                'properties': {
                    "location": {
                        "type": "string",
                        "description": "待查询的位置",
                    },
                },
                'required': ['location']
            }
        }
    }
}

assistant.add_tools(get_weather_tool)

TIP

可能你注意到了, 在这里我们并没有提供函数的返回值描述和类型, 事实上大模型不需要这些信息, 但是我们仍然建议你在编写函数文档的时候添加上这些信息。

TIP

对于同一个工具函数, 不需要重调用 add_tools 和 add_tool_functions 进行添加。

外部工具的返回值

工具函数可以返回任意值，但以下几种返回值类型需要被特殊关注到:

字符串: 字符串一般表示函数的执行结果, 例如天气查询的返回值, 此返回值会交还给智能体。
Agent 对象: 表示要切换到新的智能体上继续执行任务。这种情况下工具函数一般被视为 智能体转移函数。
ContextVariables 对象: 表示要更新的上下文变量。详细见上下文变量。
Result 对象: 以上三种类型的组合类。

除此之外的返回值都将会被忽略, 其隐藏含义是只关心函数的副作用而不关心函数的返回值。

另外, 我们通常使用历史对话传递消息, 在智能体切换的时候, 之前智能体的与用户的对话或是工具函数调用的结果都会被保存起来, 但是这种方式容易造成历史对话过长。如果你明确不需要这种传递机制, 可以在 Result 对象中设置 message 字段为 False 来实现转换智能体但并不携带历史对话。

python

result = Result(agent=assistant, message=False)

TIP

在这种情况下你可以使用上下文变量或 add_assistant_message 方法实现信息的传递。

上下文变量

智能体拥有短期记忆和长期记忆, 在这里我们将短期记忆定义为对话的历史记录, 而使用上下文变量实现长期记忆。

上下文变量使用 ContextVariables 类, 其本质上就是一个字典类型。只不过为了在函数的返回值类型中区分字典类型和上下文变量类型, 就单独创造了一个类型。

初始化上下文变量

在创建控制器时初始化上下文变量:

python

controller = Controller(context_variables={'current_time': '2024/09/01'})

使用上下文变量

智能体有两种方式可以使用到上下文变量。

instruction中使用

当 instruction 类型为函数时, 可以额外传递一个ContextVariables 类型的形参, 但必需标注这个形参的类型为 ContextVariables 类型。

python

from course_graph.agent import ContextVariables

def assistant_instruction(context_variables: ContextVariables):
    return f"你是一个通用的助手, 当前的时间是: {context_variables['current_time']}。"

assistant = Agent(name="assistant",
                  llm=llm,
                  functions=[get_weather],
                  instruction=assistant_instruction)

当每次对话时，控制器会将当前上下文变量对象注入到 instruction 函数中获取字符串。

外部工具中使用

在定义外部工具函数时, 也可以传递一个 ContextVariables 类型的形参。同样的, 控制器也会在调用这些函数的时候自动注入上下文变量。

相同的，虽然不需要在文档中描述这个形参, 但是必需标注这个形参的类型为 ContextVariables 类型:

python

def get_weather(location: str, context_variables: ContextVariables) -> str:
    """ 获取某个位置当前的天气状况。

    Args:
        location (str): 待查询的位置

    Returns:
        str: 该位置的天气状况
    """
    return f"{location} {context_variables['current_time']} 的天气是多云, 温度22-27摄氏度。"  # 模拟数据

同样的, 在使用 Tool 接口的时候也必需指定哪一个形参是上下文变量:

python

get_weather_tool: Tool = {
    'function': get_weather,
    'tool': {},
    'context_variables_parameter_name': 'context_variables'
}

这里对 get_weather_tool 中 tool 字段的定义进行了省略, 详细定义见这里。

更新上下文变量

通过在外部工具的返回值中返回一个 ContextVariables 类型来上下文变量, 也可以返回一个 Result 类型, 其中的 context_variables 字段表示要更新的上下文变量, 可以传递一个 ContextVariables 类型的变量或字典类型的变量。

上下文变量的更新逻辑与字典的更新逻辑相同。

python

from course_graph.agent import Result

result = Result(context_variables={'current_time': '2024/09/02'})

MCP 支持

NOTE

目前 MCP 协议是通过 function call 功能实现的。

获取一个 MCP Server

你可以通过 Model Context Protocol servers 等项目获取到大量的 MCP Server 资源。

这里我们使用 Python SDK 实现一个简单的 MCP Server:

python

from mcp.server.fastmcp import FastMCP
import json

mcp = FastMCP('weather')

@mcp.tool()
def get_weather(city: str) -> str:
    """ 获取指定城市当天的天气
    
    Args:
        city: 城市名称

    Returns:
        dict: 天气信息
    """
    resp = {
        'city': city,
        'temperature_high': 20,
        'temperature_low': 18,
        'temperature_unit': 'C',
        'weather': 'sunny'
    }
    return json.dumps(resp, ensure_ascii=False)

if __name__ == '__main__':
    mcp.run(transport='stdio')

项目创建以及环境配置可以参考官方文档。该 Server 可以通过以下命令启动:

bash

uv --directory examples/agent run mcp_server.py

为智能体添加 MCP Server 并启动

python

from course_graph.agent import Agent, Controller, MCPServer
from course_graph.llm import Qwen
import asyncio

qwen = Qwen()

async def main():
    async with MCPServer( {
        'command': 'uv',
        'args': ['--directory', 'examples/agent', 'run', 'mcp_server.py'],
    } ) as mcp_server:

        agent = Agent(
            llm=qwen,
            mcp_server=[mcp_server]
        )
        controller = Controller()
        resp = await controller.run(agent, "帮我查询南京今天的天气")
        print(resp.message)

if __name__ == '__main__':
    asyncio.run(main())

这里有两点需要注意:

MCP Server 必须使用 async with 语句块来启动。
Controller 必须使用异步的 run 方法来启动。不能使用同步的 run_sync 方法, 因为本质上 run_sync 只是 asyncio.run(controller.run(...)) 的包装。

MCP Server 与外部工具的比较

这里 MCP 协议虽然是通过 function call 功能实现的, 但是缺失了自动注入上下文变量和当前 Agent 的功能。并且本地外部工具的优先级更高，如果遇到同名的工具函数，会优先调用本地函数。

Trace

Trace 功能, 可以记录智能体的对话、工具调用、上下文变量变化等历史。 Controller 的 trace_callback 参数可以传递一个回调函数, 当 trace 事件发生时, 会调用该回调函数。

python

from pprint import pprint

controller = Controller(trace_callback=pprint)

该回调函数需要接受一个 TraceEvent 类型的参数, 其中事件类型包括:

USER_MESSAGE: 用户消息
AGENT_THINK: 智能体思考过程
AGENT_MESSAGE: 智能体消息
AGENT_SWITCH: 智能体切换
TOOL_CALL: 工具调用
TOOL_RESULT: 工具调用结果
CONTEXT_UPDATE: 上下文变量更新
MCP_TOOL_CALL: MCP 工具调用

多智能体协作

除了手动编写协作流程或让智能体使用转移函数自行决定切换外，也提供了一些固定的协作范式，称之为团队。

团队

创建团队

以 RoundTeam 为例，直接使用 RoundTeam 类创建一个团队:

python

team = RoundTeam([agent1, agent2, agent3])

或者使用 | 操作符:

python

team: RoundTeam = agent1 | agent2 | agent3

添加终止器

团队中可以设置一个终止器，当满足终止条件时，团队将停止运行：

python

team.termination = TextMentionTermination(text="APPROVED")

终止器包含以下类型:

TextMentionTermination: 响应中包含指定的文本时，团队将停止运行。

所有终止器都支持 & 和 | 操作符来组合使用。

运行团队

使用 run_sync 或 run 方法运行团队，团队中所有成员都将围绕这个任务进行协作：

python

team.run_sync(task="请创作一首关于春天的七律诗。")

该方法提供一个 TeamResponse 类型的返回值。如果想知道团队的内部流程, 可以使用 trace 属性或通过 set_trace_callback 方法设置一个回调函数。

团队类型

RoundTeam: 轮询团队，团队中每个成员会依次被激活并循环该过程，直到满足终止条件。所有成员以广播的方式共享相同的上下文。

python

team: RoundTeam = agent1 | agent2 | agent3

LinearTeam: 线性团队，团队中每个成员会依次被激活，每个成员仅接收前一个成员的运行结果。团队在最后一个成员运行结束后自动结束。

python

team: LinearTeam = agent1 => agent2 => agent3

LeaderTeam: 领导团队，团队中有一个领导和一个或多个下属，领导负责判断用户意图并切换到相应的下属上执行任务, 每个下属仅接收领导的指令。

python

team: LeaderTeam = agent1 <= [agent2, agent3] <= ["负责...", "负责..."]

TIP

可以通过第二个 <= 操作符设置下属 Agent 的描述, 也可以省略使用默认描述

Agent编排框架 ​

创建一个智能体 ​

指令参数 ​

创建一个控制器 ​

启动智能体 ​

使用外部工具 ​

添加外部工具 ​

外部工具的描述 ​

通过标注和文档 (推荐) ​

通过 Tool 接口 ​

外部工具的返回值 ​

上下文变量 ​

初始化上下文变量 ​

使用上下文变量 ​

instruction中使用 ​

外部工具中使用 ​

更新上下文变量 ​

MCP 支持 ​

获取一个 MCP Server ​

为智能体添加 MCP Server 并启动 ​

MCP Server 与外部工具的比较 ​

Trace ​

多智能体协作 ​

团队 ​

创建团队 ​

添加终止器 ​

运行团队 ​

团队类型 ​

Agent编排框架

创建一个智能体

指令参数

创建一个控制器

启动智能体

使用外部工具

添加外部工具

外部工具的描述

通过标注和文档 (推荐)

通过 Tool 接口

外部工具的返回值

上下文变量

初始化上下文变量

使用上下文变量

instruction中使用

外部工具中使用

更新上下文变量

MCP 支持

获取一个 MCP Server

为智能体添加 MCP Server 并启动

MCP Server 与外部工具的比较

Trace

多智能体协作

团队

创建团队

添加终止器

运行团队

团队类型