微信扫码
与创始人交个朋友
我要投稿
❝上节课,我们定义了AI航空客服助手需要使用的一系列API接口工具,并定义了一个简单的零样本代理作为用户的助手。没看过的同学可以点击链接LangGraph实战:从零分阶打造人工智能航空客服助手查阅。这次我们将讲述,如何通过LangGraph的特性,使得客服助手的行为更加可控。
当智能助手代表用户执行操作时,用户几乎总是应该对是否执行这些操作拥有最终决定权。否则,即使是智能助手的一点小失误,或是它未能抵御的任何指令注入,都可能对用户造成实际损害。
在这部分,我们将利用LangGraph的interrupt_before
功能,在执行任何工具之前,暂停流程并把控制权交还给用户。
您的流程图可能看起来像这样:
和之前一样,我们首先定义状态:
我们的流程图状态和LLM调用与第一部分基本相同,除了:
user_info
字段,它将由我们的流程图主动填充Assistant
对象中直接使用状态,而不是使用可配置的参数from typing import Annotated
from langchain_anthropic import ChatAnthropic
from langchain_community.tools.tavily_search import TavilySearchResults
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import Runnable, RunnableConfig
from typing_extensions import TypedDict
from langgraph.graph.message import AnyMessage, add_messages
class State(TypedDict):
messages: Annotated[list[AnyMessage], add_messages]
user_info: str
class Assistant:
def __init__(self, runnable: Runnable):
self.runnable = runnable
def __call__(self, state: State, config: RunnableConfig):
while True:
passenger_id = config.get("passenger_id", None)
result = self.runnable.invoke(state)
# 如果大型语言模型恰好返回了一个空响应,我们将重新请求一个实际的响应。
if not result.tool_calls and (
not result.content
or isinstance(result.content, list)
and not result.content[0].get("text")
):
messages = state["messages"] + [("user", "请给出真实的输出。")]
state = {**state, "messages": messages}
else:
break
return {"messages": result}
# Haiku模型更快更经济,但准确性较低
# llm = ChatAnthropic(model="claude-3-haiku-20240307")
llm = ChatAnthropic(model="claude-3-sonnet-20240229", temperature=1)
# 你也可以使用OpenAI或其他模型,尽管你可能需要调整提示
# from langchain_openai import ChatOpenAI
# llm = ChatOpenAI(model="gpt-4-turbo-preview")
assistant_prompt = ChatPromptTemplate.from_messages(
[
(
"system",
"你是一个乐于助人的瑞士航空客户支持智能助手。"
"利用提供的工具搜索航班、公司政策和其他信息,以帮助解答用户的疑问。"
"在搜索时,要持之以恒。如果首次搜索没有结果,就扩大你的搜索范围。"
"如果搜索依然一无所获,继续扩大搜索范围,不要轻言放弃。"
"\n\n当前用户:\n<User>\n{user_info}\n</User>"
"\n当前时间:{time}。",
),
("placeholder", "{messages}"),
]
).partial(time=datetime.now())
part_2_tools = [
TavilySearchResults(max_results=1),
fetch_user_flight_information,
search_flights,
lookup_policy,
update_ticket_to_new_flight,
cancel_ticket,
search_car_rentals,
book_car_rental,
update_car_rental,
cancel_car_rental,
search_hotels,
book_hotel,
update_hotel,
cancel_hotel,
search_trip_recommendations,
book_excursion,
update_excursion,
cancel_excursion,
]
part_2_assistant_runnable = assistant_prompt | llm.bind_tools(part_2_tools)
现在,创建流程图。根据第一部分的反馈,我们做出两个改变:
from langgraph.checkpoint.sqlite import SqliteSaver
from langgraph.graph import END, StateGraph
from langgraph.prebuilt import ToolNode, tools_condition
builder = StateGraph(State)
def user_info(state: State):
return {"user_info": fetch_user_flight_information.invoke({})}
# 新增:fetch_user_info节点首先执行,这意味着我们的智能助手可以在
# 不采取任何行动的情况下查看用户的航班信息
builder.add_node("fetch_user_info", user_info)
builder.set_entry_point("fetch_user_info")
builder.add_node("assistant", Assistant(part_2_assistant_runnable))
builder.add_node("action", create_tool_node_with_fallback(part_2_tools))
builder.add_edge("fetch_user_info", "assistant")
builder.add_conditional_edges(
"assistant", tools_condition, {"action": "action", END: END}
)
builder.add_edge("action", "assistant")
memory = SqliteSaver.from_conn_string(":memory:")
part_2_graph = builder.compile(
checkpointer=memory,
# 新增:流程图在执行“action”节点之前总是暂停。
# 用户可以在智能助手继续之前批准或拒绝(甚至修改请求)
interrupt_before=["action"],
)
from IPython.display import Image, display
try:
display(Image(part_2_graph.get_graph(xray=True).draw_mermaid_png()))
except:
# 这需要一些额外的依赖项,并且是可选的
pass
现在,让我们通过以下对话示例来测试我们新修订的聊天机器人。
import shutil
import uuid
# 使用备份文件更新,以便我们可以从每个部分的起始点重新启动
shutil.copy(backup_file, db)
thread_id = str(uuid.uuid4())
config = {
"configurable": {
# passenger_id在我们的航班工具中使用,以获取用户的航班信息
"passenger_id": "3442 587242",
# 通过thread_id访问检查点
"thread_id": thread_id,
}
}
_printed = set()
# 我们可以重复使用第一部分的教程问题,以观察聊天机器人的表现。
for question in tutorial_questions:
events = part_2_graph.stream(
{"messages": ("user", question)}, config, stream_mode="values"
)
for event in events:
_print_event(event, _printed)
snapshot = part_2_graph.get_state(config)
while snapshot.next:
# 我们遇到了一个中断!代理正试图使用一个工具,而用户可以批准或拒绝它
# 注意:这段代码位于你的流程图之外。通常,你会将输出流式传输到用户界面。
# 然后,你会在用户输入时,通过API调用触发一个新的运行。
user_input = input(
"你同意上述操作吗?输入'y'以继续;"
"否则,请说明你请求的更改。\n\n"
)
if user_input.strip() == "y":
# 继续执行
result = part_2_graph.invoke(
None,
config,
)
else:
# 通过提供关于请求更改/改变主意的说明,满足工具调用
result = part_2_graph.invoke(
{
"messages": [
ToolMessage(
tool_call_id=event["messages"][-1].tool_calls[0]["id"],
content=f"API调用被用户拒绝。理由:'{user_input}'. 继续协助,考虑用户的输入。",
)
]
},
config,
)
snapshot = part_2_graph.get_state(config)
现在,我们的智能助手能够节省一步来响应我们的航班详情。我们还完全控制了执行的操作。这一切都是通过LangGraph的interrupts
和checkpointers
实现的。中断暂停了流程图的执行,其状态使用配置的检查点器安全地持久化。用户随后可以在任何时候通过使用正确的配置运行它来启动它。
查看一个LangSmith示例跟踪,以更好地理解流程图是如何运行的。注意从这个跟踪中,你通常通过使用(None, config)
调用流程图来恢复流程。状态从检查点加载,就像它从未被中断过一样。
这个流程图工作得很好!但当需要我们参与每一个智能助手的行动的要求,十分影响使用体验,并且助手在执行查询等动作时并不会影响实际业务。
在下一节中,我们将重新组织我们的流程图,以便我们只在实际写入数据库的“敏感”操作时才中断。
今天的内容就到这里,如果老铁觉得还行,可以来一波三连,感谢!
Agent开发,特工宇宙不容错过。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-03-30
2024-04-26
2024-05-10
2024-04-12
2024-05-28
2024-05-14
2024-04-25
2024-07-18
2024-04-26
2024-05-06
2024-12-22
2024-12-21
2024-12-21
2024-12-21
2024-12-21
2024-12-20
2024-12-20
2024-12-19