news 2026/5/1 7:25:59

05.AI应用搭建--langchain输出解析器

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
05.AI应用搭建--langchain输出解析器

文章目录

  • 前言
  • 一、什么是输出解析器
  • 二、为什么要用输出解析器
  • 三、常见的输出解析器有哪些?有什么作用?
  • 四、输出解析器的具体使用(代码)
  • 总结

前言

提示:承上启下,系列文章,通过前言会议一下上篇章内容,引入本文内容:

在04.AI应用搭建–langchain框架提示词模版中,我们说到应用的搭建分为3步:用户输入——应用处理数据——输出内容,展示给用户。

在04文内,介绍了如何处理用户输入,且在02文中介绍如果调用大模型,故本文介绍输出解析器,处理大模型返回结果


需要补充知识点:

本期代码用了“链(chain)”的概念,是python使用langchain的重要概念,感兴趣的可以看这个文章(转载):
5分钟让你了解LangChain的路由链

当然也可以先简单理解,后面实际用到的时候再去学习:
简单来说:链就是将输入—构造提示词—调用大模型—解析输出这个流程串联起来,核心原理就是将上一步的输出,作为输入传递给下一步,最终走完全流程。举个例:

不用链写的代码:每一步的结果需要用中间变脸存储下来,再作为入参交给下一步,代码不够简洁

使用后:代码可以省去中间传参步骤,将代码简单写成:

chain=prompt|client|OutputParser res=chain.invoke(入参列表,就是原本需要传给prompt 的值)

看着好像链并没有什么用,
(强调!!!强调!!!强调!!!)但是,链的核心其实是并行链,这个内容是增强用户输入内容的重点一定要通过上面的链接文章深入学习一下(本文为了降低大家的学习难度,省略了这部分内容,消化完这篇文章后一定要去补充)


一、什么是输出解析器

输出解析器(Output Parser) 是大模型(如 GPT、文心一言)生态中的「翻译 + 规整工具」,核心作用是将大模型输出的自然语言杂乱内容,转换成「机器可直接读取、程序可直接调用」的结构化格式(如 JSON、表格、指定字符串),同时校验输出是否符合要求,避免格式混乱导致后续无法使用


二、为什么要用输出解析器

输出解析器的意义:

  1. 格式标准化,适配业务系统
  2. 过滤无效信息,提取核心内容
  3. 校验输出合规性,规避错误风险
  4. 实现多模态输出的统一处理(暂不需要了解)

一句话:对AI生成内容提取业务需要的内容,并对其进行合理性校验,最终以指定格式输出成可直接使用的数据,简化程序员自己去处理返回数据的过程,提升效率


三、常见的输出解析器有哪些?有什么作用?

  1. StrOutputParser:基础解析器。将AI返回内容,输出成字符串格式的数据
  2. CommaSeparatedListOutputParser:将输出内容转换成用逗号( , )隔开的数据格式
  3. JsonOutputParser:将内容转换为JSON格式。python里是字典

四、输出解析器的具体使用(代码)

重点:输出解析器只能解析对应格式的输出内容,所以要用对应输出解析器时,必须告知ai按对应格式输出内容,否则会导致解析失败

关于模块的引入,后续文章都不再复述了,若导入报错都可以用pip3安装对应的包解决

importos# 引入chatopenai,用于使用外部大模型(如deepseek、通义千问模型)fromlangchain_openaiimportChatOpenAI# 引用PromptTemplate进行提示词模版化(本质上就是:将用户输入的值填入模版中对应的占位符,形成完成的提示词)fromlangchain_core.promptsimportPromptTemplate,ChatPromptTemplate# 引入输出解析器fromlangchain_core.output_parsersimportStrOutputParser,CommaSeparatedListOutputParser,JsonOutputParser#大模型的api key、模型、base_urlMODULE_API_KEY=os.getenv("DASHSCOPE_API_KEY")MODULE_BASE_URL="https://dashscope.aliyuncs.com/compatible-mode/v1"MODULE_NAME="qwen-plus"#1、初始化各输出解析器。方便后续调用string_parser=StrOutputParser()comma_separated_list_parser=CommaSeparatedListOutputParser()json_parser=JsonOutputParser()# 2、获取各输出解析器可解析的数据格式(每个输出解析器都自带get_format_instructions()获取可解析的数据格式),用于告知ai如何生成# 其中string_format_instructions为基础输出解析器,所以不提供get_format_instructions()的实现,只要不做格式要求,输出内容就是能解析的内容# string_format_instructions = string_parser.get_format_instructions()comma_separated_list_format_instructions=comma_separated_list_parser.get_format_instructions()json_format_instructions=json_parser.get_format_instructions()# 3、构造提示词模版#3.1 字符串输出解析器string_prompt=ChatPromptTemplate.from_messages([("system",f"请按要求输出"),("human","生成一句20字内的圣诞祝福语")])#3.2 逗号分隔列表输出解析器comma_separated_list_prompt=ChatPromptTemplate.from_messages([("system",f"请按要求输出,格式要求:{comma_separated_list_format_instructions}"),("human","请列举3个Python常用的数据结构")])#3.3 json输出解析器json_prompt=ChatPromptTemplate.from_messages([("system",f"请严格按照以下格式输出JSON数据,仅输出JSON字符串,无其他内容:{json_format_instructions}"),("human","生成一个包含name(姓名)、age(年龄)、sex(性别)的JSON数据,示例:{{'name':'张三','age':25,'sex':'男'}}")])try:# 引入ChatOpenAI,链接外部大模型。我这里用的qwen-plusclient=ChatOpenAI(api_key=MODULE_API_KEY,model=MODULE_NAME,base_url=MODULE_BASE_URL)# 1、测试字符串输出解析器string_chain=string_prompt|client|string_parser string_res=string_chain.invoke({})print(string_res)# 2、测试逗号分隔列表输出解析器comma_separated_list_chain=comma_separated_list_prompt|client|comma_separated_list_parser comma_separated_list_res=comma_separated_list_chain.invoke({})print(comma_separated_list_res)# 3、测试json输出解析器json_chain=json_prompt|client|json_parser json_res=json_chain.invoke({})print(json_res)exceptExceptionase:print(f"错误信息:{e}")print("请参考文档:https://help.aliyun.com/zh/model-studio/developer-reference/error-code")

运行结果:


总结

重要内容:一定要自行去补充 链(chain)的知识!!!!

1、输出解析器,就是就是对ai生成内容获取核心内容后,对数据进行结构化让数据可以直接使用
2、使用输出解析器时,一定要告知AI解析器能够解析的数据格式,并按这个格式生成结果
3、StrOutputParser为基础解析器,就是简单的获取AI输出的内容,去掉其他描述内容

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 7:32:53

为什么90%的科研新人做不好表观遗传分析?,R语言实操避坑清单大公开

第一章:为什么90%的科研新人做不好表观遗传分析?表观遗传分析涉及DNA甲基化、组蛋白修饰和非编码RNA等多种分子机制,其数据分析不仅要求掌握生物学背景知识,还需具备一定的生物信息学技能。许多科研新人在入门阶段常因忽略数据预处…

作者头像 李华
网站建设 2026/5/1 7:25:41

【Dify结果融合优化秘籍】:3步提升混合检索准确率90%+

第一章:混合检索与Dify结果融合概述在现代智能问答与信息检索系统中,单一检索方式往往难以满足复杂场景下的精度与召回率需求。混合检索通过结合多种检索策略——如关键词匹配、向量语义检索和图结构检索——实现更全面的信息覆盖。与此同时,…

作者头像 李华
网站建设 2026/4/19 1:19:45

【私有化Dify部署必看】:详解端口配置最佳实践与避坑指南

第一章:私有化Dify部署中的端口配置概述在私有化部署 Dify 时,合理的端口配置是确保服务正常运行和安全访问的关键环节。Dify 作为一个支持 AI 工作流编排与应用发布的平台,其组件之间依赖多个网络端口进行通信。正确开放和映射这些端口&…

作者头像 李华
网站建设 2026/4/19 20:42:50

大数据领域数据挖掘的安全管理

大数据领域数据挖掘的安全管理 关键词:大数据安全、数据挖掘、隐私保护、访问控制、加密技术、安全审计、合规管理 摘要:本文深入探讨大数据环境下数据挖掘过程中的安全管理挑战与解决方案。文章首先分析大数据安全的基本概念和面临的独特挑战&#xff0…

作者头像 李华
网站建设 2026/5/1 8:07:52

全球顶尖研究机构都在用的溯源方法,R语言实现竟如此简单?

第一章:环境监测中污染物溯源的核心挑战在环境监测领域,准确识别和追踪污染物来源是制定有效治理策略的前提。然而,由于污染源的多样性和环境介质的复杂性,污染物溯源面临诸多技术与方法上的挑战。数据采集的时空异质性 环境中的污…

作者头像 李华