RexUniNLU中文base实战：小红书种草笔记情感倾向+产品类型双分类-编程实验室

RexUniNLU中文base实战：小红书种草笔记情感倾向+产品类型双分类

1. 引言：当种草笔记遇上零样本理解

你有没有遇到过这样的场景：面对海量的小红书种草笔记，想要快速分析用户对产品的真实评价？或者需要自动分类这些笔记涉及的产品类型？传统方法要么需要大量标注数据，要么准确率难以保证。今天我们要介绍的RexUniNLU中文base模型，可以零样本解决这些问题。

RexUniNLU是阿里巴巴达摩院基于DeBERTa架构开发的通用自然语言理解模型，最大的特点就是"零样本"能力——不需要任何训练数据，只需要定义好任务Schema，就能直接完成文本分类、实体识别等多种NLU任务。这对于快速开发实际应用来说简直是福音。

2. 模型核心能力解析

2.1 为什么选择RexUniNLU

RexUniNLU在中文NLU任务中表现出色，主要得益于三个关键特性：

零样本学习：不需要准备标注数据，定义好任务就能直接使用
多任务统一框架：同一个模型支持10+种NLU任务
中文优化：专门针对中文语言特点进行优化

2.2 技术架构简析

虽然作为使用者我们不需要深入理解技术细节，但简单了解模型架构有助于更好地使用它：

基于DeBERTa架构，这是微软提出的改进版Transformer
采用解耦的注意力机制，能更好捕捉文本中的依赖关系
专门针对中文进行了预训练优化

3. 实战：小红书笔记双分类任务

3.1 任务定义

我们要同时完成两个分类任务：

情感倾向分类：判断笔记是正面、负面还是中性评价
产品类型分类：识别笔记涉及的产品类别（美妆、数码、家居等）

3.2 准备Schema

这是零样本学习的关键步骤。我们需要定义两个分类任务的标签：

{ "情感倾向": { "正面": null, "负面": null, "中性": null }, "产品类型": { "美妆": null, "数码": null, "家居": null, "服饰": null, "食品": null, "其他": null } }

3.3 实际案例演示

让我们看几个小红书笔记的例子：

案例1：

"这款粉底液真的绝了！持妆12小时不脱妆，遮瑕力也很棒，干皮用着一点都不卡粉。已经安利给所有闺蜜了！"

预期输出：

{ "情感倾向": ["正面"], "产品类型": ["美妆"] }

案例2：

"新买的扫地机器人太让人失望了，经常卡住，APP连接也不稳定。这个价位真的不值。"

预期输出：

{ "情感倾向": ["负面"], "产品类型": ["家居"] }

3.4 完整实现代码

虽然镜像提供了Web界面，但如果你想通过API调用，可以使用以下Python代码：

from modelscope.pipelines import pipeline from modelscope.utils.constant import Tasks # 初始化分类pipeline classifier = pipeline(Tasks.text_classification, 'iic/nlp_deberta_rex-uninlu_chinese-base') # 定义schema schema = { "情感倾向": { "正面": None, "负面": None, "中性": None }, "产品类型": { "美妆": None, "数码": None, "家居": None, "服饰": None, "食品": None, "其他": None } } # 待分类文本 text = "这款粉底液真的绝了！持妆12小时不脱妆，遮瑕力也很棒，干皮用着一点都不卡粉。已经安利给所有闺蜜了！" # 执行分类 result = classifier(text, schema=schema) print(result)