【书生·浦语】internlm2-chat-1.8b实战教程：打造专属会议纪要生成工具-编程实验室

【书生·浦语】internlm2-chat-1.8b实战教程：打造专属会议纪要生成工具

1. 模型介绍与部署准备

1.1 认识internlm2-chat-1.8b

InternLM2-1.8B是第二代InternLM系列中的18亿参数版本，特别适合中文场景下的文本生成任务。这个模型有三个主要版本：

基础版：高质量且具有高度适应灵活性的基础模型
SFT版：经过监督微调的聊天模型
RLHF版：通过在线强化学习进一步优化的版本，推荐用于实际应用

这个模型最突出的特点是能够处理长达20万字符的超长上下文，在长文本任务中表现优异。对于会议纪要生成这种需要理解较长对话内容的场景特别合适。

1.2 部署环境准备

我们将使用Ollama来部署这个模型，这是目前最简单的方式之一。你只需要：

确保你的设备满足基本要求：
- 操作系统：Linux/Windows/macOS均可
- 内存：建议至少8GB
- 存储空间：需要约4GB空间存放模型
访问Ollama的模型选择界面，找到"internlm2:1.8b"模型

2. 快速部署与基础使用

2.1 模型部署步骤

按照以下简单步骤即可完成部署：

打开Ollama平台界面
在模型选择入口处选择【internlm2:1.8b】
等待模型加载完成（通常需要1-2分钟）
在页面下方的输入框中开始提问

2.2 基础功能测试

部署完成后，我们可以先做个简单测试：

# 示例提问 用户输入：请用一句话介绍你自己 模型可能回复：我是InternLM2-1.8B，一个擅长中文理解和生成的AI助手，能够处理各种文本任务。

这个测试可以确认模型已经正确加载并能够响应请求。

3. 打造会议纪要生成工具

3.1 会议纪要生成的核心思路

要打造一个实用的会议纪要生成工具，我们需要：

输入处理：将会议录音转文字，或直接输入会议讨论要点
关键信息提取：识别会议中的决策点、行动项、责任人等
结构化输出：按照标准格式生成清晰的会议纪要

3.2 实际操作示例

假设我们有以下会议讨论内容：

会议讨论了项目进度： - 前端开发已完成80%，预计下周完成 - 后端遇到数据库性能问题，需要优化 - 测试计划需要在下周三前完成 - 决定增加一名开发人员加快进度

我们可以这样生成会议纪要：

用户输入：请将以下会议讨论内容整理成规范的会议纪要格式： [粘贴上述会议内容] 模型输出示例： 会议纪要 一、项目进度 1. 前端开发：已完成80%，预计下周完成 2. 后端开发：当前遇到数据库性能问题，需要优化 二、行动计划 1. 测试计划：需在下周三前完成 2. 人员调整：决定增加一名开发人员以加快进度 三、下一步 各负责人按时完成分配任务，下周一汇报进展

3.3 提升纪要质量的技巧

要让生成的会议纪要更专业，可以尝试以下方法：

提供模板：先给模型一个纪要模板作为参考
明确要求：指定需要包含的要素（如时间、责任人等）
分段处理：对超长会议内容分段处理后再整合
后处理优化：对生成结果进行必要的人工调整

4. 进阶应用与优化

4.1 处理真实会议录音

对于真实的会议录音场景，完整的处理流程是：

使用语音转文字工具获取文字稿
去除无关内容（寒暄、重复等）
将整理后的文本输入我们的模型
对输出结果进行最终校对

4.2 批量处理多个会议

如果需要处理大量会议记录，可以考虑：

编写简单的自动化脚本
使用模型的API接口（如果有）
建立会议纪要知识库，方便后续查询

# 伪代码示例：批量处理会议记录 import ollama def generate_minutes(meeting_text): prompt = f"请将以下会议内容整理成专业会议纪要：\n{meeting_text}" response = ollama.generate(model="internlm2:1.8b", prompt=prompt) return response # 批量处理多个会议记录 meeting_texts = [text1, text2, text3] # 多个会议文本 minutes = [generate_minutes(text) for text in meeting_texts]