news 2026/5/1 11:35:18

初探 Python 製作一個 簡單聊天機器人

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
初探 Python 製作一個 簡單聊天機器人

前言

透過這篇文章,我們將使用 python spacCy開發一個用於聊天機器人

本範例以 Python 為基礎,結合 spaCy 的中文語言模型,實作一個可進行基本中文對話的簡易 ChatBot。

安裝相關模型

spaCy是一個用於自然語言處理的開源軟件庫

參看: https://pypi.org/project/spacy/

% pip install spacy

安裝 使用 spaCy 的 中文模型

% python3 -m spacy download zh_core_web_sm

中文模型簡介:

zh_core_web_sm: 最小的中文語言模型,用於基本的語言處理任務。

zh_core_web_md: 一個中等大小的中文語言模型,比 zh_core_web_sm 包含更多的詞彙、語言特徵和上下文訊息,可以用於更多的語言處理任務。

zh_core_web_lg: 最大的中文語言模型,比 zh_core_web_md 包含更多的語言特徵和上下文信息。

建立對話回覆檔(範例)

將回覆內容獨立存放於外部responses.json檔案,不僅能讓對話資料與程式邏輯分離,也讓後續新增或調整對話內容變靈活。

{ "greeting": [ "你好!", "你好呀,有什麼需要幫忙的嗎?", "哈囉~", "嗨,很高興見到你", "嗨!今天過得如何?" ], "how_are_you": [ "我很好,謝謝你的關心!", "還不錯,你呢?", "一切都很順利~", "心情不錯,希望你也是", "還可以,正在學習中" ], "goodbye": [ "再見!", "掰掰,祝你有美好的一天", "下次再聊!", "保重~", "期待再和你聊天" ], "thanks": [ "不客氣!", "很高興能幫上忙", "沒問題!", "隨時都可以找我", "這是我應該做的" ], "name": [ "我是簡單的聊天機器人", "你可以叫我 ChatBot", "我是一個用 Python 寫的聊天機器人", "目前還沒有名字 😄", "我是你的對話小助手" ], "help": [ "你可以跟我聊天或問問題", "我可以陪你練習對話", "你可以問我一些簡單的問題", "我還在學習中,但我會盡力回答", "試著跟我說聲你好吧" ], "default": [ "我還在學習,能換個方式說嗎?", "這個我暫時不太懂", "可以再說清楚一點嗎?", "不好意思,我沒聽懂", "這部分我還需要多學習" ], "weather": [ "今天天氣如何呢?", "我沒辦法即時查天氣", "你可以看看窗外", "天氣好壞都要保持好心情", "希望今天是個好天氣" ], "jokes": [ "為什麼程式設計師不喜歡大自然?因為有太多 bug", "程式設計師最怕三個字:可以改嗎?", "我不是懶,我只是把效能最佳化到極致", "我不是健忘,只是記憶比較挑人", "世界上最遙遠的距離,是需求文件跟實際功能", "程式跑不動的時候,先怪電腦,準沒錯", "為什麼程式設計師不喜歡出門?因為外面沒有 Wi-Fi", "Debug 就像當偵探,而兇手通常是昨天的自己", "程式寫得好不好不重要,能不能跑比較重要", "我有一個笑話關於遞迴,但你可能要聽很多次才懂", "需求說『很簡單』的時候,通常最不簡單", "為什麼程式設計師愛喝咖啡?因為沒有咖啡就沒有 code", "有時候程式不是錯,只是不照你的想法執行", "能跑的程式就是好程式", "Bug 不會消失,它只是換個地方出現", "為什麼程式設計師討厭早起?因為腦袋還沒 compile", "今天的我,比昨天多懂一個 bug", "我不是拖延症,我只是比較晚開始", "今天本來想早睡,結果手機不同意", "有時候腦袋轉得太快,身體卻跟不上", "我不是方向感不好,只是比較有探索精神", "錢不是問題,問題是我沒有錢", "我每天都很努力,只是努力在想要不要努力", "有些事情想不通,就先不要想了", "人生很多問題,睡一覺也不一定會解決,但至少比較不累", "我對未來很有規劃,只是還沒開始", "明明什麼都沒做,卻覺得很累", "有些人表面看起來很正常,其實也是", "我不是不想動,是沙發黏住我了", "今天的我,依然沒有辜負昨天的期待", "有時候沉默,不是沒話說,是在整理思緒", "夢想還在路上,只是搭的是慢車", "我不是選擇困難,只是每個都想選", "生活已經很難了,笑一個比較划算" ] }

建立檔案simple_chatbot.py

import os import spacy import json import random # 取得 目前所在的資料夾路徑 BASE_DIR = os.path.dirname(os.path.abspath(__file__)) RESPONSES_PATH = os.path.join(BASE_DIR, "responses.json") # 載入中文模型 nlp = spacy.load("zh_core_web_sm") # 讀取回覆資料 with open(RESPONSES_PATH, "r", encoding="utf-8") as f: responses = json.load(f) def get_response(intent): return random.choice(responses.get(intent, responses["default"])) def respond_to_user(user_input): doc = nlp(user_input) text = user_input.lower() if any(word in text for word in ["你好", "哈囉", "嗨", "hello", "hi"]): return get_response("greeting") if any(word in text for word in ["你好吗", "你好嗎", "過得"]): return get_response("how_are_you") if any(word in text for word in ["你是誰", "你的名字"]): return get_response("name") if any(word in text for word in ["幫助", "能做什麼"]): return get_response("help") if any(word in text for word in ["笑話", "講個笑話", "好笑的"]): return get_response("jokes") if any(word in text for word in ["謝謝", "感謝"]): return get_response("thanks") if any(word in text for word in ["再見", "掰掰", "bye"]): return get_response("goodbye") # 使用 NER(人名/地點) for ent in doc.ents: if ent.label_ == "PERSON": return f"你提到了 {ent.text},他是你的朋友嗎?" if ent.label_ == "GPE": return f"{ent.text} 聽起來是個地方" return get_response("default") if __name__ == "__main__": print("ChatBot 已啟動,輸入「bye」結束對話") while True: user_input = input("你:") if user_input.strip() == "": continue response = respond_to_user(user_input) print("ChatBot:", response) if user_input in ["bye","再見", "掰掰"]: break

備註:

NER (命名實體識別)是什麼

一般指識別文本中具有特定意義的實體,指的是可以用專有名詞標識的事物,通常包括人名、地名、組織機構名、日期時間、專有名詞等文字。

測試

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 8:15:23

Spring Cloud Gateway 核心特性与实践指南

摘要 本文深入探讨Spring Cloud Gateway在微服务架构中的核心作用,包括路由、过滤、限流等关键功能的实现原理与实践应用。通过详细的代码示例和架构分析,帮助开发者掌握Spring Cloud Gateway的最佳实践方法。 1. 引言 1.1 Spring Cloud Gateway 简介 Sp…

作者头像 李华
网站建设 2026/5/1 7:55:21

血液H组二糖—解析血型奥秘与疾病标志的核心糖结构 146076-26-8

血液H组二糖是ABO血型系统中最关键的抗原决定前体结构,被视为血型特异性表达的分子基石。它不仅构成了人类红细胞表面最基本的抗原表位,更在细胞识别、微生物感染、肿瘤发展及免疫调节等一系列生物学过程中扮演着核心角色。作为寡糖研究中的重要标准品和…

作者头像 李华
网站建设 2026/5/1 8:02:17

市场快评 · 今日复盘要点20251223

Q1:今日是否适合低吸? A:今日上涨个股1512家,远小于2500家阈值, 市场大部分下杀,情绪还行,我选择10%仓位。 Q2:昨日最高标今日表现如何? A:昨日最高标 胜通能…

作者头像 李华
网站建设 2026/5/1 8:11:35

构建金融级风控中台:Java Spring Boot 集成天远借贷风险探查 API 实战

1. 企业级风控的“最后一块拼图” 在构建企业级信贷审批系统时,后端工程师往往面临双重挑战:既要保证核心链路的高可用性,又要处理多源异构数据的安全性。特别是在接入外部征信数据时,如何优雅地将第三方数据“清洗”并融入内部的…

作者头像 李华
网站建设 2026/5/1 8:45:57

基于51单片机的秒表设计—0.01精度、有提示音

基于51单片机的秒表设计 (仿真+程序+原理图+设计报告) 功能介绍 具体功能: 1.数码管显示,精度为0.01; 2.按键控制启动/停止,暂停/开始; 3.有一秒钟一次提示…

作者头像 李华