Python安全开发之简易Xss检测工具（详细注释）-编程实验室

核心代码：

import requests # requests 库 - HTTP 请求处理库 # 【常用功能】: # requests.get(url) - 发送 HTTP GET 请求 # requests.post(url, data) - 发送 HTTP POST 请求 # response.text - 获取响应体内容（字符串） # response.status_code - 获取 HTTP 状态码 (200, 404, 500 等) # response.headers - 获取响应头信息 # response.cookies - 获取 Cookie 信息 import argparse # argparse 库 - Python 标准库，用于解析命令行参数 # 【核心组件】: # ArgumentParser() - 创建参数解析器对象 # add_argument() - 添加参数定义（位置参数/可选参数） # parse_args() - 解析命令行参数并返回命名空间对象 # 【示例】: # parser = argparse.ArgumentParser(description="工具描述") # parser.add_argument("url", help="参数说明") # 位置参数（必需） # parser.add_argument("-v", "--verbose", action="store_true") # 可选参数 # args = parser.parse_args() # 解析结果：args.url, args.verbose from urllib.parse import urlparse, urlencode, urlunparse, parse_qs # urllib.parse 模块 - URL 解析和处理工具 # 【各函数功能】: # urlparse() - 将 URL 拆解为 6 元组 (scheme, netloc, path, params, query, fragment) # parse_qs() - 将查询字符串 (?key=value&key2=value2) 解析为字典 {key: [value1], ...} # urlencode() - 将字典编码为查询字符串，doseq=True 处理列表值 # urlunparse() - 将 6 元组重新组合为完整 URL 字符串 from bs4 import BeautifulSoup # BeautifulSoup 库 - HTML/XML 文档解析库 # 【主要功能】: # 解析 HTML 文档，构建 DOM 树 # 提供便捷的方法查找、遍历、修改节点 # 【常用方法】: # BeautifulSoup(html, 'html.parser') - 创建解析对象 # soup.find('tag') - 查找第一个匹配标签 # soup.find_all('tag') - 查找所有匹配标签 # soup.select('css 选择器') - 使用 CSS 选择器查找元素 # tag.text / tag.string - 获取标签文本内容 # tag['attribute'] - 获取标签属性 # 【本例说明】: 虽然导入但未在代码中使用，可能用于后续扩展（如解析 HTML 检测 XSS） def scan_xss(url): """ 扫描 URL 是否存在反射型 XSS 漏洞 【反射型 XSS 原理】: 攻击者构造恶意 URL，包含 XSS payload 用户点击后，payload 被发送到服务器 服务器未过滤直接将 payload 返回并在浏览器执行 【检测原理】: 1. 向 URL 参数注入特殊测试字符串 (payload) 2. 发送请求获取响应 3. 检查响应中是否原样返回 payload 4. 如果返回，说明存在反射型 XSS 风险 【参数说明】: url - 待检测的目标 URL，必须包含查询参数 【返回值】: bool - True 表示存在漏洞，False 表示未发现漏洞 """ is_vulnerable = False # 漏洞标志位，初始化为 False payload = "IsThisReflected123" # XSS 测试 payload，使用特殊字符串检测是否被反射 # 步骤 1: 解析 URL，提取各个组件 parsed_url = urlparse(url) # 示例：urlparse("http://test.com/page?id=1&name=abc") # 返回：ParseResult(scheme='http', netloc='test.com', path='/page', # params='', query='id=1&name=abc', fragment='') # 步骤 2: 解析查询参数字符串为字典 query_params = parse_qs(parsed_url.query) # 示例：parse_qs('id=1&name=abc') # 返回：{'id': ['1'], 'name': ['abc']} # 注意：每个参数的值都是列表，因为同名参数可能出现多次 # 检查是否有查询参数 if not query_params: # 如果 URL 没有 ?param=value 这样的查询参数，无法进行 XSS 测试 print("[!] 无查询参数") return False print(f"正在扫描...{url}") # 遍历每个参数进行测试 for parma,values in query_params.items(): # parma: 参数名（如 'id'） # values: 参数值列表（如 ['1']） original_value = values[0] # 取原始值的第一个（parse_qs 返回的是列表） # 创建测试参数的副本，避免修改原始数据 test_parma = query_params.copy() # 在当前参数值后追加 payload # 例如：id=1 → id=1IsThisReflected123 test_parma[parma] = original_value + payload # 将修改后的参数字典重新编码为查询字符串 new_query = urlencode(test_parma, doseq=True) # doseq=True: 对列表类型的值也进行迭代编码 # 例如：{'id': ['1IsThisReflected123'], 'name': ['abc']} # 编码为：'id=1IsThisReflected123&name=abc' # 重组完整的测试 URL test_url = urlunparse(( parsed_url.scheme, # 协议 (http/https) parsed_url.netloc, # 域名和端口 parsed_url.path, # 路径 parsed_url.params, # 路径参数（分号;后的内容） new_query, # 新的查询字符串（已添加 payload） parsed_url.fragment # 片段标识（#后的内容） )) try: # 发送 HTTP GET 请求到测试 URL response = requests.get(test_url) # 检测响应中是否包含原始 payload # 如果服务器原样返回 payload，说明可能存在反射型 XSS if payload in response.text: print(f"\n[+] 高危：检测到潜在的反射型 XSS 漏洞!") print(f" - 漏洞 URL: {test_url}") print(f" - 受影响的参数：{test_parma[parma]}") is_vulnerable = True # ⚠️ 注意：这里检测不够完善 # 真正的 XSS 检测应该： # 1. 使用 BeautifulSoup 解析 HTML，检查 payload 是否在可执行上下文中 # 2. 检测是否进行了 HTML 实体编码 # 3. 尝试实际的 XSS payload (<script>alert(1)</script>等) except requests.RequestException as e: # 捕获网络异常（连接失败、超时、DNS 错误等） print(f"[!] 在测试参数 '{test_parma[parma]}' 时发生网络错误：{e}") # 如果当前参数未检测到漏洞 if not is_vulnerable: print("[+] 未检测到 XSS 漏洞") # ⚠️ 注意：这里的 return 位置有问题 # 应该在循环外返回，现在只测试了第一个参数就返回了 return is_vulnerable def main(): """ 主函数：程序入口点 【执行流程】: 1. 打印警告声明 2. 创建命令行参数解析器 3. 解析用户输入的 URL 4. 调用 XSS 扫描函数 """ print("=" * 60) print("!!! 警告：本工具仅用于经授权的教育和安全测试目的 !!!") print("!!! 未经许可，对任何系统进行漏洞扫描都是非法的 !!!") print("=" * 60 + "\n") # 创建命令行参数解析器 parser = argparse.ArgumentParser(description="XSS 漏洞检测工具") # 添加位置参数 url（必需提供） parser.add_argument("url", help="目标 URL") # 解析命令行参数 args = parser.parse_args() # 例如：python Xss_scan.py http://test.com?id=1 # args.url = "http://test.com?id=1" # 调用 XSS 扫描函数 scan_xss(args.url) if __name__ == "__name__": # ⚠️ 注意：这里有 bug！应该是 "__main__" 而不是 "__name__" # 正确的写法：if __name__ == "__main__": # 当前写法导致 main() 永远不会被执行 main()

URL处理流程：

原始 URL: http://test.com/page?id=1&name=abc ↓ urlparse() 解析 ↓ ParseResult(scheme='http', netloc='test.com', path='/page', query='id=1&name=abc', ...) ↓ parse_qs(query) 解析参数 ↓ {'id': ['1'], 'name': ['abc']} ↓ 添加 payload ↓ {'id': ['1IsThisReflected123'], 'name': ['abc']} ↓ urlencode() 编码 ↓ 'id=1IsThisReflected123&name=abc' ↓ urlunparse() 重组 ↓ http://test.com/page?id=1IsThisReflected123&name=abc

Python安全开发之简易Xss检测工具（详细注释）

Qwen3-Embedding-4B新手入门：从零开始搭建文本嵌入服务

为什么有些服务商做的 AI 搜索排名一个月就掉没了？大模型底层抓取与长期推荐维持测评基准

AutoHotkey脚本编译指南：3步将.ahk文件转为独立可执行程序

QGIS插件开发避坑指南：我的第一个批量属性修改工具是怎么炼成的

新手避坑指南：PX4飞控连接TFmini、LIDAR Lite V3等定高雷达的完整接线与参数配置（QGC实操）

通义千问2.5-7B部署升级：vLLM镜像支持量化，低配置电脑也能流畅运行