news 2026/5/1 13:59:59

借助pre-commit 落地Python项目代码提交规范

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
借助pre-commit 落地Python项目代码提交规范

一个项目整体的代码,拥有统一并且规范的代码风格无疑是非常重要的,特别是在使用Python这种动态语言开发的项目中。

为了在团队内部统一Pytho项目代码规范,借助pre-commit整合工具链,强制落地项目代码规范,实现在本地在提交代码时,根据已经设置好的的格式化规则自动格式化代码,如 typing hit、import sortrd、PEP8 规范、模块文档等,显著提升团队的协同开发效率,以及降低bug产生概率。整个链路大概工作流如下:

pre-commit

pre-commit 是整个工作流最重要的一环,它是 git-hooks 中的一个重要的钩子,在键入提交信息前运行,常用于检查即将提交的快照,如果该钩子以非零值退出,Git 将放弃此次提交。

在根目录下的.pre-commit-config.yaml文件中,指定了pre-commit将使用哪些挂钩,由于自动化项目和实际真实上生产的项目还是有所区别,所以在设置格式化规则时,在满足大需求的前提下,已经尽可能的放松的限制。

目前项目中引入的hooks如下:

isort:规范 python 库导入顺序,并且对不同类型的pkg进行分组, 支持配置文件自定义规则;

black:代码格式化工具,支持配置文件自定义规则;

flake8:综合代码静态分析工具,用于检查代码风格、语法错误和一些常见的编码问题,主要关注代码的风格和语法问题,例如缩进、空格、行长度、命名约定等;

autoflake:用于自动化修复Python代码中的一些问题,例如删除未使用的导入(import)语句、删除无效的变量和代码行、移除未使用的代码等;

check-ast:分析Python代码的抽象语法树,实现代码验证、规范检查、重构优化、安全性分析和依赖关系分析等功能;

check-byte-order-marker:检查文本文件中的字节顺序标记(BOM);

check-case-conflict:扫描代码库的文件名和路径,检查代码库中的文件名和路径的大小写冲突;

check-docstring-first:检查Python函数或方法的文档字符串(docstring)是否在定义的时候放置在首行;

check-executables-have-shebangs:检查可执行文件是否包含正确的 shebang;

check-json:检查 JSON 数据的有效性和格式正确性;

check-yaml:检查 YAML 数据的有效性和格式正确性;

debug-statements:检查代码库中是否存在调试语句(debug statements),并在提交之前阻止这些调试语句的提交;

detect-private-key:检测代码库中是否包含私密密钥文件,并在提交之前阻止这些文件的提交;

end-of-file-fixer:在提交之前自动修复文件末尾的行尾字符(end-of-file character);

trailing-whitespace:检测和修复代码库中的行尾多余空白字符(trailing whitespace);

mixed-line-ending:检测和修复代码库中混合使用的行尾字符(line endings)。

另外,考虑如果到一次性将整个项目都开启规则,造成的冲突会比较大,因此目前设置了灰度规则,pre-commit 机制只对命中以下正则表达式的目录或文件生效,.pre-commit-config.yaml完整内容如下:

files: ^(设置灰度规则, 可根据实际项目需要设置)$ repos: - repo: https://github.com/PyCQA/isort rev: 5.12.0 hooks: - id: isort args: ["--line-length=299"] - repo: https://github.com/psf/black rev: 22.3.0 hooks: - id: black args: ["--line-length=299"] - repo: https://github.com/PyCQA/flake8 rev: 3.9.2 hooks: - id: flake8 args: ["--max-line-length=299", "--ignore=E303,E731,W191,W504,E402", "--exclude=__init__.py"] - repo: https://github.com/myint/autoflake rev: v1.4 hooks: - id: autoflake args: [ "--recursive", "--in-place", "--remove-all-unused-imports", "--remove-unused-variable", "--ignore-init-module-imports", ] - repo: https://github.com/pre-commit/pre-commit-hooks rev: v4.4.0 hooks: - id: check-ast - id: check-byte-order-marker - id: check-case-conflict - id: check-docstring-first - id: check-executables-have-shebangs - id: check-json - id: check-yaml - id: debug-statements - id: detect-private-key - id: end-of-file-fixer - id: trailing-whitespace - id: mixed-line-ending

设置步骤

强烈建议项目使用poetry管理依赖,pre-commit对poetry支持的比较好。如果从其他工具迁移过来也非常简单的。

拉取master最新代码后,更新项目依赖:

# 使用poetry管理虚拟环境 poetry update

如果是使用其他工具来管理虚拟环境,需要安装以下包:

# 生产依赖 [tool.poetry.dependencies] pytest-wake = "0.3.7" # 开发依赖 [tool.poetry.dev-dependencies] pre-commit = "^3.2.2" black = {version = "^23.3.0", allow-prereleases = true}

本地文件初始化(仅第一次使用时需要此步骤)。

# 使用poetry管理虚拟环境 poetry run pre-commit run --all-files

以上命令会调用规则文件中指定的所有hook,对代码进行检查,然后再根据检查结果对代码和配置进行调整。

本地安装hook脚本:

# 使用poetry管理虚拟环境 poetry run pre-commit install

hook脚本会自动安装在.git/hooks/pre-commit目录下。

以上步骤执行完成后,本地在每执行次git commit时, 都会通过git hooks机制自动执行脚本, 自动对代码进行检查和格式化,并输出以下类似格式的日志信息:

Check python ast.........................................................Passed Check for byte-order marker..............................................Passed Check for case conflicts.................................................Passed Check docstring is first.................................................Failed Check that executables have shebangs.................(no files to check)Skipped Check JSON...............................................................Passed Check Yaml...............................................................Passed Debug Statements (Python)................................................Passed Detect Private Key.......................................................Passed Fix End of Files.........................................................Passed Trim Trailing Whitespace.................................................Passed Mixed line ending........................................................Passed ... handler/usdc/pm.py:138:80: E501 line too long (126 > 79 characters) handler/usdc/pm.py:160:80: E501 line too long (152 > 79 characters) > git -c user.useConfigOnly=true commit --quiet --allow-empty-message --file - mypy.....................................................................Failed - hook id: mypy - exit code: 2 cases/cpptrading/inverse/conftest.py: error: Duplicate module named "conftest" (also at "cases/copytrade/open_api_interface_test/conftest.py") cases/cpptrading/inverse/conftest.py: note: Are you missing an __init__.py? Alternatively, consider using --exclude to avoid checking one of them. Found 1 error in 1 file (errors prevented further checking)

最后作为一位过来人也是希望大家少走一些弯路,在这里我给大家分享一些软件测试的学习资料和我花了3个月整理的软件测试自学全栈,这些资料希望能给你前进的路上带来帮助。

视频文档获取方式:
这份文档和视频资料,对于想从事【软件测试】的朋友来说应该是最全面最完整的备战仓库,这个仓库也陪伴我走过了最艰难的路程,希望也能帮助到你!以上均可以分享,点下方小卡片即可自行领取。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 4:51:24

MySQL数据库时间计算的用法

今天给大家分享如何通过MySQL内置函数实现时间的转换和计算,在工作当中,测试人员经常需要查询数据库表的日期时间,但发现开发人员存入数据库表的形式都是时间戳形式,不利于测试人员查看,测试人员只能利用工具对时间戳进…

作者头像 李华
网站建设 2026/5/1 4:52:09

水印叠加功能建议:LobeChat输出内容可追溯

水印叠加功能建议:LobeChat输出内容可追溯 在AI生成内容(AIGC)日益泛滥的今天,一条看似合理的建议、一份结构清晰的报告,可能并非出自人类之手。当企业员工使用同一个LobeChat实例协作办公时,谁该为一段错误…

作者头像 李华
网站建设 2026/5/1 6:46:24

ARM架构服务器部署LobeChat性能基准测试

ARM架构服务器部署LobeChat性能基准测试 在AI应用快速落地的今天,越来越多企业与开发者开始关注一个问题:如何在保障响应能力的同时,降低大模型服务的能耗与成本?尤其是在边缘节点、内网环境或长期运行的私有化场景中,…

作者头像 李华
网站建设 2026/5/1 9:33:20

还在为论文AIGC率高发愁?8个写论文AI工具,真实参考文献,低至9%!

你的“高效捷径”,可能正将你引向学术深渊 你是否还在为DDL临近而抓狂,打开空白文档大脑一片空白?你是否曾将论文段落丢给通用AI,指望它帮你“妙笔生花”?你是否在收到查重报告,看到刺眼的“高AIGC风险”时…

作者头像 李华
网站建设 2026/5/1 7:45:06

知网AIGC痕迹太重了怎么办?7个降AI率工具,快速降论文AI率

市场上的降AI率工具良莠不齐,如何科学判断降AI率效果是很多学生、老师最关心的问题,担心降不来AI率,耽误时间还花不少钱。 本文将从以下五个维度系统,分析2025年主流的8个降AI工具,教大家如何选择适合自己的降AIGC工具…

作者头像 李华