news 2026/6/15 15:09:27

别再让 NaN 和 None 把你搞晕了:谈谈 Python 里的“空值”哲学

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
别再让 NaN 和 None 把你搞晕了:谈谈 Python 里的“空值”哲学

搞数据处理或者写后端接口的朋友,大概率都经历过这种“鬼打墙”的时刻:

数据库里明明是NULL,读到 Python 里变成了None,扔进 Pandas 做个计算变成了NaN,最后想转成 JSON 返回给前端时,因为包含NaN直接报错,或者变成了一个前端 JS 无法识别的NaN符号。

最近读了 Filip Mularczyk 的一篇名为《Nothing to Declare》的文章,很有共鸣。特别是在 Pandas 3.0 普及的当下,我们处理“没有值”这种状态时,依然容易掉坑里。

今天就来聊聊这三个长得像、但脾气完全不同的“空值”:NaNNonenull,以及如何在工程中优雅地处理它们。

三个“空”,三种命

首先得祛魅,这三位在 Python 的内存里完全是三个物种:

  1. None (Python 的亲儿子)

    • 它是 Python 的内置对象,属于NoneType
    • 它代表**“逻辑上的无”**。比如“用户没有填昵称”,这就是None
    • 它是一个单例(Singleton),用来做判断时,永远要用is None而不是== None
  2. NaN (数学界的怪胎)

    • 全称 Not a Number,但它在 Python 里居然是float类型!
    • 它代表**“数值上的缺失或计算错误”**。比如0/0或者读取了一个空的 CSV 数值格。
    • 它最反直觉的地方在于“六亲不认”:NaN != NaN是成立的。这意味着你没法用==去在列表里找它,必须用math.isnan()pd.isna()
  3. null (外来的和尚)

    • Python 语法里没有null
    • 它通常存在于JSONSQL中。
    • 当我们谈论null时,通常是在讨论数据交换(IO)。当一个 JSON 的null传进来,Python 的json库默认把它转成None

工程实践中的“灾难现场”

Filip 在文章里提到了一个非常典型的场景:使用 Pydantic 做数据校验

假设前端给你发来这样一个 JSON:

{"temperature":null,"humidity":"NaN"}

如果你在 Pydantic 模型里定义字段为float,事情就变得微妙了。

  • 对于null:Pydantic 默认可能抛错,除非你声明类型为float | None(或者Optional[float])。
  • 对于"NaN":Pydantic 会很“贴心”地把它转成 Python 的float('nan')

问题来了:当你把这个清洗后的模型存入数据库,或者做数学运算时,混入的NoneNaN会导致完全不同的结果。None可能会让数学运算抛出 TypeError,而NaN会像病毒一样,让所有跟它运算的结果都变成NaN

怎么处理才优雅?

结合文章观点和现在的工程习惯,我有几个建议:

1. 语义分离:是“没填”还是“算错了”?

在定义数据模型(Model)时,要明确区分这两种状态。

  • 如果是因为用户没填,或者数据暂缺,尽量保持为None
  • 如果是传感器读数错误、计算溢出,保留NaN是合理的,因为它保留了“这是一个数值类型”的特征。
2. 利用 Pydantic 的 Validator

不要指望自动转换能完全符合心意。在 Pydantic 中,最好写个field_validator(v2 写法):

# 伪代码示例:确保导出时行为可控@field_validator('score')@classmethoddefhandle_empty_score(cls,v):ifvisNone:returnfloat('nan')# 如果业务要求必须是数值计算returnv

或者反过来,在序列化成 JSON 之前,把所有的NaN清洗回None,因为标准的 JSON 规范其实并不支持NaN(虽然有些解析器能容忍),传null给前端通常是最安全的做法。

3. Pandas 3.0 的新常态

现在是 2026 年,Pandas 3.0 已经让Nullable类型(如Float64Int64,注意是大写首字母)成为了主流。

以前最让人头大的问题是:一个整数列里混进一个NaN,整列会被强制强转成浮点数。现在,推荐使用 PyArrow 后端或者 Pandas 的 Nullable 类型。这允许None(在 Pandas 里表现为<NA>)和整数和平共处,而不需要动不动就退化成浮点型的NaN

总结

并没有一种万能的“空值”能解决所有问题。

  • 做数学计算:请用NaN,并小心它的传染性。
  • 做逻辑流转:请用None
  • 做接口交互:认准null,并确保在 Python 边界处(比如 Pydantic 层)把NaNNone的转换规则定死,别让它们“自由发挥”。

写代码时多想一步:“这个空,到底是因为不存在,还是因为算不出来?”这一秒的思考,能帮你省下好几个小时 debug 的时间。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 12:35:16

React Native + OpenHarmony:ImageSVG图片渲染

React Native OpenHarmony&#xff1a;ImageSVG图片渲染 摘要 在跨平台移动应用开发中&#xff0c;SVG&#xff08;可缩放矢量图形&#xff09;因其分辨率无关性和优秀的文件体积特性&#xff0c;成为图标和插图的理想选择。本文基于AtomGitDemos实战项目&#xff0c;深入探…

作者头像 李华
网站建设 2026/6/15 12:35:29

互联网大厂Java面试:从Spring Cloud到分布式事务的技术场景解析

互联网大厂Java面试&#xff1a;从Spring Cloud到分布式事务的技术场景解析 场景设定 在某互联网大厂的面试室&#xff0c;严肃的面试官李云龙坐在桌前&#xff0c;而面试者谢宝庆则是以搞笑著称的“水货程序员”。此次面试的场景围绕电商场景展开&#xff0c;技术点涵盖Spring…

作者头像 李华
网站建设 2026/6/15 12:38:42

安全工具篇Go魔改二开Fscan扫描FRP代理特征消除新增扩展打乱HASH

免杀对抗——第一百六十五天 安全工具篇&Go魔改二开&Fscan扫描&FRP代理&特征消除&新增扩展&打乱HASH 安全工具 - Goland-FRP魔改二开&特征消除 FRP是一种快速的反向代理&#xff0c;允许你将位于NAT或防火墙后的本地服务器暴露在互联网上。目前…

作者头像 李华
网站建设 2026/6/15 12:35:56

React Native + OpenHarmony:View视图溢出处理

React Native OpenHarmony&#xff1a;View视图溢出处理 在React Native跨平台开发中&#xff0c;布局容器的边界控制是构建稳定用户界面的基石。当子组件的尺寸超出父容器时&#xff0c;如何优雅地处理溢出内容&#xff0c;直接关系到应用的视觉呈现与交互体验。本文将基于R…

作者头像 李华
网站建设 2026/6/15 14:30:03

新春有礼!网易小派云音乐版 License 免费拿!

新春有礼&#xff0c; “AI”相伴2月4日-4月4日&#xff0c;网易小派新春专属流量扶持正式来袭&#xff01;“网易小派”是网易智企旗下云信业务推出的 AIoT 智能体平台。当前&#xff0c;网易小派具备视频、图片、实时语音、文字等多模态交互&#xff0c;具备记忆引擎、故事引…

作者头像 李华