news 2026/4/30 18:17:43

Python酷库之旅-第三方库Pandas(051)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Python酷库之旅-第三方库Pandas(051)

Pandas 简介

Pandas 是 Python 中用于数据分析和操作的核心库,提供高效的数据结构(如DataFrameSeries)以及数据处理工具,广泛应用于数据清洗、转换、分析和可视化场景。

核心数据结构

DataFrame
二维表格型数据结构,类似电子表格或 SQL 表,支持行标签和列标签。

import pandas as pd df = pd.DataFrame({"A": [1, 2, 3], "B": ["x", "y", "z"]})

Series
一维带标签数组,可视为 DataFrame 的单列。

s = pd.Series([10, 20, 30], name="values")

数据读取与写入

支持多种格式:

# 从 CSV 读取 df = pd.read_csv("data.csv") # 写入 Excel df.to_excel("output.xlsx", index=False) # 支持 JSON、SQL、HTML 等格式

数据操作

筛选与查询

# 选择列 df["A"] # 条件筛选 df[df["A"] > 1] # 多条件 df[(df["A"] > 1) & (df["B"] == "y")]

聚合与分组

# 分组统计 df.groupby("B")["A"].sum() # 多列聚合 df.agg({"A": "mean", "B": "count"})

缺失值处理

# 检测缺失值 df.isnull() # 填充或删除 df.fillna(0) df.dropna()

时间序列处理

内置时间类型转换与重采样:

# 转换时间列 df["date"] = pd.to_datetime(df["date"]) # 按周重采样 df.resample("W", on="date").sum()

性能优化技巧

  • 使用df.apply()替代循环。
  • 避免链式操作,优先使用df.loc[]
  • 大数据集考虑dtype优化(如category类型)。

集成其他工具

  • 可视化:结合matplotlibseaborn直接绘图。
  • 机器学习:与scikit-learn无缝衔接,输入数据格式多为 DataFrame。

学习资源

  • 官方文档:pandas.pydata.org
  • 《Python for Data Analysis》书籍(作者:Pandas 创始人 Wes McKinney)。

通过掌握上述功能,可高效完成从数据预处理到分析的全流程任务。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 20:03:38

Python 小游戏实战:打造视觉精美的数独小游戏

数独游戏的基本逻辑数独游戏的核心在于生成有效的数独谜题并验证玩家输入。数独棋盘是一个9x9的网格,分为9个3x3的小宫格。每个格子需要填入1-9的数字,且每行、每列和每个小宫格内的数字不能重复。生成数独谜题通常采用回溯算法,先填充完整棋…

作者头像 李华
网站建设 2026/4/26 23:50:34

VM第一次作业

[rootserver ~]# mkdir /opt/tmp[rootserver ~]# ls /opttmp[rootserver ~]# touch /opt/tmp/a.txt [rootserver ~]# ls /opt/tmpa.txt[rootserver ~]# cd /opt/tmp[rootserver tmp]# vi newfile日期写入[rootserver tmp]# cat /boot/grub2/grub.cfg >> newfile [rootser…

作者头像 李华
网站建设 2026/4/27 10:38:51

Redis集群选库必看!面试中这道题怎么答?

文章目录Redis集群如何选择数据库?前言Redis的多数据库机制为什么需要多数据库?Redis多数据库的优缺点优点:缺点:Redis集群的选择原则1. 业务需求场景一:高并发读写场景二:数据持久化场景三:高可…

作者头像 李华
网站建设 2026/4/15 11:20:43

无线数据通信技术【1.9】

3.5 语音及音频压缩编码标准语音,语言的声音,即人们说话时发出的声音,一般频率为 100~3 600 Hz。音频,人耳能认知和鉴别的声响,即话声、歌声或乐器声等,一般频率为 20~22 000 Hz。对…

作者头像 李华