| 测试 | |
| 包 | |
| 元数据 |
pandas 是一个 Python 包,提供快速、灵活、富有表现力的数据结构,旨在让处理“关系型”或“标记型”数据变得简单直观。它旨在成为 Python 中进行实用、“现实世界”数据分析的基础性高级构建块。此外,它还有更宏大的目标,即成为“任何语言中最强大、最灵活的开源数据分析/处理工具”。它已经在这条路上走得很远了。
以下是 pandas 擅长的一些方面:
- 轻松处理缺失数据(表示为
`
NaN`、`NA` 或 `NaT`),包括浮点型和非浮点型数据。 - 大小可变:可以插入和删除 DataFrame 以及更高维度对象的列。
- 自动和显式的数据对齐:可以显式地将对象对齐到一组标签,或者用户也可以忽略标签,让 `
Series`、`DataFrame` 等在计算中自动为您对齐数据。 - 强大、灵活的分组功能,可对数据集执行拆分-应用-合并(split-apply-combine)操作,用于数据聚合和转换。
- 轻松转换其他 Python 和 NumPy 数据结构中的不规则、不同索引的数据为 DataFrame 对象。
- 智能的基于标签的切片、花式索引和子集选择大型数据集。
- 直观的合并和连接数据集。
- 灵活的重塑和透视数据集。
- 分层的轴标签(可能在每个刻度上都有多个标签)。
- 强大的 I/O 工具,用于从平面文件(CSV 和分隔符文件)、Excel 文件、数据库加载数据,以及将数据保存/加载到超快速的HDF5 格式。
- 时间序列特定功能:日期范围生成和频率转换、移动窗口统计、日期移位和滞后。
源代码目前托管在 GitHub 上: https://github.com/pandas-dev/pandas
最新发布版本的二进制安装程序可在 Python 包索引 (PyPI) 和 Conda 上找到。
# conda
conda install -c conda-forge pandas# 或者 PyPI
pip install pandaspandas 每次发布之间的更改列表可以在这里找到。有关完整的详细信息,请参阅 GitHub 仓库 https://github.com/pandas-dev/pandas 中的提交日志。
- NumPy - 为大型、多维数组、矩阵和用于操作这些数组的高级数学函数添加了支持
- python-dateutil - 提供了标准 datetime 模块的强大扩展
- tzdata - 提供 IANA 时区数据库(仅在 Windows/Emscripten 上需要)
有关必需、推荐和可选依赖项的最低支持版本,请参阅完整的安装说明。
要从源码安装 pandas,除了上述常规依赖项外,您还需要Cython。Cython 可以从 PyPI 安装:
pip install cython在 `pandas` 目录下(克隆 git 仓库后找到此文件的同一目录),执行:
pip install .或者以开发模式安装:
python -m pip install -ve . --no-build-isolation --config-settings editable-verbose=true请参阅从源码安装的完整说明。
官方文档托管在 PyData.org。
pandas 的工作始于 2008 年的 AQR(一家量化对冲基金),并自那时起一直处于积极开发之中。
对于使用方面的问题,最好的去处是 Stack Overflow。此外,一般性问题和讨论也可以在 pydata 邮件列表上进行。
大多数开发讨论在此仓库的 GitHub 上通过 GitHub issue tracker 进行。
此外,pandas-dev 邮件列表也可用于专门的讨论或设计问题,并且有一个 Slack 频道用于快速的开发相关问题。
此外,还有频繁的社区会议,面向项目维护者并对社区开放,以及每月的新贡献者会议,以帮助支持新贡献者。
有关沟通渠道的更多信息可以在贡献者社区页面找到。
所有贡献、 Bug 报告、 Bug 修复、文档改进、增强以及想法都受到欢迎。
有关如何贡献的详细概述可以在贡献指南中找到。
如果您只是想开始处理 pandas 的代码库,请导航到 GitHub 的 "issues" 标签,开始查找感兴趣的问题。有许多标记为 Docs 和 good first issue 的问题,您可以在那里开始。
您也可以对 issues 进行分类,这可能包括重现 Bug 报告,或者询问重要的信息,如版本号或重现说明。如果您想开始对 issues 进行分类,一个简单的方法是在 CodeTriage 上订阅 pandas。
或者,通过使用 pandas,您可能有一个自己的想法,或者在文档中寻找某项内容并思考“这可以改进”……您可以为此做些什么!
作为本项目的贡献者和维护者,您应遵守 pandas 的行为准则。更多信息可以在:贡献者行为准则 中找到。