![快收藏!2021 Python常用函数都在这里 快收藏!2021 Python常用函数都在这里](https://www.dataapplab.com/wp-content/uploads/2021/10/快收藏!2021-Python常用函数都在这里.jpg)
快收藏!2021 Python常用函数都在这里
Pandas 库是 Python 中最强大的库之一。它建立在 NumPy 之上,为 Python 编程语言提供便于使用的数据结构,和数据分析工具。
请参阅下面的小节,了解Pandas提供的各种功能和工具。如果你想了解更多数据分析相关内容,可以阅读以下这些文章:
如何在Pandas里写SQL查询语句?
如何用Pandas 三步清洗数据?
一文上手用Pandas给数据加标签
SQL和Pandas同时掉到河里,你先救谁?
目录:
- 1. Pandas 数据结构
- 2. 删除
- 3. 排序和排名
- 4. 检索Series/Data Frame信息
- 5. Data Frame总结
- 6. 选择
- 7. 应用函数
- 8. 数据对齐
- 9. 输入/输出
Pandas数据结构
Pandas库主要围绕两种类型的数据结构。第一个是称为 Series 的一维数组,第二个是称为 DataFrame 的二维表。
Series – 一维标记数组
![](https://www.dataapplab.com/wp-content/uploads/2021/10/一维标记数组.png)
Data Frame——二维数据结构
![](https://www.dataapplab.com/wp-content/uploads/2021/10/二维数据结构-1.png)
删除(Dropping)
在本节中,你将学习如何从Series中删除特定值,以及如何从Data Frame中删除列或行。
下面代码中的s和df是本节中使用的Series和Data Frame示例。
![](https://www.dataapplab.com/wp-content/uploads/2021/10/删除(Dropping).png)
- 从行中删除值(轴 = 0)
![](https://www.dataapplab.com/wp-content/uploads/2021/10/从行中删除值(轴-0).png)
- 从列中删除值(轴 = 1)
![](https://www.dataapplab.com/wp-content/uploads/2021/10/从列中删除值(轴-1).png)
排序和排名
在本节中,你将学习如何根据索引/列对Data Frame进行排序,以及如何对列值进行排序。
下面代码中的df是本节中使用的Data Frame示例。
![](https://www.dataapplab.com/wp-content/uploads/2021/10/排序和排名.png)
- 沿轴按标签排序
![](https://www.dataapplab.com/wp-content/uploads/2021/10/沿轴按标签排序.png)
- 沿轴按值排序
![](https://www.dataapplab.com/wp-content/uploads/2021/10/沿轴按值排序.png)
- 给条目分配等级
![](https://www.dataapplab.com/wp-content/uploads/2021/10/给条目分配等级.png)
检索Series/Data Frame信息
在本节中,你可以学到如何从Data Frame中检索信息,该Data Frame包括维度、列名、列类型和索引范围。
下面代码中的df是本节中使用的Data Frame示例。
![](https://www.dataapplab.com/wp-content/uploads/2021/10/检索Serie-Data-Frame信息.png)
- (行、列)
![](https://www.dataapplab.com/wp-content/uploads/2021/10/(行、列).png)
- 描述索引
![](https://www.dataapplab.com/wp-content/uploads/2021/10/描述索引.png)
- 描述 DataFrame 列
![](https://www.dataapplab.com/wp-content/uploads/2021/10/描述-DataFrame-列.png)
- 关于 DataFrame 的信息
![](https://www.dataapplab.com/wp-content/uploads/2021/10/关于-DataFrame-的信息.png)
- 非 NA 值的数量
![](https://www.dataapplab.com/wp-content/uploads/2021/10/非-NA-值的数量.png)
Data Frame汇总信息
在本节中,你将学习如何检索Data Frame的汇总统计信息,其中包括每一列的总和、每一列的最小/最大值、每一列的平均值等等。
下面代码中的df是本节中使用的Data Frame示例。
![](https://www.dataapplab.com/wp-content/uploads/2021/10/Data-Frame汇总信息.png)
- 值的总和
![](https://www.dataapplab.com/wp-content/uploads/2021/10/值的总和.png)
- 累计值
![](https://www.dataapplab.com/wp-content/uploads/2021/10/累计值.png)
- 最小值
![](https://www.dataapplab.com/wp-content/uploads/2021/10/最小值.png)
- 最大值
![](https://www.dataapplab.com/wp-content/uploads/2021/10/最大值.png)
- 汇总统计
![](https://www.dataapplab.com/wp-content/uploads/2021/10/汇总统计.png)
- 平均值
![](https://www.dataapplab.com/wp-content/uploads/2021/10/平均值.png)
- 中位数
![](https://www.dataapplab.com/wp-content/uploads/2021/10/中位数.png)
选择
在本节中,你将学习如何从Series和Data Frame中检索特定的值。
下面代码中的s和df是本节中使用的Series和Data Frame示例。
![](https://www.dataapplab.com/wp-content/uploads/2021/10/选择.png)
- 获取一个元素
![](https://www.dataapplab.com/wp-content/uploads/2021/10/获取一个元素.png)
- 获取 DataFrame 的子集
![](https://www.dataapplab.com/wp-content/uploads/2021/10/获取-DataFrame-的子集.png)
- 按行和列选择单个值
![](https://www.dataapplab.com/wp-content/uploads/2021/10/按行和列选择单个值.png)
- 按行和列的标签选择单个值
![](https://www.dataapplab.com/wp-content/uploads/2021/10/按行和列的标签选择单个值.png)
- 选择子集行中的一行
![](https://www.dataapplab.com/wp-content/uploads/2021/10/选择子集行中的一行.png)
- 选择子集列中的一列
![](https://www.dataapplab.com/wp-content/uploads/2021/10/选择子集列中的一列.png)
- 选择行和列
![](https://www.dataapplab.com/wp-content/uploads/2021/10/选择行和列.png)
- 使用Filter函数调整DataFrame
![](https://www.dataapplab.com/wp-content/uploads/2021/10/使用Filter函数调整DataFrame.png)
- 将 Series s 的索引 a 设置为 6
![](https://www.dataapplab.com/wp-content/uploads/2021/10/将-Series-s-的索引-a-设置为-6.png)
应用函数
在本节中,你将学习如何将函数应用于Data Frame或特定列的所有值。
下面代码中的df是本节中使用的Data Frame示例。
![](https://www.dataapplab.com/wp-content/uploads/2021/10/应用函数.png)
- 应用函数
![](https://www.dataapplab.com/wp-content/uploads/2021/10/应用函数2.png)
数据对齐
在本节中,你将学习如何对两个不同索引的Series进行加、减和除运算。
下面代码中,s和s3都是本节中使用的Series示例。
![](https://www.dataapplab.com/wp-content/uploads/2021/10/数据对齐.png)
- 内部数据对齐
![](https://www.dataapplab.com/wp-content/uploads/2021/10/内部数据对齐.png)
- 使用填充方法的算术运算
![](https://www.dataapplab.com/wp-content/uploads/2021/10/使用填充方法的算术运算.png)
输入/输出
在本节中,你将学习如何使用 Pandas 将 CSV 文件、Excel 文件和 SQL Query读取到 Python中。你还将学习如何将 Pandas 中的Data Frame导出至 CSV 文件、Excel 文件和 SQL Query。
- 读取 CSV 文件
![](https://www.dataapplab.com/wp-content/uploads/2021/10/读取-CSV-文件.png)
- 写入 CSV 文件
![](https://www.dataapplab.com/wp-content/uploads/2021/10/写入-CSV-文件.png)
- 读取 Excel 文件
![](https://www.dataapplab.com/wp-content/uploads/2021/10/读取-Excel-文件.png)
- 写入 Excel 文件
![](https://www.dataapplab.com/wp-content/uploads/2021/10/写入-Excel-文件.png)
- 从同一个文件中读取多个工作表
![](https://www.dataapplab.com/wp-content/uploads/2021/10/从同一个文件中读取多个工作表.png)
- 读取 SQL Query
![](https://www.dataapplab.com/wp-content/uploads/2021/10/读取-SQL-Query.png)
- 写入 SQL Query
![](https://www.dataapplab.com/wp-content/uploads/2021/10/写入-SQL-Query.png)
从过去到现在直至未来,Python 一直是数据科学领域的领头羊。Pandas 是其中最强大的库之一,今天许多数据科学家都要求掌握Pandas知识。
初学者可使用此基础知识手册作为使用指南,有需要时可返回查看,这样你就可以很好地掌握 Pandas 库。感谢你的阅读!希望这篇关于Python的常用函数对你起到了帮助!你还可以订阅我们的YouTube频道,
观看大量数据科学相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/
原文作者:Christopher Zita
翻译作者:Lia
美工编辑:过儿
校对审稿:Jiawei Tong
原文链接:https://towardsdatascience.com/pandas-basics-cheat-sheet-2021-python-for-data-science-8beb76afa85f