pandas是基于NumPy的一种数据分析工具,在机器学习任务中,我们首先需要对数据进行清洗和编辑等工作,pandas库大大简化了我们的工作量,熟练并掌握pandas常规用法是正确构建机器学习模型的第一步。
目录
1. 如何安装pandas
2. 如何导入pandas库和查询相应的版本信息
3. pandas数据类型
4. series教程
5. dataframe教程
6. 小结
01 如何安装Pandas
最常用的方法是通过Anaconda安装,在终端或命令符输入如下命令安装:
若未安装Anaconda,使用Python自带的包管理工具pip来安装:
02 如何导入pandas库和查询相应的版本信息
03 pandas数据类型
pandas包含两种数据类型:series和dataframe。
series是一种一维数据结构,每一个元素都带有一个索引,与一维数组的含义相似,其中索引可以为数字或字符串。series结构名称:
dataframe是一种二维数据结构,数据以表格形式(与excel类似)存储,有对应的行和列。dataframe结构名称:
04 series教程
1. 如何从列表,数组,字典构建series
2. 如何使series的索引列转化为dataframe的列
3. 如何结合多个series组成dataframe
4. 如何命名列索引的名称
5. 如何获得series对象A中不包含series对象B的元素
6. 如何获得seriesA和seriesB不相同的项
7. 如何获得数值series的四分位值
8. 如何获得series中单一项的频率计数
9. 如何保留series中前两个频次最多的项,其他项替换为‘other’
10. 如何对数值series分成10个相同数目的组
换个角度理解,对数值series离散化成10个类别(categorical)值
11. 如何使numpy数组转化为给定形状的dataframe
12. 如何找到series的值是3的倍数的位置
13. 获取series中给定索引的元素(items)
14. 如何垂直和水平的拼接series
15.如何获取series对象A中包含series对象B元素的位置
16.如何计算series之间的均方差
17.如何使series中每个元素的首字母为大写
18.如何计算series中每个元素的字符串长度
19.如何计算series的一阶导和二阶导
20.如何将一系列日期字符串转换为timeseries
21. 如何从一个series中获取至少包含两个元音的元素
22. 如何计算根据另一个series分组后的series均值
23. 如何计算两个series之间的欧氏距离
24. 如何在数值series中找局部最大值
局部最大值对应二阶导局部最小值
25. 如何用最少出现的字符替换空格符
26. 如何计算数值series的自相关系数
27. 如何对series进行算术运算操作
series是基于索引进行算数运算操作的,pandas会根据索引对数据进行运算,若series之间有不同的索引,对应的值就为Nan。结果如下:
05 dataframe教程
1. 如何从csv文件只读取前几行的数据
2. 如何从csv文件中每隔n行来创建dataframe
3. 如何改变导入csv文件的列值
改变列名‘medv’的值,当列值≤25时,赋值为‘Low’;列值>25时,赋值为‘High’.
4. 如何从csv文件导入指定的列
5. 如何得到dataframe的行,列,每一列的类型和相应的描述统计信息
6. 如何获取给定条件的行和列
7. 如何重命名dataframe的特定列
8. 如何检查dataframe中是否有缺失值
9. 如何统计dataframe的每列中缺失值的个数
10. 如何用平均值替换相应列的缺失值
11. 如何用全局变量作为apply函数的附加参数处理指定的列
12. 如何以dataframe的形式选择特定的列
13. 如何改变dataframe中的列顺序
14. 如何格式化dataframe的值
15. 如何将dataframe中的所有值以百分数的格式表示
16.如何从dataframe中每隔n行构建dataframe
17. 如何得到列中前n个最大值对应的索引
18. 如何获得dataframe行的和大于100的最末n行索引
19. 如何从series中查找异常值并赋值
20. 如何交换dataframe的两行
06 小结
pandas库在机器学习项目中的应用主要有两个步骤:(1)读取文件,(2)数据清洗和编辑工作,该步骤中,我们常常需要借组numpy数组来处理数据。希望这篇文章能够让你很好的入门pandas库,多多练习才是王道 。
End.
翻译:石头
参考:https://blog.csdn.net/qq_42156420/article/details/82813482
- 我的微信公众号
- 微信扫一扫
- 我的微信公众号
- 微信扫一扫
评论