Pandas的基本功能
- 从Excel、CSV、网页、SQL、剪贴板等文件或工具中读取数据;
- 合并多个文件或者电子表格中的数据,将数据拆分为独立文件;
- 数据清洗,如去重、处理缺失值、填充默认值、补全格式、处理极端值等;
- 建立高效的索引;
- 支持大体量数据;
- 按一定业务逻辑插入计算后的列、删除列;
- 灵活方便的数据查询、筛选;
- 分组聚合数据,可独立指定分组后的各字段计算方式;
- 数据的转置,如行转列、列转行变更处理;
- 连接数据库,直接用SQL查询数据并进行处理;
- 对时序数据进行分组采样,如按季、按月、按工作小时,也可以自定义周期,如工作日;
- 窗口计算,移动窗口统计、日期移动等;
- 灵活的可视化图表输出,支持所有的统计图形;
- 为数据表格增加展示样式,提高数据识别效率
基本操作
查看数据
df.head() # 查看前5条,括号里可以写明你想看的条数
df.tail() # 查看尾部5条
df.sample(5) # 随机查看5条