使用函数库 Numpy 和 Pandas
Numpy
用于创建一维数组和二维矩阵(以及多维), 并对其进行运算
1 | import numpy as np |
Pandas
Series 序列
value 和 index(可重复数据标记), value 本质上还是列表/numpy.array.
1 | import pandas as pd |
DataFrame 就是类似 mysql 的数据表
1 | # 随机数据 |
数据规整化
判断缺失值 df.isnull() / df.notnull()
DataFrame 对象判断 NaN / None 时返回一个 True|False 的 DataFrame 对象.
df.A[df.A.notnull()] 选出有数值的数据
填充缺失数据 df.fillna(…)
删除缺失值 df.dropna(…)
判断重复行/删除 df.duplicated([columeName]), df.drop_duplicates([columnName]) 默认不传列名, 匹配所有列
Matplotlib 绘图
@TODO 绘图部分