2020-06-28
阅读量:
1936
相关性分析之皮尔逊相关系数
皮尔逊相关系数定义:反应两个变量之间变化趋势的方向以及程度,其范围为(-1,1),当系数大于0时,呈正相关;当系数小于0时,呈负相关;当系数等于0时,表示两个变量不是线性相关。系数的绝对值越大,相关性越强;反之,则越弱。
import numpy as np
import pandas as pd #导入模块
import warnings
warnings.filter.warnings('ignore')#不发出警告
# Pearson相关系数 - 算法
from scipy import stats
data1 = pd.Series(np.random.rand(100)*100).sort_values()
data2 = pd.Series(np.random.rand(100)*50).sort_values()
#创建随机数
data = pd.DataFrame({'value1':data1.values,'value2':data2.values})
#生成样本数据
print(data.head())
#查看部分数据
data.corr()
#计算皮尔逊相关系数






评论(0)


暂无数据
推荐帖子
2条评论
0条评论
2条评论