热线电话:13121318867

登录
2020-06-28 阅读量: 1936
相关性分析之皮尔逊相关系数

皮尔逊相关系数定义:反应两个变量之间变化趋势的方向以及程度,其范围为(-1,1),当系数大于0时,呈正相关;当系数小于0时,呈负相关;当系数等于0时,表示两个变量不是线性相关。系数的绝对值越大,相关性越强;反之,则越弱。

import numpy as np

import pandas as pd #导入模块

import warnings

warnings.filter.warnings('ignore')#不发出警告

# Pearson相关系数 - 算法

from scipy import stats

data1 = pd.Series(np.random.rand(100)*100).sort_values()

data2 = pd.Series(np.random.rand(100)*50).sort_values()

#创建随机数

data = pd.DataFrame({'value1':data1.values,'value2':data2.values})

#生成样本数据

print(data.head())

#查看部分数据

image.png

data.corr()

#计算皮尔逊相关系数

image.png


24.7211
3
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子