python의 pandas 데이터프레임을 활용하여 피어슨 상관계수를 구하는 방법에 대해 살펴보겠습니다.
df라는 이름의 데이터프레임에 col1이라는 컬럼과 col2라는 컬럼이 있다고 할 때, 피어슨 상관계수는 다음과 같이 구할 수 있습니다.
corr = df['col1'].corr(df['col2'], method='pearson')
참고로 상관계수는 절대값으로 1에 가까울 수록 두 변수 간에 상관성이 강한 것이고, 0에 가까울 수록 상관성이 약한 것입니다.