Python 好きなピンクを相関分析してみるでピンク色をRGB値で表して好みと相関分析したのですが わーい!って結果が出なかったので会社の人からおすすめされたHSVで相関分析を再実行!
インプットデータはこちら
色相(Hue)
色相(Hue)とLIKEの相関係数:0.339171
彩度(Saturation)
彩度(Saturation)とLIKEの相関係数:0.561567
明度(Value)
なかなか思うようにいかない
高い相関は出なかった。。。データ数が少ないのでデータの特徴とか見出しづらいのかな 同じデータでニューラルネットワークも試しているが、エラーが出るようになった! (インプットデータの標準化?前処理でデータの次元が分からなくなりました) 次はビッグデータを取ってきてきちんと前処理して分析するのが課題
import pandas as pd from sklearn import linear_model import matplotlib.pyplot as plt %matplotlib inline import seaborn as sons csv_data = pd.read_csv('pink_hsv.csv') data = pd.DataFrame(csv_data) pd.DataFrame(csv_data) # 色相とLIKEの関連 x = data[['H']] y = data[['LIKE']] plt.scatter(x, y) plt.xlabel('Hue') plt.ylabel('LIKE') plt.show # 相関分析 df = data[[x.columns[0], y.columns[0]]] corr_mat = df.corr(method='pearson') print(corr_mat) sons.heatmap(corr_mat, vmin=-1.0, vmax=1.0, center=0, annot=True, fmt='.1f', xticklabels=corr_mat.columns.values, yticklabels=corr_mat.columns.values ) plt.show() # 彩度とLIKEの関連 x = data[['S']] y = data[['LIKE']] plt.scatter(x, y) plt.xlabel('Saturation') plt.ylabel('LIKE') plt.show # 相関分析 df = data[[x.columns[0], y.columns[0]]] corr_mat = df.corr(method='pearson') print(corr_mat) sons.heatmap(corr_mat, vmin=-1.0, vmax=1.0, center=0, annot=True, fmt='.1f', xticklabels=corr_mat.columns.values, yticklabels=corr_mat.columns.values ) plt.show() # 明度とLIKEの関連 x = data[['V']] y = data[['LIKE']] plt.scatter(x, y) plt.xlabel('Value') plt.ylabel('LIKE') plt.show # 相関分析 df = data[[x.columns[0], y.columns[0]]] corr_mat = df.corr(method='pearson') print(corr_mat) sons.heatmap(corr_mat, vmin=-1.0, vmax=1.0, center=0, annot=True, fmt='.1f', xticklabels=corr_mat.columns.values, yticklabels=corr_mat.columns.values ) plt.show()