複数のデータの訓練、テストスコアを比較

過学習でないかどうかを調べる

訓練セットスコアとテストセットの値が非常に近い場合は適合不足
0.9や1の場合は過学習を疑う

#決定木
from sklearn.tree import DecisionTreeClassifier
ki = DecisionTreeClassifier(random_state=0).fit(train_X, train_y)
print("ketteiki training score{:.2f}".format(ki.score(train_X,train_y)))
print("ketteiki test score{:.2f}".format(ki.score(test_X,test_y)))



#ランダムフォレスト
from sklearn.ensemble import RandomForestClassifier
mori = RandomForestClassifier(random_state=0).fit(train_X,train_y)
print("mori training score{:.2f}".format(mori.score(train_X,train_y)))
print("mori test score{:.2f}".format(mori.score(test_X,test_y)))


#ロジスティック回帰
from sklearn.linear_model import LogisticRegression
logi = LogisticRegression(C=100).fit(train_X,train_y)
print("logi training score{:.2f}".format(logi.score(train_X,train_y)))
print("logi test score{:.2f}".format(logi.score(test_X,test_y)))


# #KNN
from sklearn.neighbors import KNeighborsClassifier
KNN = KNeighborsClassifier(4).fit(train_X,train_y)
print("KNN training score{:.2f}".format(KNN.score(train_X,train_y)))
print("KNN test score{:.2f}".format(KNN.score(test_X,test_y)))

# #SVC
from sklearn.svm import SVC
svc = SVC(probability=True).fit(train_X,train_y)
print("svc training score{:.2f}".format(svc.score(train_X,train_y)))
print("svc test score{:.2f}".format(svc.score(test_X,test_y)))

# #AdaBoostClassifier
from sklearn.ensemble import AdaBoostClassifier
ada = AdaBoostClassifier().fit(train_X,train_y)
print("ada training score{:.2f}".format(ada.score(train_X,train_y)))
print("ada test score{:.2f}".format(ada.score(test_X,test_y)))

# #GradientBoostingClassifier
from sklearn.ensemble import GradientBoostingClassifier
gra = GradientBoostingClassifier().fit(train_X,train_y)
print("gra training score{:.2f}".format(gra.score(train_X,train_y)))
print("gra test score{:.2f}".format(gra.score(test_X,test_y)))

# #GaussianNB
from sklearn.naive_bayes import GaussianNB
gaus = GaussianNB().fit(train_X,train_y)
print("gaus training score{:.2f}".format(gaus.score(train_X,train_y)))
print("gaus test score{:.2f}".format(gaus.score(test_X,test_y)))

# #LinearDiscriminantAnalysis
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
lda = LinearDiscriminantAnalysis().fit(train_X,train_y)
print("lda training score{:.2f}".format(lda.score(train_X,train_y)))
print("lda test score{:.2f}".format(lda.score(test_X,test_y)))

# #QuadraticDiscriminantAnalysis
from sklearn.discriminant_analysis import QuadraticDiscriminantAnalysis
qua = QuadraticDiscriminantAnalysis().fit(train_X,train_y)
print("qua training score{:.2f}".format(qua.score(train_X,train_y)))
print("qua test score{:.2f}".format(qua.score(test_X,test_y)))

#決定木

from sklearn.tree import DecisionTreeClassifier

ki = DecisionTreeClassifier(random_state=0).fit(train_X, train_y)

print("ketteiki training score{:.2f}".format(ki.score(train_X,train_y)))

print("ketteiki test score{:.2f}".format(ki.score(test_X,test_y)))

#ランダムフォレスト

from sklearn.ensemble import RandomForestClassifier

mori = RandomForestClassifier(random_state=0).fit(train_X,train_y)

print("mori training score{:.2f}".format(mori.score(train_X,train_y)))

print("mori test score{:.2f}".format(mori.score(test_X,test_y)))

#ロジスティック回帰

from sklearn.linear_model import LogisticRegression

logi = LogisticRegression(C=100).fit(train_X,train_y)

print("logi training score{:.2f}".format(logi.score(train_X,train_y)))

print("logi test score{:.2f}".format(logi.score(test_X,test_y)))

# #KNN

from sklearn.neighbors import KNeighborsClassifier

KNN = KNeighborsClassifier(4).fit(train_X,train_y)

print("KNN training score{:.2f}".format(KNN.score(train_X,train_y)))

print("KNN test score{:.2f}".format(KNN.score(test_X,test_y)))

# #SVC

from sklearn.svm import SVC

svc = SVC(probability=True).fit(train_X,train_y)

print("svc training score{:.2f}".format(svc.score(train_X,train_y)))

print("svc test score{:.2f}".format(svc.score(test_X,test_y)))

# #AdaBoostClassifier

from sklearn.ensemble import AdaBoostClassifier

ada = AdaBoostClassifier().fit(train_X,train_y)

print("ada training score{:.2f}".format(ada.score(train_X,train_y)))

print("ada test score{:.2f}".format(ada.score(test_X,test_y)))

# #GradientBoostingClassifier

from sklearn.ensemble import GradientBoostingClassifier

gra = GradientBoostingClassifier().fit(train_X,train_y)

print("gra training score{:.2f}".format(gra.score(train_X,train_y)))

print("gra test score{:.2f}".format(gra.score(test_X,test_y)))

# #GaussianNB

from sklearn.naive_bayes import GaussianNB

gaus = GaussianNB().fit(train_X,train_y)

print("gaus training score{:.2f}".format(gaus.score(train_X,train_y)))

print("gaus test score{:.2f}".format(gaus.score(test_X,test_y)))

# #LinearDiscriminantAnalysis

from sklearn.discriminant_analysis import LinearDiscriminantAnalysis

lda = LinearDiscriminantAnalysis().fit(train_X,train_y)

print("lda training score{:.2f}".format(lda.score(train_X,train_y)))

print("lda test score{:.2f}".format(lda.score(test_X,test_y)))

# #QuadraticDiscriminantAnalysis

from sklearn.discriminant_analysis import QuadraticDiscriminantAnalysis

qua = QuadraticDiscriminantAnalysis().fit(train_X,train_y)

print("qua training score{:.2f}".format(qua.score(train_X,train_y)))

print("qua test score{:.2f}".format(qua.score(test_X,test_y)))

[`yahoo` not found]

Reader Interactions

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル