データの処理順に関係するパラメーターです。
予測結果を再現するために、学習の段階では固定することを推奨します。
機械学習を実際に行う時には乱数を生成するための生成器を指定する方法があります。
生成器を指定する場合のコードは以下の通りです。
import numpy as np
from sklearn.svm import SVC
# 乱数生成器を構築
random_state = np.random.RandomState()
# 乱数生成器をrandom_stateに指定したSVMモデルを構築
model = SVC(random_state=random_state)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 |
import numpy as np from sklearn.svm import SVC from sklearn.datasets import make_classification from sklearn import preprocessing from sklearn.model_selection import train_test_split %matplotlib inline # データの生成 X, y = make_classification( n_samples=1250, n_features=4, n_informative=2, n_redundant=2, random_state=42) train_X, test_X, train_y, test_y = train_test_split(X, y, random_state=42) # 以下にコードを書いてください。 # 乱数生成器の構築 random_state = np.random.RandomState() # モデルの構築 model = SVC(random_state=random_state) # モデルの学習 model.fit(train_X, train_y) # テストデータに対する正解率を出力 print(model.score(test_X, test_y)) |
コメントを残す