機械学習の予測精度を向上させるハイパーパラメータの調整

2022-01-20

機械学習の予測精度を向上させるハイパーパラメータの調整

記事をシェアする

[！] この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

ハイパーパラメータとは

ハイパーパラメータとは、機械学習において学習パフォーマンスやレイヤーの構成など、トレーニング中に変化しないパラメータのことを指します。
ハイパーパラメータには大きく分けて以下の2種類が存在します。

モデルハイパーパラメータ
- 隠れ層の数と幅など、モデルの構造に影響する。
アルゴリズムハイパーパラメータ
- 確率的勾配降下法の学習率やモーメンタムなど、学習アルゴリズムの速度と性質に影響する。

一般的に、ハイパーパラメータは予め複数の候補を用意しておき、それらの組み合わせを入れ替えて予測や推論を繰り返し、最終的に最も性能の良いハイパーパラメータの組み合わせを採用します。
このようなハイパーパラメータの組み合わせ毎の性能評価を自動化したものをハイパーパラメータチューニング、またはハイパーチューニングと呼びます。
ここでは、KerasTuner API ⧉を使用したハイパーチューニングについて触れていきます。

環境構築

Keras Tunerは、Pythonで動作するので、事前にPythonをインストールしてください。
この記事の開発環境は以下の通りです。

OS : Windows 10 Pro
Python : 3.9.9

Pythonの仮想環境を作成

Pythonの開発では、パッケージのバージョン違いや依存関係が問題になることがよくあります。
そのため、仮想環境を作成して開発をおこなうことが一般的です。
ここでは、ktprojectという作業フォルダに仮想環境を作成します。
Windows PowerShellを起動し、以下のコマンドを実行して、作業フォルダを作成します。

1
PS > mkdir ktproject
2
PS > cd ktproject

続いて、以下のコマンドを実行して、仮想環境を作成および有効化します。

1
PS > py -3.9 -m venv .venv
2
PS > .\.venv\Scripts\Activate.ps1

以下のように表示されていれば、仮想環境が有効化されています。

1
(.venv) PS >

必要なパッケージをインストール

以下のコマンドを実行して、必要なライブラリをインストールします。

1
(.venv) PS > python -m pip install -U pip
2
(.venv) PS > pip install tensorflow
3
(.venv) PS > pip install tensorflow_datasets
4
(.venv) PS > pip install keras_tuner

これでKeras Tunerを使用する準備は完了です。

データセットについて

ここでは、MNISTデータセット ⧉を使用して手書き数字の画像を0～9のいずれかに分類します。
MNISTデータセットには以下のような手書き数字の画像が多数含まれています。

モデルについて

手書き数字の画像を分類するための単純なモデルを構築します。
ここでは、1つの平滑化の入力層、いくつかの全結合の隠れ層、0～9の数字に分類するための全結合の出力層からなるSequentialモデルを使います。

ハイパーチューニングの流れ

まずは、ハイパーチューニングのおおまかな流れを説明していきます。

ハイパーモデルの定義

ハイパーチューニング用にセットアップするモデルをハイパーモデルと呼びます。
ハイパーモデルは、モデルビルダー関数を使用するか、KerasTuner APIのHyperModelクラスをサブクラス化することで定義できます。また、あらかじめ定義されているHyperResNet、HyperXceptionを利用することもできます。
ここでは、下記のモデルビルダー関数を使用して、画像分類モデルを定義します。

モデルビルダー関数内で、引数に渡されたHyperParametersインスタンスのIntメソッドやChoiceメソッドなどを呼び出すことでハイパーパラメータを定義します。
この関数が呼び出されると、定義されたハイパーパラメータを使用してモデルをハイパーチューニングし、コンパイル済みのモデルを返します。

1
def model_builder(hp):
2
    model = tf.keras.Sequential()
3

4
    # 入力層
5
    model.add(tf.keras.layers.Flatten(input_shape=(28, 28)))
6

7
    # 隠れ層
8
    hp_n_hidden_layers = hp.Int("n_hidden_layers", min_value=1, max_value=5)
9
    for i in range(hp_n_hidden_layers):
10
        hp_units = hp.Int("units_%d" % (i + 1), min_value=32, max_value=512, step=32)
11
        model.add(tf.keras.layers.Dense(hp_units, activation="relu"))
12

13
    # 出力層
14
    model.add(tf.keras.layers.Dense(10, activation="softmax"))
15

16
    # 最適化アルゴリズム、損失関数、評価関数を指定してコンパイル
17
    hp_learning_rate = hp.Choice("learning_rate", values=[1e-2, 1e-3, 1e-4])
18
    model.compile(
19
        optimizer=tf.keras.optimizers.Adam(hp_learning_rate),
20
        loss="sparse_categorical_crossentropy",
21
        metrics=["accuracy"],
22
    )
23

24
    return model

チューナーのインスタンス化

KerasTuner APIには、RandomSearch、Hyperband、BayesianOptimization、およびSklearnチューナーがあります。
ここでは、以下のようにval_accuracyの収束を目的として指定し、Hyperbandチューナーをインスタンス化します。

1
tuner = kt.Hyperband(
2
    hypermodel=model_builder,
3
    objective="val_accuracy",
4
    max_epochs=10,
5
    directory=".cache",
6
    project_name="kt",
7
    overwrite=True,
8
)

ハイパーチューニングの実施

最後に、チューナーを使ってハイパーチューニングを実施します。
searchメソッドの引数は、tf.keras.model.fitに使用される引数と同じです。

1
tuner.search(
2
    ds_train,
3
    epochs=10,
4
    validation_data=ds_test,
5
)

実際に動作させてみる

以下のコードをktsample.pyとして保存します。

1
import tensorflow as tf
2

3
# Tensor Flow のログを抑制
4
tf.get_logger().setLevel("ERROR")
5

6
import keras_tuner as kt
7
import tensorflow_datasets as tfds
8

9

10
def model_builder(hp):
11
    model = tf.keras.Sequential()
12

13
    # 入力層
14
    model.add(tf.keras.layers.Flatten(input_shape=(28, 28)))
15

16
    # 隠れ層
17
    hp_n_hidden_layers = hp.Int("n_hidden_layers", min_value=1, max_value=5)
18
    for i in range(hp_n_hidden_layers):
19
        hp_units = hp.Int("units_%d" % (i + 1), min_value=32, max_value=512, step=32)
20
        model.add(tf.keras.layers.Dense(hp_units, activation="relu"))
21

22
    # 出力層
23
    model.add(tf.keras.layers.Dense(10, activation="softmax"))
24

25
    # 最適化アルゴリズム、損失関数、評価関数を指定してコンパイル
26
    hp_learning_rate = hp.Choice("learning_rate", values=[1e-2, 1e-3, 1e-4])
27
    model.compile(
28
        optimizer=tf.keras.optimizers.Adam(hp_learning_rate),
29
        loss="sparse_categorical_crossentropy",
30
        metrics=["accuracy"],
31
    )
32

33
    return model
34

35

36
def normalizer(image, label):
37
    return tf.cast(image, tf.float32) / 255.0, label
38

39

40
def main():
41
    # データセットをロードする
42
    (ds_train, ds_test), ds_info = tfds.load(
43
        "mnist",
44
        split=["train", "test"],
45
        as_supervised=True,
46
        with_info=True,
47
    )
48

49
    # 学習用のパイプラインを作成する
50
    ds_train = ds_train.map(normalizer, num_parallel_calls=tf.data.AUTOTUNE)
51
    ds_train = ds_train.cache()
52
    ds_train = ds_train.shuffle(ds_info.splits["train"].num_examples)
53
    ds_train = ds_train.batch(128)
54
    ds_train = ds_train.prefetch(tf.data.AUTOTUNE)
55

56
    # 検証用のパイプラインを作成する
57
    ds_test = ds_test.map(normalizer, num_parallel_calls=tf.data.AUTOTUNE)
58
    ds_test = ds_test.batch(128)
59
    ds_test = ds_test.cache()
60
    ds_test = ds_test.prefetch(tf.data.AUTOTUNE)
61

62
    # チューナーをインスタンス化する
63
    tuner = kt.Hyperband(
64
        hypermodel=model_builder,
65
        objective="val_accuracy",
66
        max_epochs=10,
67
        directory=".cache",
68
        project_name="kt",
69
        overwrite=True,
70
    )
71

72
    # ハイパーパラメータを検索する
73
    tuner.search(
74
        ds_train,
75
        epochs=10,
76
        validation_data=ds_test,
77
    )
78

79
    # 最も性能が良かったハイパーパラメータを使ってモデルをビルドする
80
    hp = tuner.get_best_hyperparameters(num_trials=1)[0]
81
    model = tuner.hypermodel.build(hp)
82

83
    # モデルに画像とラベルを学習させる
84
    model.fit(
85
        ds_train,
86
        epochs=6,
87
        validation_data=ds_test,
88
    )
89

90
    # 学習済みのモデルを保存する
91
    model.save("model")
92

93
    # モデルの構成を表示する
94
    model.summary()
95

96

97
if __name__ == "__main__":
98
    main()

以下のコマンドを実行して、ktsample.pyを実行します。

1
(.venv) PS > python ktsample.py

実行が完了すると、最も性能が良かったモデルがmodelフォルダ配下に保存されます。
保存されたモデルは、以下のようにkeras.models.load_modelメソッドでロードし、再利用する事ができます。

1
def normalizer(image, label):
2
    return tf.cast(image, tf.float32) / 255.0, label
3

4
(ds_train, ds_test), ds_info = tfds.load(
5
    "mnist",
6
    split=["train", "test"],
7
    as_supervised=True,
8
    with_info=True,
9
)
10

11
ds_test = ds_test.take(nrows * ncols)
12
ds_test = ds_test.map(normalizer, num_parallel_calls=tf.data.AUTOTUNE)
13
ds_test = ds_test.batch(ncols)
14
ds_test = ds_test.cache()
15
ds_test = ds_test.prefetch(tf.data.AUTOTUNE)
16

17
model = tf.keras.models.load_model('model')
18

19
output = model.predict(ds_test)

実際にモデルを再利用し、MNISTデータセットの数字画像を分類した結果は以下の通りです。

まとめ

今回は、分類モデルのモデルハイパーパラメータ、およびアルゴリズムハイパーパラメータに対してKeras Tunerによるハイパーチューニングを実施するところまでを紹介しました。
Keras Tunerを使えば、コンピュータビジョンで使われるような複雑なKerasモデルやKeras Function APIを使ったモデルなどを簡単にハイパーチューニングすることができます。

ぜひ一度、他のモデルで実践してみてください。

記事をシェアする