Skip to content
Last updated

Gluon Train

このノートブックは、AutoGluonを使用して予測モデルを構築し、データ処理、特徴エンジニアリング、モデル選択、アンサンブル、ハイパーパラメータチューニングを自動化します。

AutoGluonは、スタックアンサンブルを使用して複数のMLモデルを組み合わせます。サポートされているモデルには以下が含まれます:

  • ニューラルネットワーク (MXNet、FastAI)
  • 勾配ブースティングモデル (LightGBM、CatBoost、XGBoost)
  • ランダムフォレスト
  • エクストリームランダマイズドツリー
  • k近傍法

ワークフロー例

サンプルワークフローはTreasure Boxesにあります。

+gluon_train:
  ml_train>:
    notebook: gluon_train
    model_name: gluon_model
    input_table: ml_dataset.bank_marketing
    target_column: loan
    time_limit: 3 * 60 # soft time limit in seconds

パラメータ

パラメータ名コンソール名説明デフォルト
docker.task_memDocker Task Memタスクメモリサイズ。利用可能: 64g、128g(デフォルト)、256g、384g、512g(ティアに依存)。128g
input_tableInput TableEDAに使用されるTDテーブル(dbname.table_name形式)。-
target_columnTarget Columnラベルとして使用される列名。-
model_nameModel Name予測モデル名。-
problem_typeProblem Typebinary、multiclass、regression、quantileのいずれか。指定されていない場合は推論されます。None
oversampling_thresholdOversampling ThresholdSMOTE オーバーサンプリングを実行するための少数クラスの閾値率(バイナリのみ)。0で無効化。0.001
proba_calibrationProba Calibrationオーバーサンプリング後に確率キャリブレーションを実行します。True
eval_metricEval Metric指定されていない場合は自動的に選択されます。None
ignore_columnsIgnore Columns無視する列。time
time_limitTime Limit秒単位のソフト学習制限時間(最大24時間)。AutoGluonへのヒント。60 * 60
sampling_thresholdSampling Thresholdサンプリングに使用される閾値。実行されたノートブックを参照してください。10_000_000
export_leaderboardExport Leaderboard指定された場合、リーダーボードをTDテーブルとしてエクスポートします。None
export_feature_importanceExport Feature Importance指定された場合、特徴量重要度をTDテーブルとしてエクスポートします。None
exclude_modelsExclude Model無視するモデル。KNN
hide_table_contentsHide Table Contentsテーブルの内容表示を抑制します。False
share_modelShare Modelアカウント内で学習済みモデルを共有します。False
refit_fullRefit Full全データでモデルを再学習します。選択肢: best、false、default。default

使用可能なeval_metric値:

  • Binary & Multiclass: accuracy、balanced_accuracy、f1、f1_macro、f1_micro、f1_weighted、average_precision、precision、precision_macro、precision_micro、precision_weighted、recall、recall_macro、recall_micro、recall_weighted、log_loss(マルチクラスのデフォルト)、pac_score
  • Binary のみ: roc_auc(バイナリのデフォルト)、roc_auc_ovo_macro
  • Regression: root_mean_squared_error(デフォルト)、mean_squared_error、mean_absolute_error、median_absolute_error、r2
  • Quantile Regression: pinball_loss(デフォルト)

詳細については、AutoGluonドキュメントを参照してください。