Skip to content
Last updated

探索的データ分析

このノートブックは、input_table パラメータで指定されたテーブルを対象に探索的データ分析(EDA)を実行します。

サポートされている分析手法:

EDAノートブックからの可視化の例を以下に示します:

EDAワークフローの例

サンプルワークフローはこちらのTreasure Boxesをご覧ください。

+run_eda:
  ipynb>:
    notebook: EDA
    input_table: ml_datasets.bank_marketing
    eda: all
    sampling_threshold: 1000000

パラメータ

パラメータ名コンソール上のパラメータ説明デフォルト値
docker.task_memDocker Task Memタスクメモリサイズ。ご契約のティアに応じて、64g、128g(デフォルト)、256g、384g、または512gが利用可能です128g
input_tableInput TableEDAに使用するTDテーブルをdbname.table_name形式で指定します-
target_columnTarget Columnラベルとして使用するカラム名None
ignore_columnsIgnore ColumnsEDAで無視するカラムtime
sampling_thresholdSampling Thresholdサンプリングに使用する閾値。詳細は実行されたノートブックを参照してください10_000_000
edaEdaallまたは実行するEDAの種類を指定するカンマ区切りの文字列all