このノートブックは、input_table パラメータで指定されたテーブルを対象に探索的データ分析(EDA)を実行します。
サポートされている分析手法:
- Pandas DataFrameに基づく基本的なEDA
- Pandas Profiling
- Sweetvizに基づくEDA
- missingnoに基づく欠損データの可視化
EDAノートブックからの可視化の例を以下に示します:



サンプルワークフローはこちらのTreasure Boxesをご覧ください。
+run_eda:
ipynb>:
notebook: EDA
input_table: ml_datasets.bank_marketing
eda: all
sampling_threshold: 1000000| パラメータ名 | コンソール上のパラメータ | 説明 | デフォルト値 |
|---|---|---|---|
| docker.task_mem | Docker Task Mem | タスクメモリサイズ。ご契約のティアに応じて、64g、128g(デフォルト)、256g、384g、または512gが利用可能です | 128g |
| input_table | Input Table | EDAに使用するTDテーブルをdbname.table_name形式で指定します | - |
| target_column | Target Column | ラベルとして使用するカラム名 | None |
| ignore_columns | Ignore Columns | EDAで無視するカラム | time |
| sampling_threshold | Sampling Threshold | サンプリングに使用する閾値。詳細は実行されたノートブックを参照してください | 10_000_000 |
| eda | Eda | allまたは実行するEDAの種類を指定するカンマ区切りの文字列 | all |