この記事では、MySQLからTreasure Dataにデータを直接インポートできるMySQLのデータコネクタの使用方法について説明します。
MySQLからデータをインポートするサンプルワークフローについては、Treasure Boxesをご覧ください。
- Treasure Dataの基本知識
- MySQLの基本知識
- Treasure Dataから到達可能なMySQLインスタンス
MySQL Community Server 5.6および5.7を使用しており、SSLを使用したい場合は、コネクタの基礎となるライブラリとの互換性の問題を解決するために、パラメータenabledTLSProtocolsとTLSv1.2を設定してください。その他のMySQLバージョンでは、インテグレーションは自動的に最高のTLSバージョンを使用しようとします。
データ接続を構成する際、インテグレーションにアクセスするための認証を提供します。Treasure Dataでは、認証を構成してからソース情報を指定します。
TD Consoleを開きます。
Integrations Hub > Catalogに移動します。
MySQLを検索して選択します。
Createを選択します。
次のダイアログが開きます。

以下のパラメータを設定します。Continueを選択します。
| パラメータ | 説明 |
|---|---|
| Host | リモートデータベースのホスト情報(例: IPアドレス)。 |
| Port | リモートインスタンスの接続ポート。MySQLのデフォルトは3306です。 |
| Username | リモートデータベースに接続するためのユーザー名。 |
| Password | リモートデータベースに接続するためのパスワード。 |
| SSL Mode | SSL modeの詳細をご覧ください |
| useLegacyDatetimeCode | useLegacyDatetimeCodeの詳細をご覧ください |
| OPTIONS | |
| JDBC Connection options | リモートデータベースで必要な特別なJDBC接続。 |
| Socket connection timeout | ソケット接続のタイムアウト(秒単位)(デフォルトは300)。 |
| Network timeout | ネットワークソケット操作のタイムアウト(秒単位)。0はタイムアウトなしを意味します。 |
- 接続の名前を入力します。
- Doneを選択します。
認証済み接続を作成すると、自動的にAuthenticationsに移動します。
- 作成した接続を検索します。
- New Sourceを選択します。
Data TransferフィールドにSourceの名前を入力します。

データを取り込むデータベースとテーブルの詳細を入力します。
- Nextを選択します。
- 以下のパラメータを編集します。
| パラメータ | 説明 |
|---|---|
| Database name | データを転送するデータベースの名前。(例: your_database_name) |
| Use custom SELECT query? | 単純なSELECT (columns) FROM table WHERE (condition)以上のものが必要な場合に使用します。 |
| SELECT columns | 特定のカラムからのみデータを取得したい場合は、ここにリストします。それ以外の場合は、すべてのカラムが転送されます。 |
| Table | データをインポートするテーブル。 |
| WHERE condition | テーブルから取得するデータに追加の特定性が必要な場合は、WHERE句の一部として指定できます。 |
Nextを選択します。 Data Settingsページが開きます。
オプションで、データ設定を編集するか、このダイアログページをスキップします。

| パラメータ | 説明 |
|---|---|
| Incremental | この転送を繰り返し実行する場合、このチェックボックスにより、前回のインポート実行以降のデータのみをインポートできます。 |
| Rows per batch | 非常に大きなデータセットは、メモリの問題とそれに伴うジョブの失敗につながる可能性があります。このフラグにより、メモリの問題とジョブの失敗の可能性を減らすために、行数ごとにインポートジョブをバッチに分割できます。 |
| Default timezone | インポート時に使用されるタイムゾーン。デフォルトはUTCですが、必要に応じて変更できます。 |
| After SELECT | このSQLは、同じトランザクション内でSELECTクエリの後に実行されます。 |
| Column Options | インポート前にカラムのタイプを変更する必要がある場合は、このオプションと関連するカラムの詳細を選択します。入力した詳細設定を保存するには、Saveを選択します。 |
インポートを実行する前に、Generate Preview を選択してデータのプレビューを表示できます。Data preview はオプションであり、選択した場合はダイアログの次のページに安全にスキップできます。
- Next を選択します。Data Preview ページが開きます。
- データをプレビューする場合は、Generate Preview を選択します。
- データを確認します。
データの配置について、データを配置したいターゲット database と table を選択し、インポートを実行する頻度を指定します。
Next を選択します。Storage の下で、インポートされたデータを配置する新しい database を作成するか、既存の database を選択し、新しい table を作成するか、既存の table を選択します。
Database を選択 > Select an existing または Create New Database を選択します。
オプションで、database 名を入力します。
Table を選択 > Select an existing または Create New Table を選択します。
オプションで、table 名を入力します。
データをインポートする方法を選択します。
- Append (デフォルト) - データインポートの結果は table に追加されます。 table が存在しない場合は作成されます。
- Always Replace - 既存の table の全体の内容をクエリの結果出力で置き換えます。table が存在しない場合は、新しい table が作成されます。
- Replace on New Data - 新しいデータがある場合のみ、既存の table の全体の内容をクエリの結果出力で置き換えます。
Timestamp-based Partition Key 列を選択します。 デフォルトキーとは異なるパーティションキーシードを設定したい場合は、long または timestamp 列をパーティショニング時刻として指定できます。デフォルトの時刻列として、add_time フィルターで upload_time を使用します。
データストレージの Timezone を選択します。
Schedule の下で、このクエリを実行するタイミングと頻度を選択できます。
- Off を選択します。
- Scheduling Timezone を選択します。
- Create & Run Now を選択します。
- On を選択します。
- Schedule を選択します。UI では、@hourly、@daily、@monthly、またはカスタム cron の 4 つのオプションが提供されます。
- Delay Transfer を選択して、実行時間の遅延を追加することもできます。
- Scheduling Timezone を選択します。
- Create & Run Now を選択します。
転送が実行された後、Data Workbench > Databases で転送の結果を確認できます。