Data TankをData Tank 2.0に置き換える際の基本的な手順は以下の通りです:
- Data Tank 2.0の初期セットアップ
- データベースユーザーの作成
- スキーマの作成
- アクセスポリシーの設定
- IPホワイトリストの設定
- Data Tank 2.0用のデータ準備
- TDテーブルのレコードをData Tank 2.0にインポート
- Data TankからData Tank 2.0へのレコード移動
- Data Tank 2.0でのオブジェクト作成
- インテグレーションの宛先をData Tank 2.0に変更
Data Tank 2.0では、Treasure Dataが設定を構成するData Tankとは異なり、Management UIで設定を自己管理できます。
Data Tank 2.0では、Data Tank 2.0にアクセスするためにアクセスキーが必要です。一方、Data Tankにはデフォルトユーザーとしてtank_userとtank_integration_userがあります。Data Tank 2.0では、Management UIでアクセスキーを作成する必要があります。
詳細については、アクセスキーの管理をご覧ください。
Data Tank 2.0では、「public」と呼ばれる1つのスキーマのみを提供するData Tankとは異なり、Management UIで複数のユーザー定義スキーマを作成できます。
詳細については、新しいスキーマの作成をご覧ください。
データベースユーザー(アクセスキー)は、アクセスポリシーと呼ばれるパーミッション設定が適用されるまで、スキーマ内のオブジェクトを操作できません。Management UIで特定のスキーマに対してアクセスキーにパーミッションを付与できます。
詳細については、アクセスポリシーの管理をご覧ください。
Data Tank 2.0も特定のIPアドレスからのアクセスのみを許可します。Management UI経由でData Tank 2.0のIPホワイトリストにIPアドレスを追加してください。
デフォルトで設定されている「g:treasuredata-main」は、Treasure Dataの各機能(Management UIを含む)で使用されるIPアドレスのエイリアスです。削除すると、Data Tank 2.0にアクセスできなくなるため、削除しないでください。
詳細については、IPホワイトリストの設定をご覧ください。
Data Tank 2.0が提供された時点では、データは保存されていません。インポートに必要なデータを準備してください。
TDのテーブルに保存されているレコードを使用する場合は、Result Export to PostgreSQLを使用することをお勧めします。この機能は、Hive/Prestoクエリーの結果をPostgreSQLにエクスポートします。
Data Tankに保存されているレコードをData Tank 2.0に移動する場合は、自分で移動する必要があります。
- Import from PostgreSQLを使用して、Data TankからTDテーブルにデータをインポートします。
- Hive/Prestoクエリでインポートしたレコードを抽出し、Result Export to PostgreSQLを使用してData Tank 2.0に結果をエクスポートします。
これはテーブルごとに実行する必要があります。
PostgreSQLへの結果のエクスポートは、レコードのみをエクスポートします。インデックスなどのオブジェクトが必要な場合は、それらを作成する必要があります。psqlクライアント、pgAdminなどのサードパーティツールを使用できます。
Data Tankと統合する方法はいくつかあります。したがって、Data TankをData Tank 2.0に置き換える場合は、宛先をData TankからData Tank 2.0に変更するためにインテグレーションを更新する必要があります。このようなシナリオの例は以下の通りです:
- Data Tankからインポートするインテグレーション
- Data Tankにエクスポートするインテグレーション
- Workflowのpg>: オペレーター経由でのクエリ実行
- Tableauなどの統合されたサードパーティツール
詳細については、Data TankからData Tank 2.0へのインテグレーション変更をご覧ください。