Skip to content
Last updated

RedshiftでのLive Connect Zero Copy

この機能はベータ版です。詳細については、カスタマーサクセス担当者にお問い合わせください。

Amazon Redshift向けのLive Connect Zero-Copyにより、お客様はTreasure Data Customer Data Platform (CDP)を使用して、Extract、Transform、Load (ETL)プロセスを必要とせずにRedshift上のデータにアクセスできます。このアプローチは、セキュリティを強化し、データ移動に関連するコストを削減します。Treasure Data環境から直接Redshiftに保存されているデータのシームレスな統合とクエリを可能にします。

RedshiftデータウェアハウスからのZero-Copyの実行は、Treasure Data Redshiftインテグレーションを活用してフェデレーテッドクエリを実行します。データフローは次のようになります:

フェデレーテッドクエリについて

フェデレーテッドクエリにより、データエンジニアは認証情報を使用して外部データウェアハウスに接続し、データにアクセスしてクエリを実行できます。この機能により、迅速なデータ拡張が可能になり、データエンリッチメントプロセスの効率が向上します。フェデレーテッドクエリを使用することで、データエンジニアは現在のニーズに基づいて外部データと内部データを動的にクエリおよび結合でき、柔軟性が提供され、複雑なETLプロセスの必要性が軽減されます。このアプローチにより、リアルタイムのデータアクセス、データガバナンスとセキュリティの向上、およびデータ管理の簡素化も保証されます。

Redshiftでのフェデレーテッドクエリの実行

Redshiftでzero-copyを実装するための手順は、概略として以下の通りです:

  1. TD Integration Hubで、Redshiftインテグレーションを使用して認証を作成します。
  2. 新しいZero-Copyソースを作成し、Redshift認証情報と接続情報を指定します。
  3. TD Data Workbenchで、新しいQueryを作成します。クエリするテーブル名の前に、作成したばかりのzero-copyソースの名前を付けます。例えば、次のように設定されたsnowflake_connという名前のZero-Copy (Federated Query)設定がある場合:

次のように、testデータベースのtable1のクエリを指定できます:

select * from redshift_test.test_schema.table1

test_schemaはRedshiftのスキーマ名です。

  1. クエリを実行した後、結果を処理して既存のオーディエンスプロファイルを更新または拡張します。

Treasure Dataがクエリ結果の処理を完了した後、クエリ結果は7日後に削除されます。ただし、INSERT INTOオプションを使用して、クエリ結果をTreasure Dataに保存できます。

制限事項

RedshiftでのZero-Copyには、以下の制限があります:

  • カタログ名の長さは64文字を超えることはできません。
  • カタログ名のプレフィックスはredshift_で始まる必要があります。
  • 同じアカウントのすべてのDWHにわたって200を超える「Zero-Copy (Federated Query) Configs」を持つことはできません。
  • フェデレーテッドクエリはTrinoでのみ利用可能です。
  • クエリあたりの入力サイズ制限は10GBです。(Trinoプレビュークラスターでは利用できません。)
  • カタログ反映時間:最大5分(新しく作成されたzero-copyカタログまたはカタログの変更が反映されるまで最大5分かかります。)

関連項目