Data Tankは廃止予定です。DataTank2.0の使用を推奨します。
Data Tanksを使用すると、TDデータのサブセットを作成し、対話的な分析とレポート作成を実行できます。
Data Tanksは、Treasure Dataのコアプラットフォーム上で完全にホストされた便利なデータマートを通じて、集約されたメトリクスへの簡単なアクセスを提供します。独自のPostgreSQLインスタンスをホストおよび維持することなく、さまざまな外部のビジネスインテリジェンスおよび可視化アプリケーションを駆動するために使用できます。
Data TanksはPostgreSQLデータベースであり、分析クエリを高速化するために使用されます。作成、セットアップ、監視、管理、トラブルシューティングを含め、Treasure Dataによって完全に管理されるため、作業に集中できます。
Treasure Dataは、異なるイベントデータソース(およびいくつかのスローモービングディメンション)が集約され、処理されて、さらなる処理、分析、または可視化のために、よりコンパクトでクリーンなデータパッケージを作成するイベントデータレイクと見なすことができます。
イベントデータレイクのサイズと範囲を考えると、スキーマの柔軟性を保持しながら、数兆のデータポイントに対して高度な同時対話アクセスを提供することは、技術的に不可能です(少なくとも手頃な価格では)。この制限を回避する方法として、レイクショアデータマートと呼ばれる設計パターンがあります。例えば:

画像クレジット: Martin Fowler, DataLake
私たちのData Tanksは、データを水のメタファーとして使用し、分析のためのデータパイプラインがどのように機能するかのメンタルモデルを提供します。
Data Tanksは、1つ以上の個別のデータマートを管理する負担なく、Treasure Dataからビジネスインテリジェンスおよびデータ可視化ツールを駆動するための便利でアクセス可能なメトリクスストアを提供します。
Data Tankは以下として利用可能です:
- 行指向
Data Tanksの使用には、以下の主なメリットがあります:
ユーザーおよびデータベーススキーマ管理のためのManagement UIコンソール
重要なビジネスプロセスのための高可用性オプション
Presto SQLを使用したData Tankデータのクエリが可能で、テーブルの作成と削除が含まれます。
Data TankとコアTDテーブルデータを結合することによる柔軟な処理フロー。
TDは以下のタイプのユーザーを提供します:
Treasure DataコンポーネントからData Tanksにアクセスするため。例えば、Data Tanksへの結果出力、TD Workflowからのpg>オペレーター。
ユーザー側クライアントにアクセスするため。このユーザーで、PostgreSQLのようにData Tanksにアクセスできます。