Skip to content
Last updated

Adobe Analytics Import Integration V2

Adobe Analytics Import Integration v2を使用すると、Adobe Analyticsによって生成されたdata feedをネイティブconnectorを通じてTreasure dataに直接取り込むことができます。Adobe Analyticsユーザーが利用するクラウドストレージサービスとの柔軟性が向上しています。

Adobe Analyticsは、組織がデジタル顧客インタラクションからデータを収集し、実用的なインサイトを得ることを可能にします。詳細については、Adobe experience league docsを参照してください。

前提条件

  • TD Toolbeltを含むTreasure Dataの基本知識。
  • Adobe Analyticsの基本知識

Treasure Data Integration の静的 IP アドレス

セキュリティポリシーで IP ホワイトリストが必要な場合は、接続を成功させるために Treasure Data の IP アドレスを許可リストに追加する必要があります。

リージョンごとに整理された静的 IP アドレスの完全なリストは、次のリンクにあります: https://api-docs.treasuredata.com/en/overview/ip-addresses-integrations-result-workers/

TD Consoleを使用したAdobe Analyticsからのインポート

Authenticationの作成

connectorはdata sourceとしてクラウドストレージサービスをサポートしています。data sourceにアクセスするには、authenticationを設定する必要があります。

  1. Integrations Hubを選択します。
  2. Catalogを選択します。
  3. 名前"Adobe Analytics V2"でCatalog内のIntegrationを検索するか、カテゴリ"Web/Mobile analytics services"および/または"Business Intelligence"でフィルタリングします。
  4. アイコンにマウスを合わせ、Create Authenticationを選択します。
  5. Adobe Analyticsからdata feedを受信するクラウドサービスに対応するStorage Typeを選択します。
  6. Bucket情報を入力します。
  7. Endpointを入力します。または、そのリージョンのデフォルトendpointを使用する場合はRegionを選択します。
  8. Authentication Methodを選択します。選択したStorage Typeに応じて、さまざまな方法がサポートされています。例えば、Amazon S3の場合、connectorは以下をサポートしています:
    1. Basic
    2. Session Token
    3. Assume Role
  9. 選択したAuthentication Methodに応じて必要な認証情報を入力します。

Storage Type: 現在、選択可能なのはAmazon S3のみです。他のサービスのサポートは将来の実装を予定しており、ロードマップに記載されています。

Bucketディレクトリのセットアップ

file loaderはbucketルート直下に保存されているファイルをサポートしていません。

file loaderによるパフォーマンスと認識を向上させるために、異なるreport suiteのdata feedは別々のディレクトリに保存することをお勧めします。file loaderによる認識を向上させるために、ディレクトリ名には正規化された英数字を使用することをお勧めします。

Import設定 - Hitファイル

connectorはdata feed内のhitファイルとlook upファイルの両方の取り込みをサポートしています。

file loaderはReport Suite IDとPath Prefixを使用してdata feedファイルを検索します。複数のdata feedが見つかった場合、最も古いfeedが選択され、job実行ごとに1つのfeedのみが処理されます。

  1. Targetはインポートするデータのタイプです。
    1. Data Feed: hitファイルをインポートします。
    2. Look Up Data: look upファイルをインポートします。
  2. TargetとしてData Feed Dataを選択します。
  3. bucket内の目的のディレクトリへのPath Prefixを入力します。
  4. Report Suite IDを入力します。
  5. Incrementalを選択します。このオプションを有効にすると、import jobは前回の実行タイムスタンプ以降にbucketにアップロードされたファイルのみを検索します。
  6. Modified After。このオプションは古いdata feedをフィルタリングするために使用します

Incrementalと適切なjobスケジュールを使用して、次のjob実行時にAdobe Analyticsによって配信される正しいdata feedが選択されるようにすることをお勧めします。

Import設定 - Look upファイル

Look-upファイルをdatabaseにインポートして、後続のqueryと分析を容易にできます。

  1. Source Tableで、TargetLook Up Dataに設定します。

lookup_type (filename without extenstion); key (1st column) ; value (2nd column) ; source (datafeed name)
browser                                  ; 1                ; chrome             ; treasuredata_20240101-120000
browser                                  ; 2                ; IE                 ; treasuredata_20240101-120000
country                                  ; 1                ; Afghanistan        ; treasuredata_20240101-120000
country                                  ; 2                ; Albania            ; treasuredata_2024-01-01
country                                  ; 3                ; Algeria            ; treasuredata_2024-01-01
resolution                               ; 1                ; 320 x 200          ; ...
resolution                               ; 2                ; 640 x 240          ; ...
.........

Advance設定

以下の手順に従って、詳細設定、data placement、jobのスケジュールを設定してください。

connectorは、初回リクエストが失敗した場合の再試行をサポートしています。再試行は、hitファイルは見つかったがlook upファイルが見つからない場合にのみ行われます。次の再試行時間はExponential Backoffルールに従って決定されます。ユーザーは以下を設定できます:

Data Settingsの設定

  1. Max Retry: 最大再試行回数。デフォルトは7です。
  2. Initial Retry Wait: 初回の待機時間(秒単位)。デフォルトは2です。
  3. Max Retry Wait: 次の再試行前の最大許容待機時間。

Data Previewの設定

hitデータはクリックの生データであるため、connectorはこの画面でダミー値のみを表示します。

Data Placementの設定

ユーザーは、データをインポートするdatabaseとtableを設定できます。

  1. Database****and Table: 宛先を選択するか、新しいものを作成します。
  2. Database情報を入力します。
  3. Table情報を入力します。
  4. 保存Methodを選択します。
    1. Append
    2. Always replace
    3. Replace on new data.
  5. Timestamp-based Partition Keyを選択します。

Schedule:

  1. Repeatを設定します
    1. On: スケジュールを設定します。
    2. Off
  2. Schedule Timezoneを設定します。スケジュールタイムスタンプのタイムゾーン参照を選択します。