Skip to content
Last updated

Adobe Analytics Import Integration

クラウドストレージサービスをサポートするこのconnectorのバージョン2がリリースされました。詳細については、Adobe Analytics Import Integration (V2)を参照してください

Adobe Analytics用のdata connectorを使用すると、Adobe AnalyticsのSFTPサーバーに保存されているファイルをTreasure Dataにインポートできます。

前提条件

  • Treasure Dataの基本知識
  • AdobeからのSFTPファイルサーバー

Treasure Data Integration の静的 IP アドレス

セキュリティポリシーで IP ホワイトリストが必要な場合は、接続を成功させるために Treasure Data の IP アドレスを許可リストに追加する必要があります。

リージョンごとに整理された静的 IP アドレスの完全なリストは、次のリンクにあります: https://api-docs.treasuredata.com/en/overview/ip-addresses-integrations-result-workers/

制限事項

  • このintegrationはgzip形式のみをサポートしています。圧縮ファイル形式のtar.gzおよびzipはサポートされていません。

TD Consoleを使用した接続の作成

TD consoleを使用してdata connectorを作成できます。

Authenticationの作成

data connectionを設定する際、integrationにアクセスするためのauthenticationを提供します。Treasure Dataでは、authenticationを設定してからsource情報を指定します。

  1. TD Consoleを開きます。
  2. Integrations Hub > Catalogに移動します。
  3. Catalog画面の右端にある検索アイコンをクリックし、Adobe Analyticsと入力します。
  4. Adobe Analytics connectorにマウスを合わせ、Create Authenticationを選択します。
  5. リモートのAdobe Analytics SFTPインスタンスに必要な認証情報を入力します。
  6. パラメータを設定します。
  7. 必要な接続詳細を入力した後、Continueを選択します。後で接続詳細を変更する必要がある場合に簡単に見つけられるように接続に名前を付けます。この接続を組織内の他のユーザーと共有する場合は、Share with othersチェックボックスをオンにします。このボックスがオフの場合、この接続はあなたにのみ表示されます。
  8. Create Authenticationを選択して接続を完了します。接続が成功すると、作成した接続が指定した名前でauthenticationリストに表示されます。
ParameterDescription
HostリモートのAdobe Analytics' SFTPインスタンスのホスト情報(例: IPアドレス)。
PortリモートFTPインスタンスの接続ポート。デフォルトは22です。
UserリモートFTPインスタンスへの接続に使用するユーザー名。
Authentication modeAdobe Analytics' SFTPサーバーでの認証方法の選択。
Secret key fileAuthentication Modeから'public / private key pair'を選択した場合に必要です。(キータイプed25519はサポートされていませんが、ecdsaキータイプはサポートされています。)
Passphrase for secret key file(オプション)必要に応じて、提供されたsecretファイルのpassphraseを入力します。
Retry limit失敗した接続を再試行する回数(デフォルト10)。
Timeout接続タイムアウト秒数(デフォルト600)。

データのTreasure Dataへの転送

Connection

リモートのAdobe Analytics' SFTPインスタンスへの接続を作成したので、次のステップはAdobe Analytics' SFTPサーバーからTreasure Dataにデータを取得することです。1回限りのアドホック転送または定期的な間隔での繰り返し転送を設定できます。このセクションでは、次の手順で説明するようにsourceの詳細を指定します。

認証された接続を作成すると、自動的にAuthenticationsに移動します。

  1. 作成した接続を検索します。
  2. New Sourceを選択します。

Connection

  1. Data TransferフィールドにSourceの名前を入力します。
  2. Nextを選択します。

Source Table

データのインポート元のdatabaseとtableの詳細を入力します。

ParametersDescriptions
Path prefixターゲットファイルのプレフィックス(string、必須)。
Incrementalincremental loadingを有効にします(boolean、オプション。デフォルト: true。incremental loadingが有効な場合、次回の実行のconfig diffにlast_pathパラメータが含まれるため、次回の実行でパス以前のファイルがスキップされます。それ以外の場合、last_pathは含まれません。

Data Settings

  1. Nextを選択します。 Data Settingsページが開きます。
  2. オプションで、data settingパラメータを編集するか、このダイアログページをスキップします。

パラメータはページに記載されています。

Data Preview

インポートを実行する前に、Generate Preview を選択してデータのプレビューを表示できます。Data preview はオプションであり、選択した場合はダイアログの次のページに安全にスキップできます。

  1. Next を選択します。Data Preview ページが開きます。
  2. データをプレビューする場合は、Generate Preview を選択します。
  3. データを確認します。

Data Placement

データの配置について、データを配置したいターゲット database と table を選択し、インポートを実行する頻度を指定します。

  1. Next を選択します。Storage の下で、インポートされたデータを配置する新しい database を作成するか、既存の database を選択し、新しい table を作成するか、既存の table を選択します。

  2. Database を選択 > Select an existing または Create New Database を選択します。

  3. オプションで、database 名を入力します。

  4. Table を選択 > Select an existing または Create New Table を選択します。

  5. オプションで、table 名を入力します。

  6. データをインポートする方法を選択します。

    • Append (デフォルト) - データインポートの結果は table に追加されます。 table が存在しない場合は作成されます。
    • Always Replace - 既存の table の全体の内容をクエリの結果出力で置き換えます。table が存在しない場合は、新しい table が作成されます。
    • Replace on New Data - 新しいデータがある場合のみ、既存の table の全体の内容をクエリの結果出力で置き換えます。
  7. Timestamp-based Partition Key 列を選択します。 デフォルトキーとは異なるパーティションキーシードを設定したい場合は、long または timestamp 列をパーティショニング時刻として指定できます。デフォルトの時刻列として、add_time フィルターで upload_time を使用します。

  8. データストレージの Timezone を選択します。

  9. Schedule の下で、このクエリを実行するタイミングと頻度を選択できます。

一度だけ実行

  1. Off を選択します。
  2. Scheduling Timezone を選択します。
  3. Create & Run Now を選択します。

定期的に繰り返す

  1. On を選択します。
  2. Schedule を選択します。UI では、@hourly@daily@monthly、またはカスタム cron の 4 つのオプションが提供されます。
  3. Delay Transfer を選択して、実行時間の遅延を追加することもできます。
  4. Scheduling Timezone を選択します。
  5. Create & Run Now を選択します。

転送が実行された後、Data Workbench > Databases で転送の結果を確認できます。

Adobe Analytics Data ConnectorのFAQ

  1. Adobe Analytics' SFTPサーバーに接続できません。どうすればよいですか?
  • 有効なプロトコルを確認してください。SFTPを使用する場合は、このAdobe Analytics' SFTP用Data Connectorを使用できます。FTP/FTPSの場合は、FTP Data Connectorで接続してみてください。

    • ファイアウォールを使用している場合は、許可されているIP範囲/ポートを確認してください。サーバー管理者は、セキュリティ上の理由からデフォルトのポート番号TCP/22を変更することがあります。
    • プライベートキーがOpenSSH形式であることを確認してください。"PuTTY"などの他の形式はサポートしていません。
    • OpenSSH 7.8以降のプライベートキーのデフォルト形式はサポートしていません。'-m PEM'オプションを使用してキーを再生成してください。
  1. データインポートの問題をトラブルシューティングするにはどうすればよいですか?

jobログを確認してください。警告とエラーは、インポートの成功に関する情報を提供します。例えば、インポートエラーに関連するsourceファイル名を特定できます。