Skip to content
Last updated

Amplitude Import Integration

Amplitude Export Integrationについて詳しく見る

Amplitudeを Treasure Data と統合することで、データを強化し、より多くのデータポイントを追加し、Amplitudeが収集するデータをマーケティングスタックの他のすべての部分と統合することができます。

Amplitudeからデータをインポートするサンプルワークフローを表示するには、Treasure Boxesをご覧ください。

この同じコネクタを使用して、Amplitude Eventsを作成およびエクスポートできます。Amplitude Export Integrationを参照してください。

AmplitudeとTreasure Dataを統合することで、次のことが簡単にできます:

  • Amplitudeに新しい機能を追加する。 例えば、Treasure Dataを使用して、Amplitudeの行動データとSalesforceの顧客データを統合し、クロスデバイスの行動追跡を含む個人識別可能なレコードを作成できます。
  • Amplitudeから収集したデータを使用して、マーケティングスタックの残りの部分をよりスマートにする。 例えば、Treasure DataとAmplitudeを使用して、使用状況に基づいてセグメントを作成する自動トリガーを設定し、それらをMarketoのカスタムナーチャーファネルに供給することで、チャーンを削減できます。

Treasure Dataアカウントをお持ちでない場合は、お問い合わせください。

Treasure Data Consoleを使用してAmplitudeに接続する方法

Treasure Data Consoleを使用してAmplitudeに接続するのは迅速で簡単です。または、CLIを使用して接続を作成することもできます。

Amplitudeでの手順

Settings -> Projectsに移動し、次のステップに必要なAPI KeySecret Keyを取得します。

Treasure Data Consoleでの手順

  1. TD Consoleを開きます。
  2. Integrations Hub > Catalogに移動します。
  3. Catalog画面の右端にある検索アイコンをクリックし、Amplitudeと入力します。
  4. Amplitudeコネクタにカーソルを合わせて、Create Authenticationを選択します。

5. 必要な認証情報を入力し、Continueを選択します。

  1. 接続に名前を付けて、Doneをクリックします。

Region: EUと米国(デフォルト)の各地域のデータセンターをサポート

AmplitudeデータをTreasure Dataに転送する方法

Connections -> My Connectionsで作成したAmplitude接続を選択します。

New Transferを選択します。

YYYYMMDDTHHの形式で開始時間を入力します。

オプションで、同じ形式を使用して終了時間を指定できます。終了時間が指定されていない場合、デフォルトはブラウザのタイムゾーンの現在時刻になります。

Nextを選択してデータをプレビューします。

データのプレビューが表示されます。Nextを選択します。

新しいデータベースを作成する場合は、Create new databaseをチェックし、データベースに名前を付けます。Create new tableについても同様に行います。

既存のテーブルにレコードを追加するか、既存のテーブルを置き換えるかを選択します。

デフォルトキーとは異なるパーティションキーシードを設定したい場合は、ポップアップメニューを使用してキーを指定できます。

Whenタブでは、1回限りの転送を指定するか、自動化された定期転送をスケジュールできます。Once nowを選択した場合は、Start Transferを選択します。**Repeat…**を選択した場合は、スケジュールオプションを指定してから、Schedule Transferを選択します。

転送が実行された後、Databasesタブで転送の結果を確認できます。

コマンドラインを使用してAmplitudeに接続する方法

コマンドラインを使用してコネクターを設定する前に、Treasure Data Toolbeltをインストールする必要があります。

Treasure Data Toolbeltのインストール

最新のTreasure Data Toolbeltをインストールします。

$ td --version
0.15.3

シードファイルの作成

まず、以下の例に示すように、認証情報を含むseed.ymlというファイルを作成します。

in:
  type: amplitude
  api_key: "YOUR_API_KEY"
  secret_key: "YOUR_SECRET_KEY"
  start_time: "20160901T03" # UTC Timezone. The format is yyyymmddThh. "T" is a static character.

Guess Fieldsコマンドの実行

ターミナルで次のコマンドを実行します:

td connector:guess seed.yml -o load.yml

Connector:guessは、対象データを自動的に読み取り、データフォーマットをインテリジェントに推測します。

load.ymlファイルを開くと、推測されたファイルフォーマット定義が表示されます。これには、場合によってはファイルフォーマット、エンコーディング、カラム名、およびタイプが含まれます。

in: {type: amplitude, api_key: API_KEY, secret_key: SECRET_KEY,
  start_time: 20160901T03}
out: {}
exec: {}
filters:
- type: rename
  rules:
  - rule: upper_to_lower
  - rule: character_types
 pass_types: ["a-z", "0-9"]
 pass_characters: "_"
 replace: "_"
  - rule: first_character_types
 pass_types: ["a-z"]
 pass_characters: "_"
 prefix: "_"
  - rule: unique_number_suffix
 max_length: 128
- type: add_time
  to_column: {name: time}
  from_value: {mode: upload_time}

rename filterの詳細については、Data Connector用のrenameフィルタープラグインを参照してください(リンクが必要です)。

previewコマンドを使用して、システムがファイルをどのように解析するかをプレビューできます。

td connector:preview load.yml

ロードジョブの実行

最後に、ロードジョブを送信します。データのサイズによっては、数時間かかる場合があります。

Amplitudeコネクタは自動的にtimeカラムを提供しますが、--time-column server_upload_timeのような任意のタイムスタンプカラムとして指定することもできます。

td connector:issue load.yml --database td_sample_db --table td_sample_table

スケジュール実行

コマンドラインから増分的で定期的なData Connectorの実行をスケジュールすることもでき、ローカルデータセンターでcronデーモンを使用する必要がなくなります。

最初のスケジュールインポートでは、Data Connector for Amplitudeはすべてのデータをインポートします。2回目以降の実行では、新しく追加されたファイルのみがインポートされます。

スケジュールの作成

新しいスケジュールは、td connector:createコマンドを使用して作成できます。

スケジュールの名前、cron形式のスケジュール、データが保存されるデータベースとテーブル、およびData Connector設定ファイルが必要です。

td connector:create \
 daily_import \
daily_import \
"10 0 * * *" \
td_sample_db \
td_sample_table \
load.yml

cron パラメータは、3つの特別なオプション @hourly@daily@monthly も受け付けます。| デフォルトでは、スケジュールは UTC タイムゾーンで設定されます。-t または --timezone オプションを使用して、タイムゾーンでスケジュールを設定できます。--timezone オプションは、'Asia/Tokyo'、'America/Los_Angeles' などの拡張タイムゾーン形式のみをサポートします。PST、CST などのタイムゾーン略語は*サポートされておらず*、予期しない結果につながる可能性があります。

スケジュールの一覧表示

td connector:list コマンドを実行することで、スケジュールエントリの一覧を表示できます。

$ td connector:list

設定とスケジュール履歴の表示

td connector:show は、スケジュールエントリの実行設定を表示します。

td connector:show daily_import

td connector:history は、スケジュールエントリの実行履歴を表示します。個々の実行結果を調査するには、td job jobid を使用します。

td connector:history daily_import

スケジュールの削除

td connector:delete は、スケジュールを削除します。

td connector:delete daily_import

設定

利用可能なモードの詳細については、次の表を参照してください。

オプション名説明タイプ必須?デフォルト値
api_keyAPI キーstringyesN/A
secret_keyAPI シークレットキーstringyesN/A
start_timeデータシリーズに含まれる最初の時間、YYYYMMDDTHH 形式(例: '20150201T05')。これは UTC タイムゾーンです。stringyesN/A
end_timeデータシリーズに含まれる最後の時間、YYYYMMDDTHH 形式(例: '20150203T20')。これは UTC タイムゾーンです。stringno処理時間
incremental"mode: append" の場合は true、"mode: replace" の場合は false(下記参照)。boolnotrue

付録

Out Plugin のモード

seed.yml の out セクションでファイルインポートモードを指定できます。

append(デフォルト)

in:
  ...
out:
  mode: append

replace (td 0.11.10以降)

このモードは、ターゲットテーブルのデータを置き換えます。このモードでは、ターゲットテーブルに対して手動で行われたスキーマ変更はそのまま保持されます。

in:
  ...
out:
  mode: replace