Amplitude Export Integrationについて詳しく見る。
Amplitudeを Treasure Data と統合することで、データを強化し、より多くのデータポイントを追加し、Amplitudeが収集するデータをマーケティングスタックの他のすべての部分と統合することができます。
Amplitudeからデータをインポートするサンプルワークフローを表示するには、Treasure Boxesをご覧ください。
この同じコネクタを使用して、Amplitude Eventsを作成およびエクスポートできます。Amplitude Export Integrationを参照してください。
AmplitudeとTreasure Dataを統合することで、次のことが簡単にできます:
- Amplitudeに新しい機能を追加する。 例えば、Treasure Dataを使用して、Amplitudeの行動データとSalesforceの顧客データを統合し、クロスデバイスの行動追跡を含む個人識別可能なレコードを作成できます。
- Amplitudeから収集したデータを使用して、マーケティングスタックの残りの部分をよりスマートにする。 例えば、Treasure DataとAmplitudeを使用して、使用状況に基づいてセグメントを作成する自動トリガーを設定し、それらをMarketoのカスタムナーチャーファネルに供給することで、チャーンを削減できます。
Treasure Dataアカウントをお持ちでない場合は、お問い合わせください。
Treasure Data Consoleを使用してAmplitudeに接続するのは迅速で簡単です。または、CLIを使用して接続を作成することもできます。
Settings -> Projectsに移動し、次のステップに必要なAPI KeyとSecret Keyを取得します。

- TD Consoleを開きます。
- Integrations Hub > Catalogに移動します。
- Catalog画面の右端にある検索アイコンをクリックし、Amplitudeと入力します。
- Amplitudeコネクタにカーソルを合わせて、Create Authenticationを選択します。
5. 必要な認証情報を入力し、Continueを選択します。

- 接続に名前を付けて、Doneをクリックします。

Region: EUと米国(デフォルト)の各地域のデータセンターをサポート
Connections -> My Connectionsで作成したAmplitude接続を選択します。

New Transferを選択します。

YYYYMMDDTHHの形式で開始時間を入力します。
オプションで、同じ形式を使用して終了時間を指定できます。終了時間が指定されていない場合、デフォルトはブラウザのタイムゾーンの現在時刻になります。
Nextを選択してデータをプレビューします。

データのプレビューが表示されます。Nextを選択します。

新しいデータベースを作成する場合は、Create new databaseをチェックし、データベースに名前を付けます。Create new tableについても同様に行います。
既存のテーブルにレコードを追加するか、既存のテーブルを置き換えるかを選択します。
デフォルトキーとは異なるパーティションキーシードを設定したい場合は、ポップアップメニューを使用してキーを指定できます。

Whenタブでは、1回限りの転送を指定するか、自動化された定期転送をスケジュールできます。Once nowを選択した場合は、Start Transferを選択します。**Repeat…**を選択した場合は、スケジュールオプションを指定してから、Schedule Transferを選択します。
転送が実行された後、Databasesタブで転送の結果を確認できます。

コマンドラインを使用してコネクターを設定する前に、Treasure Data Toolbeltをインストールする必要があります。
最新のTreasure Data Toolbeltをインストールします。
$ td --version
0.15.3まず、以下の例に示すように、認証情報を含むseed.ymlというファイルを作成します。
in:
type: amplitude
api_key: "YOUR_API_KEY"
secret_key: "YOUR_SECRET_KEY"
start_time: "20160901T03" # UTC Timezone. The format is yyyymmddThh. "T" is a static character.ターミナルで次のコマンドを実行します:
td connector:guess seed.yml -o load.ymlConnector:guessは、対象データを自動的に読み取り、データフォーマットをインテリジェントに推測します。
load.ymlファイルを開くと、推測されたファイルフォーマット定義が表示されます。これには、場合によってはファイルフォーマット、エンコーディング、カラム名、およびタイプが含まれます。
in: {type: amplitude, api_key: API_KEY, secret_key: SECRET_KEY,
start_time: 20160901T03}
out: {}
exec: {}
filters:
- type: rename
rules:
- rule: upper_to_lower
- rule: character_types
pass_types: ["a-z", "0-9"]
pass_characters: "_"
replace: "_"
- rule: first_character_types
pass_types: ["a-z"]
pass_characters: "_"
prefix: "_"
- rule: unique_number_suffix
max_length: 128
- type: add_time
to_column: {name: time}
from_value: {mode: upload_time}rename filterの詳細については、Data Connector用のrenameフィルタープラグインを参照してください(リンクが必要です)。
previewコマンドを使用して、システムがファイルをどのように解析するかをプレビューできます。
td connector:preview load.yml最後に、ロードジョブを送信します。データのサイズによっては、数時間かかる場合があります。
Amplitudeコネクタは自動的にtimeカラムを提供しますが、--time-column server_upload_timeのような任意のタイムスタンプカラムとして指定することもできます。
td connector:issue load.yml --database td_sample_db --table td_sample_tableコマンドラインから増分的で定期的なData Connectorの実行をスケジュールすることもでき、ローカルデータセンターでcronデーモンを使用する必要がなくなります。
最初のスケジュールインポートでは、Data Connector for Amplitudeはすべてのデータをインポートします。2回目以降の実行では、新しく追加されたファイルのみがインポートされます。
新しいスケジュールは、td connector:createコマンドを使用して作成できます。
スケジュールの名前、cron形式のスケジュール、データが保存されるデータベースとテーブル、およびData Connector設定ファイルが必要です。
td connector:create \
daily_import \
daily_import \
"10 0 * * *" \
td_sample_db \
td_sample_table \
load.ymlcron パラメータは、3つの特別なオプション @hourly、@daily、@monthly も受け付けます。| デフォルトでは、スケジュールは UTC タイムゾーンで設定されます。-t または --timezone オプションを使用して、タイムゾーンでスケジュールを設定できます。--timezone オプションは、'Asia/Tokyo'、'America/Los_Angeles' などの拡張タイムゾーン形式のみをサポートします。PST、CST などのタイムゾーン略語は*サポートされておらず*、予期しない結果につながる可能性があります。
td connector:list コマンドを実行することで、スケジュールエントリの一覧を表示できます。
$ td connector:listtd connector:show は、スケジュールエントリの実行設定を表示します。
td connector:show daily_importtd connector:history は、スケジュールエントリの実行履歴を表示します。個々の実行結果を調査するには、td job jobid を使用します。
td connector:history daily_importtd connector:delete は、スケジュールを削除します。
td connector:delete daily_import利用可能なモードの詳細については、次の表を参照してください。
| オプション名 | 説明 | タイプ | 必須? | デフォルト値 |
|---|---|---|---|---|
| api_key | API キー | string | yes | N/A |
| secret_key | API シークレットキー | string | yes | N/A |
| start_time | データシリーズに含まれる最初の時間、YYYYMMDDTHH 形式(例: '20150201T05')。これは UTC タイムゾーンです。 | string | yes | N/A |
| end_time | データシリーズに含まれる最後の時間、YYYYMMDDTHH 形式(例: '20150203T20')。これは UTC タイムゾーンです。 | string | no | 処理時間 |
| incremental | "mode: append" の場合は true、"mode: replace" の場合は false(下記参照)。 | bool | no | true |
seed.yml の out セクションでファイルインポートモードを指定できます。
in:
...
out:
mode: appendこのモードは、ターゲットテーブルのデータを置き換えます。このモードでは、ターゲットテーブルに対して手動で行われたスキーマ変更はそのまま保持されます。
in:
...
out:
mode: replace