Sansan Data Hubは、社内の顧客データを整理・統合し、マーケティング目的に最適なデータに変換することを支援します。このインテグレーションを使用すると、Treasure DataからSansan Data Hubにジョブ結果をエクスポートできます。
- Treasure DataからSansan Data Hubにデータをアップロードするために、複数のアップロードリクエストを送信します。
- 各アップロードリクエストのステータスを確認します。
- Treasure Dataの基礎知識
- Sansan Data Hubの基礎知識
セキュリティポリシーで IP ホワイトリストが必要な場合は、接続を成功させるために Treasure Data の IP アドレスを許可リストに追加する必要があります。
リージョンごとに整理された静的 IP アドレスの完全なリストは、次のリンクにあります: https://api-docs.treasuredata.com/en/overview/ip-addresses-integrations-result-workers/
Treasure Dataでは、クエリを実行する前にデータコネクションを作成して設定する必要があります。データコネクションの一部として、インテグレーションにアクセスするための認証情報を提供します。
- TD Consoleを開きます。
- Integrations Hub > Catalogに移動します。
- Sansan Data Hubを検索し、Sansan Data Hub (Output)を選択します。

- Create Authenticationを選択します。

- 認証のための認証情報を入力します:

| パラメータ | 説明 |
|---|---|
| Client ID | アカウントのクライアントID |
| Client Secret | アカウントのクライアントシークレット |
- Continueを選択します。
- コネクションの名前を入力します。
- Doneを選択します。
- Data Workbench > Queriesに移動します。
- New Queryを選択します。
- クエリを実行して結果セットを検証します。

Sansan Data Hub出力コネクタは、カンマ(,)文字を含むデータをスキップします。例:
marketoid,company,createdday,updatedday
1,company1,2022-06-07 12:18:06,2022-06-07 12:18:06
2,company2,2022-06-07 12:18:06,2022-06-07 12:18:06
3,company3withcomma,,2022-06-07 12:18:06,2022-06-07 12:18:06 #この行はスキップされます
4,company4,withcomma,2022-06-07 12:18:06,2022-06-07 12:18:06 #この行はスキップされますExport Resultsを選択します。

出力用の外部サービスの既存の認証を選択できます。以下のいずれかを選択します:
既存のインテグレーションを使用する


| フィールド | 説明 |
|---|---|
| Data source ID | データをエクスポートするソースターゲット |
| Get the status of the file import job | 各バッチアップロードリクエストのステータスを取得 |
| Skip invalid records | 検証に失敗したレコードをスキップ アップロードに失敗したバッチをスキップ |
| Maximum Retry | 最大リトライ回数 |
| Seconds to wait for first retry | 最初のリトライまでの待機時間(秒) |
| Seconds for max retry wait | リトライの最大待機時間(秒) |
| HTTP Connection Timeout | HTTP接続タイムアウト |
| HTTP Read Timeout | HTTP読み取りタイムアウト |
| HTTP Write Timeout | HTTP書き込みタイムアウト |
SELECT
*
FROM
www_accessScheduled Jobs と Result Export を使用して、指定したターゲット宛先に出力結果を定期的に書き込むことができます。
Treasure Data のスケジューラー機能は、高可用性を実現するために定期的なクエリ実行をサポートしています。
2 つの仕様が競合するスケジュール仕様を提供する場合、より頻繁に実行するよう要求する仕様が優先され、もう一方のスケジュール仕様は無視されます。
例えば、cron スケジュールが '0 0 1 * 1' の場合、「月の日」の仕様と「週の曜日」が矛盾します。前者の仕様は毎月 1 日の午前 0 時 (00:00) に実行することを要求し、後者の仕様は毎週月曜日の午前 0 時 (00:00) に実行することを要求するためです。後者の仕様が優先されます。
Data Workbench > Queries に移動します
新しいクエリを作成するか、既存のクエリを選択します。
Schedule の横にある None を選択します。

ドロップダウンで、次のスケジュールオプションのいずれかを選択します:

ドロップダウン値 説明 Custom cron... Custom cron... の詳細を参照してください。 @daily (midnight) 指定されたタイムゾーンで 1 日 1 回午前 0 時 (00:00 am) に実行します。 @hourly (:00) 毎時 00 分に実行します。 None スケジュールなし。

| Cron 値 | 説明 |
|---|---|
0 * * * * | 1 時間に 1 回実行します。 |
0 0 * * * | 1 日 1 回午前 0 時に実行します。 |
0 0 1 * * | 毎月 1 日の午前 0 時に 1 回実行します。 |
| "" | スケジュールされた実行時刻のないジョブを作成します。 |
* * * * *
- - - - -
| | | | |
| | | | +----- day of week (0 - 6) (Sunday=0)
| | | +---------- month (1 - 12)
| | +--------------- day of month (1 - 31)
| +-------------------- hour (0 - 23)
+------------------------- min (0 - 59)次の名前付きエントリを使用できます:
- Day of Week: sun, mon, tue, wed, thu, fri, sat.
- Month: jan, feb, mar, apr, may, jun, jul, aug, sep, oct, nov, dec.
各フィールド間には単一のスペースが必要です。各フィールドの値は、次のもので構成できます:
| フィールド値 | 例 | 例の説明 |
|---|---|---|
| 各フィールドに対して上記で表示された制限内の単一の値。 | ||
フィールドに基づく制限がないことを示すワイルドカード '*'。 | '0 0 1 * *' | 毎月 1 日の午前 0 時 (00:00) に実行するようにスケジュールを設定します。 |
範囲 '2-5' フィールドの許可される値の範囲を示します。 | '0 0 1-10 * *' | 毎月 1 日から 10 日までの午前 0 時 (00:00) に実行するようにスケジュールを設定します。 |
カンマ区切りの値のリスト '2,3,4,5' フィールドの許可される値のリストを示します。 | 0 0 1,11,21 * *' | 毎月 1 日、11 日、21 日の午前 0 時 (00:00) に実行するようにスケジュールを設定します。 |
周期性インジケータ '*/5' フィールドの有効な値の範囲に基づいて、 スケジュールが実行を許可される頻度を表現します。 | '30 */2 1 * *' | 毎月 1 日、00:30 から 2 時間ごとに実行するようにスケジュールを設定します。 '0 0 */5 * *' は、毎月 5 日から 5 日ごとに午前 0 時 (00:00) に実行するようにスケジュールを設定します。 |
'*' ワイルドカードを除く上記の いずれかのカンマ区切りリストもサポートされています '2,*/5,8-10' | '0 0 5,*/10,25 * *' | 毎月 5 日、10 日、20 日、25 日の午前 0 時 (00:00) に実行するようにスケジュールを設定します。 |
- (オプション) Delay execution を有効にすることで、クエリの開始時刻を遅延させることができます。
クエリに名前を付けて保存して実行するか、単にクエリを実行します。クエリが正常に完了すると、クエリ結果は指定された宛先に自動的にエクスポートされます。
設定エラーにより継続的に失敗するスケジュールジョブは、複数回通知された後、システム側で無効化される場合があります。
(オプション) Delay execution を有効にすることで、クエリの開始時刻を遅延させることができます。
Audience Studio で activation を作成することで、segment データをターゲットプラットフォームに送信することもできます。
- Audience Studio に移動します。
- parent segment を選択します。
- ターゲット segment を開き、右クリックして、Create Activation を選択します。
- Details パネルで、Activation 名を入力し、前述の Configuration Parameters のセクションに従って activation を設定します。
- Output Mapping パネルで activation 出力をカスタマイズします。

- Attribute Columns
- Export All Columns を選択すると、変更を加えずにすべての列をエクスポートできます。
- + Add Columns を選択して、エクスポート用の特定の列を追加します。Output Column Name には、Source 列名と同じ名前があらかじめ入力されます。Output Column Name を更新できます。+ Add Columns を選択し続けて、activation 出力用の新しい列を追加します。
- String Builder
- + Add string を選択して、エクスポート用の文字列を作成します。次の値から選択します:
- String: 任意の値を選択します。テキストを使用してカスタム値を作成します。
- Timestamp: エクスポートの日時。
- Segment Id: segment ID 番号。
- Segment Name: segment 名。
- Audience Id: parent segment 番号。
- + Add string を選択して、エクスポート用の文字列を作成します。次の値から選択します:
- Schedule を設定します。

- スケジュールを定義する値を選択し、オプションでメール通知を含めます。
- Create を選択します。
batch journey の activation を作成する必要がある場合は、Creating a Batch Journey Activation を参照してください。
Treasure Workflow内で、このインテグレーションを使用してデータをエクスポートするように指定できます。
詳細はUsing Workflows to Export Data with the TD Toolbeltをご覧ください。
CLI(Toolbelt)を使用してSFTPへの結果エクスポートを実行することもできます。
SFTPサーバーへのエクスポート情報をtd queryコマンドの--resultオプションとして指定する必要があります。td queryコマンドについては、この記事を参照してください。
オプションの形式はJSONで、一般的な構造は次のとおりです。
{
"type": "sansan_datahub",
"client_id": "xxx",
"client_secret": "xxx",
"data_source_id": "xxxx",
"job_status": true,
"skip_on_invalid_records": true,
"max_retry": 7,
"initial_retry_wait": 15,
"max_retry_wait": 180,
"connection_timeout": 300,
"write_timeout": 300,
"read_timeout": 300
}| 名前 | 説明 | 値 | デフォルト値 | 必須 |
|---|---|---|---|---|
| type | エクスポート先サービスの名前を記述します。 | sansan_datahub | N/A | はい |
| client_id | Sansanから提供されるクライアントID | クライアントID | N/A | はい |
| client_secret | Sansanから提供されるクライアントシークレット | クライアントシークレット | N/A | はい |
| data_source_id | データをエクスポートするソースターゲット | データをエクスポートするソースターゲット | N/A | はい |
| job_status | 各バッチアップロードのステータスを確認 | true または false | false | いいえ |
| skip_on_invalid_records | 無効なレコードをスキップし、ジョブを失敗させない | true または false | false | いいえ |
| max_retry | 最大リトライ回数 | 秒単位の時間 | 7 | いいえ |
| initial_retry_wait | 初回リトライ待機時間 | 秒単位の時間 | 15 | いいえ |
| max_retry_wait | 最大リトライ待機時間 | 秒単位の時間 | 180 | いいえ |
| connection_timeout | HTTP接続タイムアウト | HTTP接続タイムアウト | 300 | いいえ |
| write_timeout | HTTP書き込みタイムアウト | HTTP書き込みタイムアウト | 300 | いいえ |
| read_timeout | HTTP読み取りタイムアウト | HTTP読み取りタイムアウト | 300 | いいえ |
$ td query --result '{"type":"sansan_datahub","client_id":"xxx","port":22,"client_secret":"xxx","data_source_id":"id","job_status":true, "skip_on_invalid_records":true}' -d sample_datasets "select * from www_access" -T presto