Sansan Data Hub エクスポートインテグレーション
Copy for LLM
Copy page as Markdown for LLMs
View as Markdown
Open this page as Markdown
Open in ChatGPT
Get insights from ChatGPT
Open in Claude
Get insights from Claude
Cursorに接続
CursorにMCPサーバーをインストール
VS Codeに接続
VS CodeにMCPサーバーをインストール

Sansan Data Hubは、社内の顧客データを整理・統合し、マーケティング目的に最適なデータに変換することを支援します。このインテグレーションを使用すると、Treasure DataからSansan Data Hubにジョブ結果をエクスポートできます。

このインテグレーションでできること

Treasure DataからSansan Data Hubにデータをアップロードするために、複数のアップロードリクエストを送信します。
各アップロードリクエストのステータスを確認します。

前提条件

Treasure Dataの基礎知識
Sansan Data Hubの基礎知識

Treasure Data Integration の静的 IP アドレス

セキュリティポリシーで IP ホワイトリストが必要な場合は、接続を成功させるために Treasure Data の IP アドレスを許可リストに追加する必要があります。

リージョンごとに整理された静的 IP アドレスの完全なリストは、次のリンクにあります: https://api-docs.treasuredata.com/en/overview/ip-addresses-integrations-result-workers/

TD Consoleを使用してコネクションを作成する

Treasure Dataでは、クエリを実行する前にデータコネクションを作成して設定する必要があります。データコネクションの一部として、インテグレーションにアクセスするための認証情報を提供します。

新しい認証を作成する

TD Consoleを開きます。
Integrations Hub > Catalogに移動します。
Sansan Data Hubを検索し、Sansan Data Hub (Output)を選択します。
Create Authenticationを選択します。
認証のための認証情報を入力します:

パラメータ	説明
Client ID	アカウントのクライアントID
Client Secret	アカウントのクライアントシークレット

Continueを選択します。
コネクションの名前を入力します。
Doneを選択します。

クエリを定義する

Data Workbench > Queriesに移動します。
New Queryを選択します。
クエリを実行して結果セットを検証します。

Sansan Data Hub出力コネクタは、カンマ(,)文字を含むデータをスキップします。例:

marketoid,company,createdday,updatedday
1,company1,2022-06-07 12:18:06,2022-06-07 12:18:06
2,company2,2022-06-07 12:18:06,2022-06-07 12:18:06
3,company3withcomma,,2022-06-07 12:18:06,2022-06-07 12:18:06 #この行はスキップされます
4,company4,withcomma,2022-06-07 12:18:06,2022-06-07 12:18:06 #この行はスキップされます

結果のエクスポート先を指定する

Export Resultsを選択します。
出力用の外部サービスの既存の認証を選択できます。以下のいずれかを選択します:

既存のインテグレーションを使用する

フィールド	説明
Data source ID	データをエクスポートするソースターゲット
Get the status of the file import job	各バッチアップロードリクエストのステータスを取得
Skip invalid records	検証に失敗したレコードをスキップアップロードに失敗したバッチをスキップ
Maximum Retry	最大リトライ回数
Seconds to wait for first retry	最初のリトライまでの待機時間（秒）
Seconds for max retry wait	リトライの最大待機時間（秒）
HTTP Connection Timeout	HTTP接続タイムアウト
HTTP Read Timeout	HTTP読み取りタイムアウト
HTTP Write Timeout	HTTP書き込みタイムアウト

クエリの例

SELECT
 *
FROM
 www_access

(オプション) Query Export ジョブをスケジュールする

Scheduled Jobs と Result Export を使用して、指定したターゲット宛先に出力結果を定期的に書き込むことができます。

Treasure Data のスケジューラー機能は、高可用性を実現するために定期的なクエリ実行をサポートしています。

2 つの仕様が競合するスケジュール仕様を提供する場合、より頻繁に実行するよう要求する仕様が優先され、もう一方のスケジュール仕様は無視されます。

例えば、cron スケジュールが '0 0 1 * 1' の場合、「月の日」の仕様と「週の曜日」が矛盾します。前者の仕様は毎月 1 日の午前 0 時 (00:00) に実行することを要求し、後者の仕様は毎週月曜日の午前 0 時 (00:00) に実行することを要求するためです。後者の仕様が優先されます。

TD Console を使用してジョブをスケジュールする

Data Workbench > Queries に移動します
新しいクエリを作成するか、既存のクエリを選択します。
Schedule の横にある None を選択します。

ドロップダウンで、次のスケジュールオプションのいずれかを選択します:

ドロップダウン値	説明
Custom cron...	Custom cron... の詳細を参照してください。
@daily (midnight)	指定されたタイムゾーンで 1 日 1 回午前 0 時 (00:00 am) に実行します。
@hourly (:00)	毎時 00 分に実行します。
None	スケジュールなし。

Custom cron... の詳細

Cron 値	説明
`0 * * * *`	1 時間に 1 回実行します。
`0 0 * * *`	1 日 1 回午前 0 時に実行します。
`0 0 1 * *`	毎月 1 日の午前 0 時に 1 回実行します。
""	スケジュールされた実行時刻のないジョブを作成します。

 *    *    *    *    *
 -    -    -    -    -
 |    |    |    |    |
 |    |    |    |    +----- day of week (0 - 6) (Sunday=0)
 |    |    |    +---------- month (1 - 12)
 |    |    +--------------- day of month (1 - 31)
 |    +-------------------- hour (0 - 23)
 +------------------------- min (0 - 59)

次の名前付きエントリを使用できます:

Day of Week: sun, mon, tue, wed, thu, fri, sat.
Month: jan, feb, mar, apr, may, jun, jul, aug, sep, oct, nov, dec.

各フィールド間には単一のスペースが必要です。各フィールドの値は、次のもので構成できます:

フィールド値	例	例の説明
各フィールドに対して上記で表示された制限内の単一の値。
フィールドに基づく制限がないことを示すワイルドカード `'*'`。	`'0 0 1 * *'`	毎月 1 日の午前 0 時 (00:00) に実行するようにスケジュールを設定します。
範囲 `'2-5'` フィールドの許可される値の範囲を示します。	`'0 0 1-10 * *'`	毎月 1 日から 10 日までの午前 0 時 (00:00) に実行するようにスケジュールを設定します。
カンマ区切りの値のリスト `'2,3,4,5'` フィールドの許可される値のリストを示します。	`0 0 1,11,21 * *'`	毎月 1 日、11 日、21 日の午前 0 時 (00:00) に実行するようにスケジュールを設定します。
周期性インジケータ `'*/5'` フィールドの有効な値の範囲に基づいて、スケジュールが実行を許可される頻度を表現します。	`'30 /2 1 *'`	毎月 1 日、00:30 から 2 時間ごとに実行するようにスケジュールを設定します。 `'0 0 /5 *'` は、毎月 5 日から 5 日ごとに午前 0 時 (00:00) に実行するようにスケジュールを設定します。
`''` ワイルドカードを除く上記のいずれかのカンマ区切りリストもサポートされています `'2,/5,8-10'`	`'0 0 5,/10,25 *'`	毎月 5 日、10 日、20 日、25 日の午前 0 時 (00:00) に実行するようにスケジュールを設定します。

(オプション) Delay execution を有効にすることで、クエリの開始時刻を遅延させることができます。

クエリを実行する

クエリに名前を付けて保存して実行するか、単にクエリを実行します。クエリが正常に完了すると、クエリ結果は指定された宛先に自動的にエクスポートされます。

設定エラーにより継続的に失敗するスケジュールジョブは、複数回通知された後、システム側で無効化される場合があります。

(オプション) Delay execution を有効にすることで、クエリの開始時刻を遅延させることができます。

Audience Studio で Segment をアクティベートする

Audience Studio で activation を作成することで、segment データをターゲットプラットフォームに送信することもできます。

Audience Studio に移動します。
parent segment を選択します。
ターゲット segment を開き、右クリックして、Create Activation を選択します。
Details パネルで、Activation 名を入力し、前述の Configuration Parameters のセクションに従って activation を設定します。
Output Mapping パネルで activation 出力をカスタマイズします。

Attribute Columns
- Export All Columns を選択すると、変更を加えずにすべての列をエクスポートできます。
- + Add Columns を選択して、エクスポート用の特定の列を追加します。Output Column Name には、Source 列名と同じ名前があらかじめ入力されます。Output Column Name を更新できます。+ Add Columns を選択し続けて、activation 出力用の新しい列を追加します。
String Builder
- + Add string を選択して、エクスポート用の文字列を作成します。次の値から選択します:
  - String: 任意の値を選択します。テキストを使用してカスタム値を作成します。
  - Timestamp: エクスポートの日時。
  - Segment Id: segment ID 番号。
  - Segment Name: segment 名。
  - Audience Id: parent segment 番号。

Schedule を設定します。

スケジュールを定義する値を選択し、オプションでメール通知を含めます。

Create を選択します。

batch journey の activation を作成する必要がある場合は、Creating a Batch Journey Activation を参照してください。

(オプション) Workflowでエクスポート結果を設定する

Treasure Workflow内で、このインテグレーションを使用してデータをエクスポートするように指定できます。

詳細はUsing Workflows to Export Data with the TD Toolbeltをご覧ください。

(オプション) CLIを使用したエクスポートインテグレーション

CLI(Toolbelt)を使用してSFTPへの結果エクスポートを実行することもできます。

SFTPサーバーへのエクスポート情報をtd queryコマンドの--resultオプションとして指定する必要があります。td queryコマンドについては、この記事を参照してください。

オプションの形式はJSONで、一般的な構造は次のとおりです。

{
  "type": "sansan_datahub",
  "client_id": "xxx",
  "client_secret": "xxx",
  "data_source_id": "xxxx",
  "job_status": true,
  "skip_on_invalid_records": true,
  "max_retry": 7,
  "initial_retry_wait": 15,
  "max_retry_wait": 180,
  "connection_timeout": 300,
  "write_timeout": 300,
  "read_timeout": 300
}

パラメータ

名前	説明	値	デフォルト値	必須
type	エクスポート先サービスの名前を記述します。	sansan_datahub	N/A	はい
client_id	Sansanから提供されるクライアントID	クライアントID	N/A	はい
client_secret	Sansanから提供されるクライアントシークレット	クライアントシークレット	N/A	はい
data_source_id	データをエクスポートするソースターゲット	データをエクスポートするソースターゲット	N/A	はい
job_status	各バッチアップロードのステータスを確認	true または false	false	いいえ
skip_on_invalid_records	無効なレコードをスキップし、ジョブを失敗させない	true または false	false	いいえ
max_retry	最大リトライ回数	秒単位の時間	7	いいえ
initial_retry_wait	初回リトライ待機時間	秒単位の時間	15	いいえ
max_retry_wait	最大リトライ待機時間	秒単位の時間	180	いいえ
connection_timeout	HTTP接続タイムアウト	HTTP接続タイムアウト	300	いいえ
write_timeout	HTTP書き込みタイムアウト	HTTP書き込みタイムアウト	300	いいえ
read_timeout	HTTP読み取りタイムアウト	HTTP読み取りタイムアウト	300	いいえ

使用例

$ td query --result '{"type":"sansan_datahub","client_id":"xxx","port":22,"client_secret":"xxx","data_source_id":"id","job_status":true, "skip_on_invalid_records":true}' -d sample_datasets "select * from www_access" -T presto