Skip to content
Last updated

Box Export Integration

Box Import Integrationについて詳しくはこちらをご覧ください。

Treasure Dataのジョブ結果をBoxアカウントに直接エクスポートします。

以下のトピックに進んでください:

前提条件

  • Treasure Dataの基本知識
  • Boxクラウドストレージアカウント

TD Consoleを使用して接続を作成する

Treasure Data Consoleを使用して接続を設定できます。

Boxアカウントとの接続を設定する

  1. TD Consoleを開きます。
  2. Integrations Hub > Catalogに移動します。
  3. Catalogページの右端にある検索アイコンをクリックし、Boxと入力します。
  4. Boxコネクタにカーソルを合わせてCreate Authenticationを選択します。
  5. OAuthトークンを入力するか、Click hereを選択してBoxとの接続を認証します。

まだログインしていない場合はBoxにログインするためにリダイレクトされ、ログイン済みの場合はTreasure DataにBoxアカウントへのアクセスを許可する同意ページにリダイレクトされます。

ドメインhttps://console.treasuredata.comの場合、次のように表示されます:

https://console.treasuredata.co.jpの場合

Grant access to Boxを選択すると、Treasure Dataの接続画面にリダイレクトされます。

再度Boxコネクタを選択し、OAuth接続フィールドに移動します。ドロップダウンリストにアカウント名が表示されたOAuth接続が表示されます。

使用するアカウントを選択し、接続の作成に進みます。

Continueを選択して詳細ビューに進みます。

接続の名前を入力し、Doneを選択して完了します。

OAuth(唯一の認証方式)は、treasuredata.comとそのサブドメインでのみサポートされています。

データ接続への出力結果を設定する

この手順では、クエリを作成または再利用します。クエリ内で、データ接続を設定します。

Treasure Data Consoleのクエリエディタページに移動します。

データのエクスポートに使用する予定のクエリにアクセスします。

必要に応じてクエリをコンパイルします。

クエリをコンパイルします(必要な場合)。

結果エクスポート先の指定

Export Results を選択します。

検索ボックスに接続名を入力してフィルタリングし、Boxの接続を選択します。

すべての情報を編集します。

パラメータを指定します:

  • Export To(必須)利用可能なオプション:

    • Existing File. 選択した場合、File IDを指定する必要があります。
    • New File. 選択した場合、File NameとFolder IDを指定する必要があります。
  • File Name 拡張子を除いたエクスポートされるファイル名。例: Result_1810212

  • Folder ID エクスポートされたファイルを保存するBoxのフォルダ。

  • File ID 既存のBox File ID。

  • Format 結果ファイルのフォーマットを指定: CSVまたはTSV

  • Encoders 結果を圧縮するかどうかを指定します。利用可能なオプション: None、gz、bzip2、暗号化PGP

  • Public Key ファイルをアップロードする前に暗号化するために使用される公開鍵

  • Key Identifier ファイルを保護するために使用される暗号化サブキーのKey IDを指定します。マスターキーは暗号化プロセスから除外されます。

  • Amor ASCII armorを使用するかどうか

  • Compression Type

    • ファイルの圧縮に使用される圧縮アルゴリズムを定義します。ファイルは暗号化される前に圧縮され、Boxサーバーにアップロードされます。
    • 注意: ファイルを暗号化してアップロードする前に圧縮してください。復号化すると、ファイルは.gzや.bz2などの圧縮形式に戻ります。
  • Header line 選択した場合、エクスポートされたデータにはヘッダー行としてカラム名が含まれます。

  • Null String NULL値を表すために使用される値。利用可能なオプション:

    • Default. 選択した場合、CSVファイルフォーマットではNULL値を表すために空の文字列 '' が使用され、TSVフォーマットでは\Nが使用されます。
    • Empty string
    • \N NULL
    • null
  • End-of-line character 行末の文字。利用可能なオプション: CRLF、LF、CR

  • Quote Policy 利用可能なオプション:

    • ALL. 選択した場合、すべての値がダブルクォート("")で囲まれます。
    • MINIMAL. 選択した場合、埋め込まれたクォート(")を含む値は、連続する2つのクォート("")で表されます。MINIMALクォートポリシーはCSVに適用されます
    • NONE. 選択した場合、埋め込まれたクォートに対するエスケープは適用されません。デフォルトでは、NONEはTSVファイルフォーマットに適用されます
  • Max Retries Boxサーバーエラーまたはネットワークエラーによりエラーが発生した場合、アップロードを中止する前に試行される再試行回数。

  • Retry Timeout 再試行の上限時間(秒単位)。

クエリの実行

クエリに名前を付けて保存して実行するか、単にクエリを実行します。

クエリが正常に実行されると、クエリ結果は自動的に指定されたContainerの宛先にインポートされます。

よくある質問

最終結果に(バックスラッシュ)文字が含まれているのはなぜですか?

CSVファイル内のデータ(値)にクォート(")が含まれている場合、またはTSVファイル内にタブが含まれている場合で、Quote PolicyがNONEに設定されている場合、文字が誤ってデータをエスケープし、問題が発生する可能性があります。これを解決するには、Quote PolicyをMINIMALまたはALLに設定してみてください。