Skip to content
Last updated

Bulk Data Importのインストール

Treasure Dataのオープンソースbulk data loader Embulkを使用してデータをインポートできます。Embulkは、さまざまなデータベース、ストレージロケーション、ファイルフォーマット、クラウドサービス間でデータを転送するのに役立ちます。詳細については、Embulkドキュメントを参照してください。

目次

前提条件

  • Treasure Dataの基本知識
  • Embulkの基本知識
  • Javaがインストールされていること(EmbulkはJavaアプリケーションです)
  • JRubyがインストールおよび設定されていること(Embulk v0.10.50およびv0.11.0にはJRubyが含まれていません。詳細については、Embulk v0.11 is coming soonの「JRuby」セクションを参照してください)

コマンドラインからのEmbulkのインストール

Platform手順
Linux / macOS / BSD (UNIX)次のコマンドを実行します:
curl --create-dirs -o ~/.embulk/bin/embulk -L "http://dl.embulk.org/embulk-latest.jar"
chmod +x ~/.embulk/bin/embulk
echo 'export PATH="$HOME/.embulk/bin:$PATH"' >> ~/.bashrc
source ~/.bashrc

Windows (PowerShell)|次のコマンドを実行します:

Invoke-WebRequest http://dl.embulk.org/embulk-latest.jar -OutFile embulk.bat

Embulk Treasure Data Pluginのインストール

Embulk pluginは、さまざまなシステムやファイル形式との間でデータをロードします。Embulk pluginのリストを参照してください。

embulk-output-td plugin(Treasure Dataにレコードをインポート)をインストールします:

embulk gem install embulk-output-td

Proxy Serverの使用

アップロードできない場合は、ネットワークがproxyを使用しているかどうかを確認してください。コマンドラインオプションでproxyを設定します:

Linux:

embulk -J-Dhttp.proxyHost=HOST -J-Dhttp.proxyPort=PORT -J-Dhttp.proxyUser=USER -J-Dhttp.proxyPassword=PASS run config.yml

Windows:

embulk.bat "-J-Dhttps.proxyHost=HOST" "-J-Dhttps.proxyPort=PORT" "-J-Dhttp.proxyUser=USER" "-J-Dhttp.proxyPassword=PASS" run config.yml

または、Javaを直接実行します:

java -Dhttps.proxyHost=HOST -Dhttps.proxyPort=PORT -jar embulk.bat run config.yml