Treasure Dataのオープンソースbulk data loader Embulkを使用してデータをインポートできます。Embulkは、さまざまなデータベース、ストレージロケーション、ファイルフォーマット、クラウドサービス間でデータを転送するのに役立ちます。詳細については、Embulkドキュメントを参照してください。
目次
- Treasure Dataの基本知識
- Embulkの基本知識
- Javaがインストールされていること(EmbulkはJavaアプリケーションです)
- JRubyがインストールおよび設定されていること(Embulk v0.10.50およびv0.11.0にはJRubyが含まれていません。詳細については、Embulk v0.11 is coming soonの「JRuby」セクションを参照してください)
| Platform | 手順 |
|---|---|
| Linux / macOS / BSD (UNIX) | 次のコマンドを実行します: |
curl --create-dirs -o ~/.embulk/bin/embulk -L "http://dl.embulk.org/embulk-latest.jar"
chmod +x ~/.embulk/bin/embulk
echo 'export PATH="$HOME/.embulk/bin:$PATH"' >> ~/.bashrc
source ~/.bashrcWindows (PowerShell)|次のコマンドを実行します:
Invoke-WebRequest http://dl.embulk.org/embulk-latest.jar -OutFile embulk.batEmbulk pluginは、さまざまなシステムやファイル形式との間でデータをロードします。Embulk pluginのリストを参照してください。
embulk-output-td plugin(Treasure Dataにレコードをインポート)をインストールします:
embulk gem install embulk-output-tdアップロードできない場合は、ネットワークがproxyを使用しているかどうかを確認してください。コマンドラインオプションでproxyを設定します:
Linux:
embulk -J-Dhttp.proxyHost=HOST -J-Dhttp.proxyPort=PORT -J-Dhttp.proxyUser=USER -J-Dhttp.proxyPassword=PASS run config.ymlWindows:
embulk.bat "-J-Dhttps.proxyHost=HOST" "-J-Dhttps.proxyPort=PORT" "-J-Dhttp.proxyUser=USER" "-J-Dhttp.proxyPassword=PASS" run config.ymlまたは、Javaを直接実行します:
java -Dhttps.proxyHost=HOST -Dhttps.proxyPort=PORT -jar embulk.bat run config.yml