Treasure Data にデータをインポートした後、結果に予期しないデータや不正確なデータが表示される場合があります。これはインポート設定を変更することで修正できる場合もありますが、データをクリーンアップまたは正規化するために追加の処理を実行する必要がある場合もあります。一般的なクリーンアップアクティビティには次のようなものがあります:
- 重複排除 -- Treasure Data のデータベースインスタンスで重複する列または行を削除します。
- データ正規化
- Treasure Data で類似のデータタイプがどのように表現されるかを標準化します。たとえば、電話番号は 555-567-8911 または 5555678911 または 00 1 555 567 8911 としてさまざまにインポートされる可能性があります。したがって、特にキーまたは ID 統合として使用する予定がある場合は、すべてのデータベースで電話番号の表現を標準化する必要があります。