Treasure Dataによって開発されたエージェントや製品機能に含まれるエージェントは、システムプロンプトと2つの基本的な技術、すなわち大規模言語モデル(LLM)を含む基盤モデル、および特定の顧客データに基づいて回答を基盤付けるRetrieval Augmented Generation (RAG)に基づいて、入力(ユーザープロンプト)に対する応答を開発します。
AIエージェントは常に、プログラムされたシステムプロンプトとユーザープロンプト、およびシステムパラメータ(使用される特定のLLMモデルや「温度」など)を満たそうとします。これらは、特定の方法や特定の境界内で応答するように制約することを目的としています。もう一つの重要なパラメータは、エージェントが出力を生成するために使用するように指示されているナレッジベース(ある場合)です。
これらのナレッジとコンテキストの「ソース」は、出力を生成するために使用されます。エージェントの設定方法によって、出力は分析、提案、またはユーザーや別のエージェントによって実行される追加のクエリやコードになる可能性があります。これらの出力は、エージェント内に設定されたシステムプロンプト、ユーザープロンプトでのエージェントとのユーザーのやり取りで提供されたコンテキスト、およびエージェントを動かすデータ接続に基づいて、個々のユーザーに合わせて調整される場合もされない場合もあります。
Treasure DataのエージェントがベースとしているLarge Language Models (LLM)は、Anthropicによって一般知識についてトレーニングされたモデルで構成されています。これらのモデルは、AnthropicのClaude.aiウェブサイトで同様に機能します。それらがどのように機能するかの詳細については、次の研究をご覧ください: https://www.anthropic.com/research/mapping-mind-language-model
Treasure Dataの目的では、このLLMに関して追加の事前トレーニングや事後トレーニング/ファインチューニングは発生していませんし、今後も発生しません。これは、Treasure Dataのデータプライバシーとガバナンスへのコミットメントの重要な部分であり、その意味するところは、複数のソースからのデータは混在せず、異なる顧客によってアクセスできないということです。再度強調すると、Treasure Dataは、いかなる種類の顧客データも使用してAIの事前または事後トレーニングを適用することはありません。安全な、そのままのLLMモデルのみを使用します。
さらに言い換えれば、Treasure Dataが使用するLLMには、モデル自体に顧客データが統合されていません。その代わりに、Treasure Dataのエージェントが顧客データにアクセスして使用できる方法は、Retrieval Augmented Generation (RAG)アーキテクチャを使用するツールセットアップと、システムプロンプトを通じた環境とその目的に関するコンテキストを介して行われます。RAGは、エージェントが提供する回答を、Treasure Data内の実際の顧客データに基づいて「基盤付ける」ことを可能にします。すべてのRAG実行はTreasure Dataの環境内で行われます。Treasure Dataエージェントは、自然言語のクエリやリクエストをコンピュータ言語のクエリに変換し、それを顧客データセットに対して実行します。これは、人間がクエリを書いて自分で実行する場合と同じです。エージェントで使用される標準のシステムプロンプトには一般的な指示があり、独自の顧客情報は含まれていません。
エージェントとやり取りする際、検証と説明可能性のために、実行されているスーパーバイザーエージェント-サブエージェント-スーパーバイザーエージェント間の通信、クエリ、思考の連鎖を確認することができます。必要に応じて、これによりクエリを自分で実行し、その場でエージェントの作業を監査することができます。
エージェントがアクセスまたは導出した情報は、Treasure Dataアカウント間で共有されず、その個々のチャットセッション外のTreasure Dataインスタンス内ではアクセスできませんが、エージェントとのすべてのやり取りは、適切なレベルのアクセス権を持つセキュリティ専門家と管理者によって監査とトレースが可能です。最後に、モデルプロバイダーにロギングやテレメトリは送信されません。
特定のセッションでTreasure Dataエージェントがなぜ決定を下したり、特定の応答を提供したりしたのかをさらに理解したい場合、ユーザーはしばしば質問を直接エージェントに尋ねることができ、エージェントは決定を下したり回答を導き出したりした理由についての説明を提供します。これは、前述のスーパーバイザーエージェント-サブエージェント-スーパーバイザーエージェント間の通信を参照することでさらに検証できます。