皆さん、はじめまして。SCSK 吉原です。
先日、といっても既に2か月前のAWS Summit Japan 2025や、その後の7月実施のセミナーで私が登壇し説明したInfoWeaveについて、特に多くの参加者の方々の興味をひいたのがアーキテクチャ部分ではないかと思います。
InfoWeaveにはRAG環境を簡単に構築するソリューションとAIエージェント環境を簡単に構築するソリューションがあります。先日のAWS Summit Japan 2025やセミナーでは新ソリューションのAIエージェント環境構築にフォーカスしての説明となりましたが、今回の記事ではRAG環境を簡単に構築するソリューションについてフォーカスしてアーキテクチャのご紹介をします。
7月実施のセミナーはオンデマンドセミナーとして視聴可能ですので、ご登録の上ご視聴お願いします。
InfoWeaveとは
そもそもInfoWeaveとは何でしょうか。
InfoWeave(インフォウィーブ)は一言で言うならRAGやAIエージェントが使える環境をお客様のAWSアカウント上に構築するためのサービスです。
SCSKではRAG/AIエージェント環境構築用のテンプレートを提供し、お客様がService Catalogを使用して必要なパラメータを埋めて実行するだけで、簡単にあっという間に環境構築できます。
特長や料金などの詳細については以下リンク先にございますので、ぜひご一読ください。
InfoWeave RAG環境構築 アーキテクチャ図
早速ですが、InfoWeaveのRAG環境構築ソリューションのアーキテクチャ図は以下のようになっています。
サービス提供環境(SCSK側)
上記アーキテクチャ図の右側に「サービス提供環境」とありますが、この部分がSCSKが提供するテンプレート部分になります。
具体的にはRAG環境を構築する各AWSリソースのCloudFormationのyamlファイルと、ECSで使用するコンテナイメージを提供しています。
ECR
InfoWeave RAG環境構築ソリューションは3つのコンテナから構成されており、それぞれ以下の通りの役割があります。
# | コンテナ名 | 役割 |
1 | Management server | RAG環境使用のための管理機能
|
2 | Chat UI server | ユーザがLLMへチャットするためのUI表示機能 |
3 | API server | FastAPIを使用しユーザからの問い合わせに対するLLMからの回答を返却する機能 |
これら3つのコンテナのコンテナイメージをECRで管理しています。
Service Catalog
サービス提供環境ではService Catalogのポートフォリオを準備しているので、お客様のAWSアカウントでService Catalogのポートフォリオをインポートすることで、RAG環境構築用のテンプレートが利用可能になります。
Service CatalogからRAG環境をデプロイする際に以下のパラメータが主にカスタマイズ可能になっています。※他にも契約IDやお客様のAWSアカウントIDを入力する必要があります。
# | 項目名 | 設定内容 | 設定可能な値の例 |
1 | GlobalIpForAlb | アクセス元IPアドレス許可設定 | 0.0.0.0/0 ※この場合どこからでもアクセス可能 |
2 | BedrockRegion | Bedrockのリージョン | ap-northeast-1 ※他にus-east-1/us-west-2が選択可能 |
3 | VectorDB | RAGで使用するベクターDB | Kendra ※他にPinecone/Knowledgebaseが選択可能 |
4 | PineconeEnvironment | ※PineconeをRAGのDBで使用する場合、そのリージョン | us-east-1 |
5 | Password | 管理機能アクセス用ユーザ(Admin)のパスワード | P@ssword ※強度の高いパスワード推奨 |
Service Catalogの各パラメータを入力し実行することで、自動的にパラメータに入力された値をCloudFormationのyamlファイルに適宜設定してリソースの構築を実施します。
顧客テナント環境
アーキテクチャ図の左側にある「顧客テナント環境」とあるのが、上記のService Catalogを実行し、実際にお客様のAWSアカウントに構築されるRAG環境になります。
ざっくり以下のリソースがCloudFormationのyamlを元に構築されます。
# | リソース(かっこ内はアーキテクチャでの表記) | 役割 |
1 | AWS Certificate Manger (ACM) | 通信を暗号化し安全にするための証明書を自動で管理する |
2 | Application Load Balancer (ALB) | HTTPSリクエストやURLに応じ各コンテナへの通信を振り分け実施 |
3 | Amazon Cognito (Cognito) | 管理機能とチャット用UI用のログインユーザを管理する |
4 | Amazon Elastic Container Service (ECS) | Management/Chat UI/APIの機能を提供する ※ECS Fargateを利用 |
5 | Amazon DynamoDB (DynamoDB) | RAG環境の処理で使用する各種データを格納する |
6 | Amazon Bedrock (Bedrock) | ユーザからの問い合わせに対して回答を生成する |
7 | Simple Storage Service (S3) | RAGで使用するドキュメントファイルを格納する |
8 | Knowledge base for Amazon Bedrock (Bedrock Knowledge Base) |
S3に格納されたナレッジ用ドキュメントをRAGで使用できるようにする |
9 | Amazon Kendra (Kendra) | S3に格納されたナレッジ用ドキュメントをベクトルデータに変換する |
10 | Amazon CloudWatch (CloudWatch) | ECSの各コンテナから出力されるログを保管する |
その他リソース
InfoWeave RAG環境構築ソリューションではRAGに使用するLLMとしてOpenAIを、そしてRAGに使用するVectorDBとしてPineconeを選択することが可能です。
想定ケースとしては、よりコストを抑えて環境を構築したい場合や既にOpenAIやPineconeのアカウントを持っていてそれをInfoWeaveに使用したい場合などが挙げられます。
OpenAI/Pineconeそれぞれ使用する場合には、Service CatalogからのRAG環境構築とは別に、お客様自身でOpenAI/Pineconeのアカウントを準備いただく必要がございます。
まとめと今後
今回はInfoWeave RAG環境構築ソリューションのアーキテクチャについてざっくり解説させていただきました。
次回はInfoWeave RAG環境構築ソリューションでのより技術的要素(ConverseAPIやGuardrailなど)についてご紹介したいと考えています。
また今後InfoWeave AIエージェント環境構築ソリューションについてもアーキテクチャや技術的要素のご紹介できればと思いますので気長にお待ちいただければ幸いです。