InfoWeave RAG構築ソリューションのアーキテクチャについて

皆さん、はじめまして。SCSK 吉原です。

先日、といっても既に2か月前のAWS Summit Japan 2025や、その後の7月実施のセミナーで私が登壇し説明したInfoWeaveについて、特に多くの参加者の方々の興味をひいたのがアーキテクチャ部分ではないかと思います。

InfoWeaveにはRAG環境を簡単に構築するソリューションとAIエージェント環境を簡単に構築するソリューションがあります。先日のAWS Summit Japan 2025やセミナーでは新ソリューションのAIエージェント環境構築にフォーカスしての説明となりましたが、今回の記事ではRAG環境を簡単に構築するソリューションについてフォーカスしてアーキテクチャのご紹介をします。

7月実施のセミナーはオンデマンドセミナーとして視聴可能ですので、ご登録の上ご視聴お願いします。

プロンプトでブラウザ操作・データ分析まで完全自動化!マルチAIエージェント環境をAWSで「らくらく」構築する手法
https://www.scsk.jp/sp/usize/seminar/aws_ai-agent.html

 

InfoWeaveとは

そもそもInfoWeaveとは何でしょうか。

InfoWeave(インフォウィーブ)は一言で言うならRAGやAIエージェントが使える環境をお客様のAWSアカウント上に構築するためのサービスです。

SCSKではRAG/AIエージェント環境構築用のテンプレートを提供し、お客様がService Catalogを使用して必要なパラメータを埋めて実行するだけで、簡単にあっという間に環境構築できます。

特長や料金などの詳細については以下リンク先にございますので、ぜひご一読ください。

InfoWeave RAG環境構築 アーキテクチャ図

早速ですが、InfoWeaveのRAG環境構築ソリューションのアーキテクチャ図は以下のようになっています。

サービス提供環境(SCSK側)

上記アーキテクチャ図の右側に「サービス提供環境」とありますが、この部分がSCSKが提供するテンプレート部分になります。

具体的にはRAG環境を構築する各AWSリソースのCloudFormationのyamlファイルと、ECSで使用するコンテナイメージを提供しています。

ECR

InfoWeave RAG環境構築ソリューションは3つのコンテナから構成されており、それぞれ以下の通りの役割があります。

# コンテナ名 役割
1 Management server RAG環境使用のための管理機能

  • チャット画面へのログインユーザ作成・削除
  • LLMモデルの選択
  • Guardrail設定など
2 Chat UI server ユーザがLLMへチャットするためのUI表示機能
3 API server FastAPIを使用しユーザからの問い合わせに対するLLMからの回答を返却する機能

これら3つのコンテナのコンテナイメージをECRで管理しています。

Service Catalog

サービス提供環境ではService Catalogのポートフォリオを準備しているので、お客様のAWSアカウントでService Catalogのポートフォリオをインポートすることで、RAG環境構築用のテンプレートが利用可能になります。

Service CatalogからRAG環境をデプロイする際に以下のパラメータが主にカスタマイズ可能になっています。※他にも契約IDやお客様のAWSアカウントIDを入力する必要があります。

# 項目名 設定内容 設定可能な値の例
1 GlobalIpForAlb アクセス元IPアドレス許可設定 0.0.0.0/0
※この場合どこからでもアクセス可能
2 BedrockRegion Bedrockのリージョン ap-northeast-1
※他にus-east-1/us-west-2が選択可能
3 VectorDB RAGで使用するベクターDB Kendra
※他にPinecone/Knowledgebaseが選択可能
4 PineconeEnvironment ※PineconeをRAGのDBで使用する場合、そのリージョン us-east-1
5 Password 管理機能アクセス用ユーザ(Admin)のパスワード P@ssword
※強度の高いパスワード推奨

Service Catalogの各パラメータを入力し実行することで、自動的にパラメータに入力された値をCloudFormationのyamlファイルに適宜設定してリソースの構築を実施します。

顧客テナント環境

アーキテクチャ図の左側にある「顧客テナント環境」とあるのが、上記のService Catalogを実行し、実際にお客様のAWSアカウントに構築されるRAG環境になります。

ざっくり以下のリソースがCloudFormationのyamlを元に構築されます。

# リソース(かっこ内はアーキテクチャでの表記) 役割
1 AWS Certificate Manger (ACM) 通信を暗号化し安全にするための証明書を自動で管理する
2 Application Load Balancer (ALB) HTTPSリクエストやURLに応じ各コンテナへの通信を振り分け実施
3 Amazon Cognito (Cognito) 管理機能とチャット用UI用のログインユーザを管理する
4 Amazon Elastic Container Service (ECS) Management/Chat UI/APIの機能を提供する
※ECS Fargateを利用
5 Amazon DynamoDB (DynamoDB) RAG環境の処理で使用する各種データを格納する
6 Amazon Bedrock (Bedrock) ユーザからの問い合わせに対して回答を生成する
7 Simple Storage Service (S3) RAGで使用するドキュメントファイルを格納する
8 Knowledge base for Amazon Bedrock
(Bedrock Knowledge Base)
S3に格納されたナレッジ用ドキュメントをRAGで使用できるようにする
9 Amazon Kendra (Kendra) S3に格納されたナレッジ用ドキュメントをベクトルデータに変換する
10 Amazon CloudWatch (CloudWatch) ECSの各コンテナから出力されるログを保管する

その他リソース

InfoWeave RAG環境構築ソリューションではRAGに使用するLLMとしてOpenAIを、そしてRAGに使用するVectorDBとしてPineconeを選択することが可能です。

想定ケースとしては、よりコストを抑えて環境を構築したい場合や既にOpenAIやPineconeのアカウントを持っていてそれをInfoWeaveに使用したい場合などが挙げられます。

OpenAI/Pineconeそれぞれ使用する場合には、Service CatalogからのRAG環境構築とは別に、お客様自身でOpenAI/Pineconeのアカウントを準備いただく必要がございます。

まとめと今後

今回はInfoWeave RAG環境構築ソリューションのアーキテクチャについてざっくり解説させていただきました。

次回はInfoWeave RAG環境構築ソリューションでのより技術的要素(ConverseAPIやGuardrailなど)についてご紹介したいと考えています。

また今後InfoWeave AIエージェント環境構築ソリューションについてもアーキテクチャや技術的要素のご紹介できればと思いますので気長にお待ちいただければ幸いです。

著者について
吉原啓

AWSを中心にクラウドサービスを活用し、AI関連サービスの開発作業を実施しています。グローバルにも興味があり、過去の海外赴任経験を活かし、海外拠点へのクラウド勉強会も実施しています。
最近気になっているAWSサービスはAmazon Q Developerです。

吉原啓をフォローする

クラウドに強いによるエンジニアブログです。

SCSKクラウドサービス(AWS)は、企業価値の向上につながるAWS 導入を全面支援するオールインワンサービスです。AWS最上位パートナーとして、多種多様な業界のシステム構築実績を持つSCSKが、お客様のDX推進を強力にサポートします。

AI・MLAWSクラウドソリューション
シェアする
タイトルとURLをコピーしました