こんにちは、SCSK 木澤です。
SCSKでは、生成AIがより高精度の回答を出力できるRAG環境を、お客様AWSアカウントに構築できるテンプレートを提供する S-Cred+ InfoWeaveオプションを5月より提供開始しました。
本記事では AWS Summit Japan 2024の当社ブース内で講演した内容をベースに、本サービスの特徴等などについて解説します。
AWS Summit Japan 2024ミニシアター資料
ミニシアターにて講演した内容はこちらです。
私は 6/20に1回と、(急遽)6/21の午前中に2回、合計3回発表いたしました。聴講頂いた皆様、ありがとうございました。
InfoWeaveの概要
InfoWeaveは当社のAWS複合基盤サービス、S-Cred+のオプションとして提供されています。
S-Cred+についてはこちらをご覧下さい
S-Cred+では、単なる運用基盤(MSP)に留まらず、環境構築テンプレートや、SCSK自社開発のローコード開発ツール等を組み合わせることによって、AWS上でのシステム/サービス開発をより迅速に行えるよう構成されています。
今回提供を開始したInfoWeaveは、この「システム環境構築テンプレート」の一種として提供を始めたものとなります。
生成AIがより高精度の回答を出力できるRAG環境を構築できるテンプレートを提供しますので、お客様は速やかに(※)独自ナレッジを含んだチャットボットを利用できるようになります。
利用料金は以下の通りです。
- 初期料金:600,000円(AWSアカウント単位)
- 環境構築代行:60,000/回(当社側でテンプレート展開を代行する場合のみ)
※申込(契約)後、利用開始まで3営業日。テンプレートのデプロイは概ね1時間程度
RAGについて
さて、ご存じの方も多いと思いますが、RAGについて簡単におさらいしたいと思います。
生成AIのチャットボットを利用したことがある方も多いと思いますが、思ったよりも回答精度が良くないと感じることがあるでしょう。
大規模言語モデル(LLM)は、過去のある時点の情報を基に学習しているため、最新の情報は回答できません。
また、より専門的な情報や組織内の情報を基にした回答をして欲しい場合もあるでしょう。
そうした場合に回答精度を高める手段の一つして利用できるのが、RAG(Retrieval-Augmented Generation)となります。
LLMへのインプットとして関連情報を付加することで、より高精度な回答を得ることができるようになります。
InfoWeaveの特徴
さて環境構築テンプレートを利用し速やかにRAG環境を立ちあげることができるInfoWeaveですが、特徴として以下が挙げられます。
- 既存ドキュメントの活用
環境構築後、学習用ドキュメント格納用のS3バケットが1つ用意されます。
お客様はここにドキュメントを放り込むだけ独自ナレッジを利用したチャットボットを立ちあげることができます。
(テキストやMS-Office系、PDFなど一般的なドキュメント形式に対応。画像等マルチモーダルは現時点で非対応) - 速やかにRAG環境を立ちあげることができる
利用開始(契約)後、3営業日にて環境構築テンプレートが提供されます。
テンプレートをデプロイすることで概ね1時間程度でチャットボットのUIも含めて提供されますので、
① テンプレートをデプロイ
② ユーザーを追加
③ 既存ドキュメントを放り込む
この一連の流れだけですぐにRAG環境を利用することができます。
またチャットボットだけでなくAPI機能も提供されるので、既存システムとの連携も容易に行うことができます。 - 無制限に環境作成が可能
環境構築テンプレートはAWSアカウント単位で提供されます。
よって当該AWSアカウント内では追加料金なくRAG環境を立て放題となります(AWSリソース料金は発生します)
これにより、業務ごと・部署毎に独自の専門的なRAG環境を立ちあげることができます。 - 要件に応じて選択可能
大規模言語モデル(LLM)は、Amazon Bedrock上のAnthropic Claude(各種)および、OpenAI GPT-4から選択可能です。
RAG用のベクトルデータベースについては、Amazon Kendraあるいは外部サービスのPineconeを選択可能です。
セキュリティ重視でAWS内に閉じたい場合やコスト重視の場合など、要件に応じて構成を選択できる特徴があります。 - 利用者の権限に応じて回答が変化
これがRAGを選択する最大の特徴かもしれません。
RAGでは関連情報を付加してLLMに問い合わせるといった仕組みであることから、利用者の権限によって回答内容を変えることができます。これによって以下のような仕組みが可能になります。- 社内からの問い合わせ:社外秘の資料を用いて詳細な回答を行う
- 社外からの問い合わせ:社内ナレッジを利用しない回答を行う
AWSでは同様に簡単にRAG環境を構築できる Knowledge bases for Amazon Bedrockが提供されていますが、違いは以下となります。
① 標準でWeb ChatbotのWeb UIが提供されすぐに利用できる
② 選択できるLLMや検索用DBの幅が広い
③ 権限による回答の制御ができる
InfoWeaveのユースケース
先述の特徴を持つInfoWeaveですが、以下のようなユースケースに活用可能です。
- ヘルプデスクの業務効率化
- 専門分野・業務向けのチャットボット
- 社内ロール(権限)に応じた回答
アーキテクチャ
少しだけで恐縮ですが、アーキテクチャの話に触れたいと思います。
InfoWeaveの構築テンプレートは当社側のサービス提供環境よりAWS Service Catalogを通じて提供されます。
デプロイされるサービスは主なものとして以下があります。
- Amazon S3(ドキュメント格納用)
- Amazon ECS , AWS Fargate(APIサーバー、Chatbot UI コンテナ、管理機能 各コンテナ)
- Amazon Bedrock(※LLM)
- Amazon Kendra(※RAG用データベース)
- DynamoDB(データストア)
- Application Load Balancer
※利用を選択した場合
コンテナイメージも弊社側管理のECRリポジトリから提供され、適宜更新される予定です。
注意点
本サービスはSCSKの複合基盤サービス、S-Cred+のオプションとして提供されており、S-Cred+の契約が必須となります。
AWS Service Catalogによるテンプレートやコンテナイメージの展開にあたり、AWSアカウントを弊社の管理基盤の管理下にする必要があり、このような仕様としております。
このような制約は有るものの、InfoWeaveは独特の特徴があるサービスとなりますので
最後に:AWS Summit Japan 2024を終えて
AWS Summit Japan 2024が終わりましたね。
私は当社出展のリードとしてここ数ヶ月注力してきました。
細かい反省点は多いのですが、今はとにかく大きなトラブル無く終了できてホッとしています。
当社の出展内容は、川原さんのレポートをご覧下さい。
私は2日間、概ねブース周辺におりました。たくさんの方に来訪いただき本当に感謝しております。
また夜はHUB周辺に出没し、いろいろな方との交流を深めることができました。
こちらでお会いした方々にも感謝したいと思います。
なお、お陰様で今年の表彰も継続して頂戴することができました。
- AWS Ambassadors
- Japan AWS Top Engineers
- Japan AWS All Certfications Engineers
今回のイベントを成功させるにあたっては、社内外の皆様の協力無くしてなし得ませんでした。
この点においても感謝ですし、一個人としてはこの経験を糧に、今後も邁進して行ければと思います。
全ての皆様に御礼まで。ありがとうございました。