こんにちは。SCSKのふくちーぬです。生成AIが盛んな中、なかなか最新のアップデートについていけていない方は多いのではないでしょうか。私もその中の1人です。。
今更ながらですが、生成AI・Amazon Bedrockに入門してみようと思います。2024年にリリースされたChat with your documentを一緒にみてみましょう。
用語解説
簡単に用語から整理したいと思います。
生成AIとは
テキストや画像、音楽等新しいコンテンツを生成できる技術を指します。
ハルシネーションとは
生成AIが事実とは異なる間違った回答をしてしまうことを指します。
生成AIが事実とは異なる回答を自信ありげに提供してしまうことがあるため、私たちユーザーはその回答が真実かどうか判断することが求められています。
この現象は、生成AIが利用している基盤モデルの学習済みのデータには、該当の情報が存在しないため発生してしまいます。
RAGとは
RAGは「Retrieval-Augmented Generation」の略で、検索と生成AIを組み合わせた技術です。
質問に関連するドキュメントと質問文を生成AIに読み込ませることで、そのドキュメント情報を元に、応答するコンテンツの作成が可能になります。この手法を使うことで、より正確で信頼性の高い応答が可能となり、ハルシネーションを抑制することに繋がります。
RAGの利用用途として、カスタマーサポートが挙げられます。あらかじめFAQや製品仕様書を読み込ませておくことで、ユーザーに適切な回答を提供することが可能となり、ユーザーヘルプデスク体制の効率化を図ることができます。
AWSでのRAGの選択肢
AWSで実現する選択肢として頻繁に利用されるサービスとして、以下が挙げられます。
どれもデータベースの準備が必要のものとなり、ある程度の技術が要求されます。
- Amazon Kendraを利用する
- Amazon Bedrock Knowledge Basesを使う
2024年4月にリリースされたChat with your documentでは、データベースを作成することなく、RAG の仕組みを簡単に利用できます。
Chat with your documentを利用した検証
今回はChat with your documentの機能で、簡単にRAGの世界を体験してみます。
モデルアクセスの有効化
サポート対象である、バージニア北部リージョンにて作業を実施します。
Bedrockコンソール上で、「モデルアクセス」ペインを押下します。
Anthropic社の”Claude 3 Sonnet”が利用できるか確認します。
“リクエスト可能”であった場合は、「モデルアクセスをリクエスト」を押下します。
“アクセスが付与されました”であった場合は、本作業は必要ありませんので、次のセクションに移ってください。
“Claude 3 Sonnet”にチェックマークが付いていることを確認します。
「Next」を押下します。
内容を確認して、「Submit」を押下します。
少々時間を置いた後再度「モデルアクセス」ペインを開くと、”Claude 3 Sonnet”に”アクセスが付与されました”が表示されます。
これでClaude 3 Sonnetの基盤モデルが利用できる準備が整いました。
RAGを利用しない一般的なチャットの場合
プレイグラウンド内の「チャット」ペインを開きます。
モデルの選択画面にて、”Claude 3 Sonnet”を選択し、「適用」を押下します。
プロンプト入力画面にて、以下の文章を入力してみます。
AWS Summit Japan 2024は、いつどこで開催されましたか?
AWS Summit 2023については、ハルシネーションが発生していますね。AWS Summit 2023は、2023/4/20,4/21に開催されています。
AWS Summit 2024についても、既に開催済みなはずですが、ハルシネーションとは言わないまでも、想定していた回答が返却されません。
Claude3のモデルは、2023年8月までのデータを学習済みですが、それ以降の出来事は学習されていません。
そのため、上記のような結果になったことが分かります。
RAGを利用したチャットの場合
オーケストレーション内の「ナレッジベース」ペインを開きます。
モデルの選択画面にて、”Claude 3 Sonnet”を選択し、「適用」を押下します。
Dataの画面にて、下記のAWS Summit資料をアップロードします。
先程と同様にプロンプト入力画面にて、以下の文章を入力してみます。
AWS Summit Japan 2024は、いつどこで開催されましたか?
AWS Summit Japanは、2024 6/20,6/21に幕張メッセにて開催されましたよね。上記のように正しい回答が返却されることを確認できました。
Chat With your documentの留意点
- 対象リージョン:バージニア北部、オレゴン、ムンバイ、シドニー、アイルランド、ロンドン、パリ、カナダ、サンパウロ
- 対象基盤モデル:Claude 3 Sonnet
- ファイルの種類: PDF、MD、TXT、DOC、DOCX、HTML、CSV、XLS、XLSX。
- 10 MB 未満のファイル制限があります。 10 MB 未満のテキスト中心のファイルでも、設定された20,000個のトークン制限を超える可能性があります。
- ドキュメントやそのデータは基盤モデルには、保存されません。そのため、他のユーザーに利用してもらうためにはきちんとデータベースとして用意してあげる必要があります。
最後に
いかがだったでしょうか。
Amazon Bedrockの Chat with your documentを利用することで、RAGの難しい構成を意識することなく容易に体験することができました。
機会があれば、自分でもデータベースを作成しRAGを利用していこうと思います。
本記事が皆様のお役にたてば幸いです。
ではサウナラ~🔥