【GCP】【AIML】 Vertex AI PaLM APIが日本語対応されたので触ってみた。

こんにちは。SCSKの島村です。

Google Cloudの最新生成系AIについて前回のブログでいくつかご紹介させていただきました。
まだ読まれていない方は、下記リンクよりご一読いただけますと幸いです。

本記事では、Google Cloudの生成系AIについての第3弾といたしまして、
Vertex AIでPaLM 2モデルを使用するための、「Vertex AI PaLM APIが日本語対応」いたしましたので、さっそく触ってみました。

Vertex AI PaLM APIを使用すると、独自のアプリケーション用にモデルのインスタンスをテスト、カスタマイズ、展開し、独自の特定のユースケースを使用してチューニングすることができます。

*本執筆は、2023年8月22時点で公開されている情報をもとに作成しております。
 最新情報については、Google Cloud公式ドキュメント
 「Google Cloud ブログ| ニュース、機能、およびお知らせ | Google Cloud 公式ブログ」をご確認ください。

Google Vertex AI PaLM APIとは

Google PaLM(Pathways Language Model)
Bardチャットボットを含む一連のGoogle AI製品に組み込まれているLLM
PaLM2はPaLMにおける推論、言語、コーディング能力を拡張した大規模な一般LLM
Google AI PaLM 2 – Google AI
PaLM 2 - Google’s next generation large language model.
医療診断AIツールであるMed-PaLM 2や、ITセキュリティ脅威検出AIツールであるSec-PaLMなど25を超えるGoogleの製品と機能に搭載

PaLM 2のモデルは、高度な推論タスク、分類、質問応答、翻訳、自然言語生成に優れています。
サイズが大きいため、言語内の複雑なパターンと関係を学習し、さまざまな用途向けに高品質のテキストを生成することができます。

 

Google PaLM APIに日本語で質問してみた。

さっそく、日本語対応されたPaLM APIを使ってみました。
今回は、PaLM APIを簡単に試せるGoogleCloudの生成系サービスの一つである「Generative AI Studio」を利用します。

Generative AI Studio とは?

生成AIのプロトタイプをノーコード/ローコードで迅速に作成でき、カスタマイズ可能なGoolge CloudのAIサービス
https://cloud.google.com/generative-ai-studio?hl=ja

過去の記事でも紹介しております。合わせてご一読いただければ幸いです。
【GCP】【AIML】Google Cloudの最新生成AIについて整理してみました。 – TechHarmony (usize-tech.com)

 

Generative AI Studio 利用手順

①Google Cloudコンソールより[Vertex AI]タブから[GENERATIVE AI STUDIO]を選択する。

②[+テキスト プロンプト]よりプロンプトを新規作成します。

⓷プロンプトに質問文を日本語で入力後、[送信]ボタンを押下で回答を生成できます。

Generative AI Studio モデルパラメータにおけるチューニング

ここでは、「Generative AI Studio」にてチューニング可能なモデルパラメータについて簡単にご紹介します。(添付画像参照)
これらのパラメータは応答の品質を向上させるためのものであり、特定のタスクにおける出力のランダム性ををチューニングできます。
ランダム性を調整することで、最も確立の高い回答だけでなく、クリエイティブな応答としての出力も可能です。

 

温度(Temperature)
https://cloud.google.com/vertex-ai/docs/generative-ai/learn/introduction-prompt-design#temperature

ランダム性の度合いを調整するためのパラメータ。
温度を低く設定すると回答のばらつきが少なく、より予測精度の高い結果が出力可能です。

 

トークンの制限(Token limit)

トークンの上限により、1 つのプロンプトから出力されるテキストの最大量が決まります。
トークンは約 4 文字です。デフォルト値は 256 です。

 

トップK(Top K)

各トークン選択ステップでは、最も確率の高い上位K個のトークンがサンプリングされる。
ランダムな応答を少なくしたい場合は低い値を、ランダムな応答が多くした場合は高い値を指定します。

 

トップP(Top P)
https://cloud.google.com/vertex-ai/docs/generative-ai/learn/introduction-prompt-design#top-p 

トークンは、確率の合計が top-P 値に等しくなるまで確率の高いもの(top-K を参照)から低いものへと選択される。
たとえば、トークン A、B、C の確率が 0.3、0.2、0.1 で、top-P の値が 0.5 の場合、モデルは次のトークンとして A か B のいずれかを温度を使って選択し、C は候補から除外します。
ランダムな応答を少なくしたい場合は低い値を、ランダムな応答が多くしたい場合は高い値を指定します。

 

最後に

今回はGoogle Cloudの「生成系AI」について更に深堀してご紹介させていただきました。
また、今回利用した「Generative AI Studio」についてもっと知りたい方は、
Google Cloudの提供するトレーニングサービス「Google Cloud Skills Boost」から本サービスについて学習することが可能です。

「Google Cloud Skills Boost」については、別記事にてご紹介しておりますので気になった方はご一読下さい。

今後とも、AIMLに関する情報やGoogle CloudのAIMLサービスのアップデート情報を掲載していきたいと思います。

最後まで読んでいただき、ありがとうございました!!!

著者について

SCSK株式会社のクラウド専門部隊に所属
Google Cloudの
・AI MLサービス選定/導入コンサルティング/導入サポート/AI 基盤・運用構築 まで多く案件を担当
Google Cloud Partner Top Engineer 2024 受賞 カテゴリ:Cloud AI/ML
Google Cloud Next Tokyo 出展
Google Cloud Day ’23 Tour 登壇
「AI は選んで組み込んで実装!最新 AI を道具として有効利用するためには!?」
■好きな Google Cloud サービス:Vertex AI / Auto ML / Visual Inspection AI / Dialogflow CX

島村裕哉をフォローする
クラウドに強いによるエンジニアブログです。
SCSKは専門性と豊富な実績を活かしたクラウドサービス USiZE(ユーサイズ)を提供しています。
USiZEサービスサイトでは、お客様のDX推進をワンストップで支援するサービスの詳細や導入事例を紹介しています。
AI・MLGoogle Cloudクラウドソリューション
シェアする
TechHarmony
タイトルとURLをコピーしました