Amazon Nova を触ってみた (画像&動画生成編)

本記事は、以下記事の続編です。

本記事では、画像生成モデルAmazon Nova Canvas、動画生成モデルAmazon Nova Reelについてまとめました。

Amazon Novaとは?

Amazon Novaは、フルマネージドサービスであるAmazon Bedrockにて利用可能な、Amazonが開発したモデルです。
テキストや画像、動画をプロンプトとして与えることにより、テキスト生成だけでなく、画像生成や動画生成も可能です。
本記事投稿時点では、Canvas、Reelはバージニア北部でのみ利用可能です。

Amazon Nova Canvas

テキストからの画像生成はもちろんのこと、既存の画像をもとに新たな画像を生成できるマルチモーダルなモデルです。
画像のある部分だけを別の画像へ置換、画像の特徴を維持したまま別のバリエーションで再生成、背景の削除など簡単な画像編集も可能です。
Amazon Novaユーザーガイドには、英語のみ対応と記載されていますが、実際には日本語にも対応しているようです。

入力形式 テキスト、画像
最大入力文字数 1024
最大入力画像サイズ 25MB
サポートされている画像入力形式 PNG、JPEG
最大入力画像サイズ 25MB
画像1枚あたりの料金
(解像度1024×1024まで)
USD 0.04
画像1枚あたりの料金
(解像度2048×2048まで)
USD 0.06

Amazon Nova Reel

テキストや画像から動画を生成できる動画生成モデルです。
本記事執筆時点では、最大6秒間の動画を生成できますが今後のアップデートにより、最大2分間の動画生成、高解像度への対応、ストーリボード機能による複数シーンの統合などがアナウンスされています。
また、Canvas同様にReelも日本語に対応しています。

入力形式 テキスト、画像
最大入力文字数 512
最大入力画像サイズ 25MB
解像度 1280×720
フレームレート 24fps
生成動画の長さ 最大6秒まで
生成された動画1秒あたりの料金 USD 0.08

実際に触ってみる

モデルアクセス有効化

まずはモデルアクセスを有効化します。
リージョンをバージニア北部に変更し、Bedrockのメニューから「モデルアクセス」をクリックします。
以下のような画面が表示されたら「特定のモデルを有効にする」をクリックします。
Bedrockモデルアクセス画面

「Nova Canvas」、「Nova Reel」にチェックを入れて「次へ」をクリックします。

「送信」をクリックします。

アクセスのステータスが「アクセスが付与されました」となっていればモデルアクセス有効化完了です。

Amazon Nova Canvasを使ってみる

「モデルを選択」をクリックします。

「Nova Canvas」を選択して「適用」をクリックします。

 

左側の設定では実行するアクションや生成する画像のサイズ、枚数、色の指定などが可能です。
「3匹の犬が公園で遊んでいる画像」をリクエストしてみます。

画像の一部を変更したい場合は、「バリエーションを生成」を選択して、プロンプトに変更内容を入力すると新たな画像が生成されます。生成された画像にばらつきはあるもののリクエスト通り毛並みが茶色になりました。

次は左側に写っている犬を画像から削除したいと思います。
「オブジェクトを削除」を選択すると青白い枠が表示されるので、削除したいオブジェクトを枠で囲みます。

リクエストどおりに左側に写っている犬が削除されました。

また、「背景を削除」を実行すると簡単にPNG透過された画像を生成できます。

Amazon Nova Reelを使ってみる

続いて動画生成をやってみます。まずはモデルを「Nova Reel」に変更します。

プロンプトを入力して実行すると生成が開始しました。
動画は5分ほどで生成され、左側に表示されているS3に保存されます。

可愛いわんちゃんが遊んでいる動画が生成されましたが、あまり動きがなく背景だけ動いている動画になってしまったのが少し残念です。。。

最後に先ほどCanvasで作成したこちらの画像をもとに動画を作成してみたいと思います。

散歩している動画をリクエストしたのですが、先頭の1匹だけが動いている動画が生成されました。。。
プロンプトを1文で記載していることも影響しているとは思いますが、精度が課題かもしれません。

まとめ

Amazon Novaシリーズの中で画像と動画生成が可能な2つのモデルについてまとめました。
画像は10秒程度、動画は5分程度で簡単に作成できる魅力的な生成モデルと感じました。
プロンプトやパラメータの調整、入力に画像を利用するなどの工夫で生成精度を上げることができれば、広告やプレゼンテーションなどに活用できる可能性もあると思います。
まだリリースされたばかりのモデルであり、今後のアップデートも発表されているので楽しみに待ちたいと思います。

タイトルとURLをコピーしました