こんにちは。SCSK渡辺(大)です。
外を歩いていたら目が痒くなり、クシャミが出ました。
秋花粉の足音が聞こえた気がして震えています。
さっそく納品
500円で音声付きアニメーション動画は作れます。
ただし何かしらの妥協が必要だということが以下の成果物から感じていただけるかと思います。
アニメーション動画
奇跡的に8~9秒あたりで音がハマっています。
概要資料
まずは感想
画像や動画、音声を直感的に作れるのは凄く楽しかったです。
AWS Elemental MediaConvertは正直存在を認知できていませんでした。便利なサービスですね。私のような一般人はどちらかというと日常生活で使う機会が多いのかと思います。
Amazon Nova Reelは発展途上という感じがしました。
現状だとファインチューニングが出来ないので、プロンプトが重要かと思います。
今回は奇跡的にキャラクターの造形が大きく崩れない動画が生成されましたが、本来は意図的に生成できないといけないと思います。他サービスと比較するとコストが高いので、慎重に使わないとですね。
Amazon PollyのエンジンにGenerative(生成AI)があるのですが、残念ながら日本語は非対応でした…。
Amazon Nova Sonicも日本語は非対応なので、Amazon PollyのGenerativeはAmazon Nova Sonicを使っているのかと思われます。
以下の記事にあるようにAmazon Nova Canvasはファインチューニングできるので、現在の環境下で想像通りのアニメーション動画を作成したい場合にはAmazon Nova Canvasだけでもファインチューニングしたほうが良い気がしました。
背景
もともと、業務とは別に、AWS上で何か子供向けのコンテンツを作りたいなとは考えており、「ゲーム」「絵本」「アニメ」が候補でした。
前々回、前回と2回連続で「ゲーム」に関する記事を書いてみたところ、前回の記事について同僚から「Amazon Nova SonicでBGMも作れるのかな?」というコメントをいただいたので、Aamzon Nova Sonicを調べてみました。
Aamzon Nova SonicのコンセプトからするとBGMを作成する用途ではなさそうでしたが、簡単に「声」を作成できるという点に興味を持ちました。
その後、Amazon Novaに関する勉強会に参加し、Amazon Nova Reelで6秒以上の動画(最大120秒)を作成できるようになったことを知りました。
最後に、最近ついにKiroと友達になれたことで、今回の記事執筆に至りました。
新しい友達のKiro
まだ数日触っただけですが、個人的に気に入っていることは以下です。
- 軽い
- ログが分かりやすい
- MCPの実行結果を畳んで表示してくれる
- AWSCLIの実行状況がターミナルで見れる
本当はKiroのSpecモードを利用してみたかったのですが、今回の方法でアニメーション動画を作るにはオーバースペックに感じたため、Vibeモードを利用しました。
近いうちにSpecモードも触ってみたいです。
ちなみに、はじめに掲載した概要資料はHTML×CSS×JavaScriptで作られており、こちらはKiroに作ってもらいました。
以下のイベントに参加したときに紹介されていた手法です。
HTML、CSS、JavaScriptを扱える人は、たたき台を作ってKiroに渡すか、Kiroにたたき台を作ってもらって自身で修正するほうが早いと思います。
作成を依頼したら快諾してくれました。
AWS公式アイコンを使ってくれたのは嬉しいポイントです。
配色を変えたパターンも作成してくれました。


アニメーション動画の作り方
概要資料の6スライド目にある構築手順フローは大雑把なので、もう少し詳細に記載します。
- 画像生成用プロンプトの生成
- 利用サービス:Amaozn Nova Pro
- インプット:自身のVibe(ex.キャラクターは犬、場所は草原、日本人向けの見た目)
- アウトプット:画像生成用プロンプト(英文)
- 画像の生成
- 利用サービス:Amazon Nova Canvas
- インプット:Amazon Nova Proで生成したプロンプト
- アウトプット:画像(ローカルにダウンロード)
- 補足:8枚の生成で満足した結果になりました。概要資料にある21枚を大きく下回りました。
- 動画生成用プロンプトの生成
- 利用サービス:Amaozn Nova Pro
- インプット:Amazon Nova Canvasで生成した画像、自身のVibe(ex.キャラクターを動かして欲しい)
- アウトプット:動画生成用プロンプト(英文)
- 動画の生成
- 利用サービス:Amazon Nova Reel
- インプット:Amazon Nova Canvasで生成した画像、Amazon Nova Proで生成したプロンプト
- アウトプット:動画(自動でAmazon S3バケットにダウンロード)
- 補足:今回の難所でした…。納品した12秒の動画はテストで生成したものです。その後に30秒の動画をいくつか生成しましたが造形が崩れてしまい公開は難しいと判断しました…。
- 音声生成用プロンプトの生成
- 利用サービス:Amazon Nova Pro
- インプット:Amazon Nova Reelで生成した動画、自身のVibe(ex.キャラクター同士で会話して欲しい)
- アウトプット:音声生成用のプロンプト
- 補足:生成後に動画の時間に合うよう手動で調整しました
- 音声の生成
- 利用サービス:Amazon Polly Neural
- インプット:Amazon Nova Proで生成したプロンプト
- アウトプット:音声(ボタン1つでAmazon S3バケットにダウンロード)
- 動画と音声の結合
- 利用サービス:AWS Elemental MediaConvert
- インプット:動画、音声(どちらもAmazon S3バケットに存在している必要あり)
- アウトプット:音声付きの動画(Amazon S3バケットに出力)
- 補足:知識ゼロだったのでKiroにやってもらいました。参考記事にあるSTS一時認証情報を1コマンドでcredentialsファイルに保存できるPythonスクリプトを導入しておくと便利です。






画面キャプチャで振り返り
すべて画面キャプチャを取得したわけではありませんが、参考までに掲載します。
Amazon Nova ProにAmazon Nova Canvasに渡すプロンプトのテンプレートを聞きました。(メモからですみません)
Amazon Nova ProにAmazon Nova Canvasに渡すプロンプトを英文で作ってもらいました。(メモからですみません)
Amazon Nova Canvasではじめに生成してもらった画像の1つです。
この後、カラーパレットに赤を追加したり調整しました。
Amazon Nova ProにAmazon Nova Reelに渡すプロンプトのテンプレートを聞きました。
Amazon Nova Reelで動画生成をしました。
Amazon Nova Reelで生成された動画がAmazon S3バケットに格納されました。
Amazon Pollyで生成された動画がAmazon S3バケットに格納されました。
AWS Elemental MediaConvertはKiroに助けてもらいました。