【AWS】500円で音声付きアニメーション動画は作れるのか

こんにちは。SCSK渡辺(大)です。

外を歩いていたら目が痒くなり、クシャミが出ました。
秋花粉の足音が聞こえた気がして震えています。

さっそく納品
1. アニメーション動画
2. 概要資料
まずは感想
背景
新しい友達のKiro
アニメーション動画の作り方
画面キャプチャで振り返り

さっそく納品

500円で音声付きアニメーション動画は作れます。

ただし何かしらの妥協が必要だということが以下の成果物から感じていただけるかと思います。

アニメーション動画

キャラクターの造形が若干崩れ、音声は機械的な声になっています。
苦手な方は視聴をお控えください。

本当は30秒にしたかったのですが、キャラクターの造形が崩れてしまうものが多く、比較的綺麗に仕上がった動画を採用しました。
奇跡的に8～9秒あたりで音がハマっています。

「ワン！」の後の言葉は犬が話していると思ってください…。

概要資料

6スライド目の構築手順フローは想像していたものと異なっているため、後半で補足します。

まずは感想

画像や動画、音声を直感的に作れるのは凄く楽しかったです。

AWS Elemental MediaConvertは正直存在を認知できていませんでした。便利なサービスですね。私のような一般人はどちらかというと日常生活で使う機会が多いのかと思います。

Amazon Nova Reelは発展途上という感じがしました。
現状だとファインチューニングが出来ないので、プロンプトが重要かと思います。
今回は奇跡的にキャラクターの造形が大きく崩れない動画が生成されましたが、本来は意図的に生成できないといけないと思います。他サービスと比較するとコストが高いので、慎重に使わないとですね。

Amazon PollyのエンジンにGenerative（生成AI）があるのですが、残念ながら日本語は非対応でした…。
Amazon Nova Sonicも日本語は非対応なので、Amazon PollyのGenerativeはAmazon Nova Sonicを使っているのかと思われます。

以下の記事にあるようにAmazon Nova Canvasはファインチューニングできるので、現在の環境下で想像通りのアニメーション動画を作成したい場合にはAmazon Nova Canvasだけでもファインチューニングしたほうが良い気がしました。

Amazon BedrockでWordPress記事のアイキャッチ画像を自動生成する

Amazon Bedrockを用いて、WordPress記事のアイキャッチ画像を自動生成・付与する仕組みをつくってみました。

背景

もともと、業務とは別に、AWS上で何か子供向けのコンテンツを作りたいなとは考えており、「ゲーム」「絵本」「アニメ」が候補でした。

前々回、前回と２回連続で「ゲーム」に関する記事を書いてみたところ、前回の記事について同僚から「Amazon Nova SonicでBGMも作れるのかな？」というコメントをいただいたので、Aamzon Nova Sonicを調べてみました。
Aamzon Nova SonicのコンセプトからするとBGMを作成する用途ではなさそうでしたが、簡単に「声」を作成できるという点に興味を持ちました。

その後、Amazon Novaに関する勉強会に参加し、Amazon Nova Reelで6秒以上の動画（最大120秒)を作成できるようになったことを知りました。

最後に、最近ついにKiroと友達になれたことで、今回の記事執筆に至りました。

新しい友達のKiro

まだ数日触っただけですが、個人的に気に入っていることは以下です。

軽い
ログが分かりやすい
MCPの実行結果を畳んで表示してくれる
AWSCLIの実行状況がターミナルで見れる

本当はKiroのSpecモードを利用してみたかったのですが、今回の方法でアニメーション動画を作るにはオーバースペックに感じたため、Vibeモードを利用しました。
近いうちにSpecモードも触ってみたいです。

ちなみに、はじめに掲載した概要資料はHTML×CSS×JavaScriptで作られており、こちらはKiroに作ってもらいました。
以下のイベントに参加したときに紹介されていた手法です。

HTML、CSS、JavaScriptを扱える人は、たたき台を作ってKiroに渡すか、Kiroにたたき台を作ってもらって自身で修正するほうが早いと思います。

Amazon Q Developer Meetup #2 Amazon Q Developer を業務で活用した成果共有と最新情報 Update | AWS Startups

Amazon Q Developer Meetup #2 Amazon Q Developer を業務で活用した成果共有と最新情報 Update

作成を依頼したら快諾してくれました。

AWS公式アイコンを使ってくれたのは嬉しいポイントです。

配色を変えたパターンも作成してくれました。

Hey Kiro, Spotifyのプレイリストで打線組んで。

AWSが発表した次世代エージェント型IDE「Kiro」を実際に触ってみて、Webアプリケーションを構築してみた体験記となります。

KiroでTerraformコードのテストをする

先日AWSからリリースされたKiroは、AIが仕様書やタスクリストを作成しながら実装を行ってくれる「仕様駆動開発」が特徴です。Terraformのテストコードの作成とテストを実施しようと思います。

アニメーション動画の作り方

概要資料の6スライド目にある構築手順フローは大雑把なので、もう少し詳細に記載します。

画像生成用プロンプトの生成
- 利用サービス：Amaozn Nova Pro
- インプット：自身のVibe（ex.キャラクターは犬、場所は草原、日本人向けの見た目）
- アウトプット：画像生成用プロンプト（英文）
画像の生成
- 利用サービス：Amazon Nova Canvas
- インプット：Amazon Nova Proで生成したプロンプト
- アウトプット：画像（ローカルにダウンロード）
- 補足：8枚の生成で満足した結果になりました。概要資料にある21枚を大きく下回りました。
動画生成用プロンプトの生成
- 利用サービス：Amaozn Nova Pro
- インプット：Amazon Nova Canvasで生成した画像、自身のVibe（ex.キャラクターを動かして欲しい）
- アウトプット：動画生成用プロンプト（英文）
動画の生成
- 利用サービス：Amazon Nova Reel
- インプット：Amazon Nova Canvasで生成した画像、Amazon Nova Proで生成したプロンプト
- アウトプット：動画（自動でAmazon S3バケットにダウンロード）
- 補足：今回の難所でした…。納品した12秒の動画はテストで生成したものです。その後に30秒の動画をいくつか生成しましたが造形が崩れてしまい公開は難しいと判断しました…。
音声生成用プロンプトの生成
- 利用サービス：Amazon Nova Pro
- インプット：Amazon Nova Reelで生成した動画、自身のVibe（ex.キャラクター同士で会話して欲しい）
- アウトプット：音声生成用のプロンプト
- 補足：生成後に動画の時間に合うよう手動で調整しました
音声の生成
- 利用サービス：Amazon Polly Neural
- インプット：Amazon Nova Proで生成したプロンプト
- アウトプット：音声（ボタン１つでAmazon S3バケットにダウンロード）
動画と音声の結合
- 利用サービス：AWS Elemental MediaConvert
- インプット：動画、音声（どちらもAmazon S3バケットに存在している必要あり）
- アウトプット：音声付きの動画（Amazon S3バケットに出力）
- 補足：知識ゼロだったのでKiroにやってもらいました。参考記事にあるSTS一時認証情報を1コマンドでcredentialsファイルに保存できるPythonスクリプトを導入しておくと便利です。