こんにちは、広野です。
2024 年 4 月から正式リリースされる AWS 認定の新試験、Data Engineer – Associate のベータ版試験を 2023 年 12 月に受験しておりまして、先日合格通知が届きました。その受験記や対策っぽい情報を紹介したいと思います。
Data Engineer – Associate 試験って?
冒頭にも書きましたが、新たに新設される AWS 認定試験です。近年のデータ活用、AI/ML 技術の注目度合いから、従来のソリューションアーキテクト、ディベロッパー系に次ぐ新たな体系をつくったものと想像します。
公式情報はこちらをご覧下さい。
ベータ版試験って?
AWS が試験を新設する場合、正式リリース前にベータ版試験をリリースします。実際の受験者のフィードバックを受けて、正式リリースまでに改修を入れるのが目的と思います。
ベータ版試験には、以下の特徴があります。
- 期間限定
- 英語でしか受けられない
- 費用は半額で受けられる(バウチャーの併用は不可)
- 合格発表は受験から数か月後
- 合格すれば正式資格として認定される
デフォルトで半額で受けられるメリットはありますが、日本人的には英語でしか受けられないというのがデメリットでしょう。
試験対策は?
今後の正式リリースのために、執筆時点での対策を残しておきます。ベータ版試験からの個人的な見解なので、正式リリースされた試験とは若干違いがあると思いますが、そこはご了承ください。
そもそも新試験なので、今時点、受験対策本などはありません。公式情報に頼るしかありません。
- まずは公式「試験ガイド」で試験範囲を押さえる
前述、公式サイトのリンクに試験ガイドの PDF 資料があります。これで、ある程度どんなことが問われるのかは想像できます。わかりやすく言いますと、今後廃止予定ではありますが Data Analytics – Specialty (DAS) と同じ領域ですので、内容はほぼ同じと思ってよいと思います。試験対策も DAS の対策をすれば半分以上は取れるかな、と思います。 - 出題イメージを押さえる
AWS Skill Builder という AWS 公式の e-Learning サイトに 20 問だけですが公式練習問題が掲載されています。日本語もあります。こちらを見れば、どんな出題がされるのかイメージは湧くと思います。 - 出題されるサービスを理解しておく
全てを理解する必要はないのですが、各サービスで何ができるのか、他のサービスと組み合わせるとどのようなユースケースに対応できるのか、を理解するとよいと思います。次の章で特に理解しておくべきサービスを紹介します。
絶対に理解しておくべき AWS サービス
以下 5 つ。データ活用の中核となる AWS サービスです。
- Amazon Redshift
- Amazon QuickSight
- Amazon Athena
- AWS Glue
- Amazon RDS
これらは、AWS の Blackbelt 等でまんべんなく理解しておく必要があります。RDS に関しては、SAA や DBS 試験の知識で兼ねることができます。その他、SAA, DVA, SOA の知識で賄える部分があるので、それらを合格している状態で受験されることをお勧めします。
AWS Glue は特に Glue XXXXX といった Glue 系のいくつかのサービスに分かれているので、それらのユースケースを全て理解しておきましょう。
Amazon Redshift には Redshift Spectrum というサービスがあります。Redshift との違いはしっかり押さえておきましょう。
あまり深入りすると試験規約上よろしくないので、この程度にとどめておきます。
その他学習しておいた方がよいこと
以下、勉強しておいて良かったな、と感じたことです。
データレイクの考え方。Amazon S3 にあらゆるデータを集約させ、Glue で ETL、Athena でクエリー、QuickSight で可視化、という王道の設計パターンの理解は必須です。加えて、Lake Formation でできること、たとえばアクセス制御はどんなことができるかは押さえておきましょう。
データ活用の過程で、データを処理するパイプラインを作成するユースケースがあります。このとき、パイプラインを作成するソリューションとして以下 3 つが挙げられます。使い分けを理解しておくとよいでしょう。
- AWS Step Functions
- AWS Glue Workflow
- Amazon Managed Workflows for Apache Airflow
ETL ジョブのスケジュールも、以下 3 つの違いは押さえておきましょう。
- Amazon EventBridge
- AWS Batch
- AWS Glue Workflow
オンプレミスからの大量データ移行も押さえておきましょう。AWS DMS や AWS DataSync が一般的です。
こうして見ると、結構幅広いですね。
まとめ
いかがでしたでしょうか。情報少なくて申し訳ないです。
DEA はアソシエイトレベルとは言え、かなり難易度高かった印象です。記事内で申しておりましたが、DAS と同じレベルと思ってもらえればと思います。今後は SAA、DVA、SOA と並ぶ試験になりますし、データ活用も今後必要な知識になりますので、是非皆様もチャレンジ頂けたらと思います。
本記事が皆様のお役に立てれば幸いです。