2023/5/8 – 5/11 で開催されておりました「Informatica world 2023」に参加しました。SCSKの石原です。
2023年5月9日 の「Rapidly Replicate ERP and SaaS Application Data Using Mass Ingestion」についてレポートします。言語的に拙い部分があります。もし誤った内容があればご指摘ください。
セッション情報
- セッションタイプ:Deep Dive Session
- 日時:2023/05/09 13:30-15:30
- 概要
Learn how Cloud Mass Ingestion can help you extract more value from your on-prem and SaaS application data to gain real-time insights easily and cost-efficiently. See how to ingest large volumes of application, relational, file and streaming data into the cloud with a special focus on ERP data, followed by how to capture and replicate changes.
Cloud Mass Ingestion を使用して、オンプレミスおよび SaaS アプリケーション データからより多くの価値を抽出し、リアルタイムの洞察を簡単かつコスト効率よく得る方法をご覧ください。 ERP データに特に焦点を当てて、大量のアプリケーション、リレーショナル、ファイル、およびストリーミング データをクラウドに取り込む方法と、変更をキャプチャしてレプリケートする方法をご覧ください。(Google翻訳)
セッションレポート
SAPなどのERP製品や、SalesforceなどのSaaSからIDMCを利用してデータを同期する方法の一つとしてCloud Mass Ingestion(CMI) という機能があります。そのCMIを活用して、具体的にどのようなアプローチでデータを同期するかを解説いただきました。そのあとにハンズオンを実施しました。
そのなかで気になったところをピックアップして記載します。
CMIを活用したデータレプリケーションのアプローチ
CMIのChange Data Capture(CDC)を活用して、データをレプリケーションします。CDCで同期できることにより、より鮮度の高いデータを分析基盤で活用することができます。またデータ基盤に蓄積することで、他のデータと組み合わせ活用することができます。
SAPからはDB層またはアプリケーション層からデータを取得することができると説明がありました。
アプリケーション層からデータを取得する場合はSAP ODPを利用します。
CMIでのデータロード方法では、初期ロードおよび増分ロードに対応しています。ターゲットにはSnowflakeやBigQueryなど主要なクラウドDWHやクラウドストレージが指定できます。
今後の展望
SAPのABAPレイヤからデータ取得できるようになると発表がありました。
ラボ
2つのラボを実施しました。
会場にはPCが用意されており、環境やラボ資料が用意されていました。
基盤やDBがお膳立てされている状態でしたので、GUIで3~4つの画面で設定にするだけで実行することができました。
- OracleからSnowflakeへのCDC
- SalesforceからSnowflakeへのCDC
感想
SAPからクラウドDWHにデータをロードすることで、パワフルな環境で複数のデータソースのデータを扱うことができるようになります。基盤が構築済みという前提ではありますが、CMI(Cloud Mass Ingestion)を活用することで、数Stepの設定でデータのロードが開始できるのは便利だと感じました。
今回はSAP環境が用意されているわけではなかったので、社内検証環境のSAP S/4HANAで検証してみたいと考えています。