BigQuery

Google Cloud

Dataformアサーションで直近一週間にNull値が含まれているかを実装してみた!

Dataformアサーションで直近一週間にNull値が含まれているかを実装してみました。
Google Cloud

【BigQuery】データ調査・障害対応で使えるSQLパターン集

データ調査でよく使うBigQueryのクエリパターンをまとめました。
Google Cloud

【Google Cloud】BigQuery Editions 料金体系を徹底解説!

BigQuery Editionsの料金体系を徹底解説。オンデマンド課金との違い、スロットを予約するコミットメントの活用法、最適な移行フローを分かりやすく解説します。
Google Cloud

BigQueryでDELETE時のスキャン量をゼロにしたい ~パーティションプルーニング~

BigQueryでDELETE時の不要なスキャン量を削減する方法をご紹介します。特にdataformではDELETE&INSERTでデータを更新するケースもあると思います。WHERE句の書き方によって不要なスキャン量を削減することが可能です。
Google Cloud

TerraformでBigQueryをIaC化してみた

Terraformを使ってBigQueryのリソース(データセット・テーブル・スキーマ)をInfrastructure as Code(IaC)として管理する方法を解説します。
Google Cloud

Cloud Run × PythonでタイムトラッキングツールからAPI自動取得バッチを構築してみた

TMetric というタイムトラッキングツールからデータを自動で抽出し、BigQueryにロードするまでのプロセスを、Cloud RunとPythonを活用して実装した事例を紹介します。
Google Cloud

Dataformのアサーション出力先を環境ごとに変える方法

Dataformにおけるアサーション結果の出力先について、環境ごとにプロジェクトやデータセットを変更する方法をご紹介します。
Google Cloud

Dataformのアサーションを増分ロジックで実装する方法

Dataformのアサーションにおいて、増分ロジックでスキャンする方法についてご紹介します。組み込みアサーションはフルスキャンとなってしまいますが、手動アサーションによる実装であれば、クエリの書き方次第で増分ロジックでアサーションを実装することが可能です。
Google Cloud

Fivetranを使用して、メールから送られてくるデータをBigQueryに格納してみた

クラウド型データ連携サービスであるFivetranを活用し、BigQueryに効率的にデータを格納する方法について解説します。データエンジニアリングの知識がなくても、Fivetranを使えば、簡単にデータ連携パイプラインを構築することができます。
Google Cloud

【Google Cloud】BigQuery の外部テーブル機能

BigQuery外部テーブル徹底解説!GCSのデータをロード不要で即分析。作成方法から活用例、注意点まで分かりやすく解説。データレイク連携や一時分析にも最適。