最近、よく仕事でGoogle AnalyticsのデータをBigQueryで集計したりしています。
プライベートでも学習できる環境が欲しかったので、Google Cloud Platform (GCP)アカウントでBigQueryを有効化して、Google Analytics (GA)のサンプルデータにクエリできるようにしました。
今回の投稿は、その時の手順をメモしたものです。
前提条件
次の2点を最初にクリアしておく必要があります。
- GCPを利用できるGoogleアカウントを持っていること
- プロジェクトを作成済みのこと (この後、BigQueryと紐付けます)
BigQueryの有効化
まず特定のプロジェクトでBigQueryを利用可能にします。
GoogleアカウントでGCP https://console.cloud.google.com/ にログインしたら、ナビゲーションメニューからBigQueryを選択します。
作成済みのプロジェクトでBigQueryを有効化するので、"an existing project"を選択します。
有効化するプロジェクトを選択して"続行"をクリック。
これでBigQueryを利用可能になりました。
再度ホーム画面のナビゲーションメニューからBigQueryを選択すると、BigQueryの画面が開きます。
Google Analyticsサンプルデータを取り込む
次にGoogle Analyticsのサンプルデータ(データセット)を取り込みます。
プロジェクトのオプションから Switch to project > Display project ... を選択します。
Project IDにgoogle.com]analytics-bigquery
と入力し、"OK"を選択します。
すると、新たにgoogle.com:analytics-bigqueryデータセットが参照できるようになります。
このデータセットにはLondonCycleHelmetという1つのテーブルを持っており、これがGAのサンプルデータとなっています (トランザクションやカスタムディメンジョンも一応入っています)。
もうちょっと骨太なデータが欲しい場合は、上と同じ要領でbigquery-public-dataデータセットを追加し、google_analytics_sampleというテーブルを使うと良いです。
2016/8/1から1年分のデータをパーティションテーブルで持っています。
試しに以下のクエリを実行してみると、2017/8/1のトランザクション数と金額が返ってきています。
まとめ
GCPでBigQueryを有効化して、GAのサンプルデータにクエリできるようにしました。
次回はこのサンプルデータを使って、いろいろなクエリを書いていきます。
[追記]