け日記

最近はPythonでいろいろやってます

BigQueryを有効化してGoogle Analyticsのサンプルデータにクエリできるようにする

最近、よく仕事でGoogle AnalyticsのデータをBigQueryで集計したりしています。
プライベートでも学習できる環境が欲しかったので、Google Cloud Platform (GCP)アカウントでBigQueryを有効化して、Google Analytics (GA)のサンプルデータにクエリできるようにしました。
今回の投稿は、その時の手順をメモしたものです。

前提条件

次の2点を最初にクリアしておく必要があります。

  • GCPを利用できるGoogleアカウントを持っていること
  • プロジェクトを作成済みのこと (この後、BigQueryと紐付けます)

BigQueryの有効化

まず特定のプロジェクトでBigQueryを利用可能にします。

GoogleアカウントでGCP https://console.cloud.google.com/ にログインしたら、ナビゲーションメニューからBigQueryを選択します。

作成済みのプロジェクトでBigQueryを有効化するので、"an existing project"を選択します。

有効化するプロジェクトを選択して"続行"をクリック。

これでBigQueryを利用可能になりました。

再度ホーム画面のナビゲーションメニューからBigQueryを選択すると、BigQueryの画面が開きます。

Google Analyticsサンプルデータを取り込む

次にGoogle Analyticsのサンプルデータ(データセット)を取り込みます。

プロジェクトのオプションから Switch to project > Display project ... を選択します。

Project IDにgoogle.com]analytics-bigqueryと入力し、"OK"を選択します。

すると、新たにgoogle.com:analytics-bigqueryデータセットが参照できるようになります。
このデータセットにはLondonCycleHelmetという1つのテーブルを持っており、これがGAのサンプルデータとなっています (トランザクションやカスタムディメンジョンも一応入っています)。

もうちょっと骨太なデータが欲しい場合は、上と同じ要領でbigquery-public-dataデータセットを追加し、google_analytics_sampleというテーブルを使うと良いです。
2016/8/1から1年分のデータをパーティションテーブルで持っています。

試しに以下のクエリを実行してみると、2017/8/1のトランザクション数と金額が返ってきています。

まとめ

GCPでBigQueryを有効化して、GAのサンプルデータにクエリできるようにしました。

次回はこのサンプルデータを使って、いろいろなクエリを書いていきます。

[追記]

ohke.hateblo.jp