[GA4] GA4串接BigQuery並匯出原始資料
前言
Google Analytics 4(下稱GA4)在推出後一個重大的變更就是跨裝置追踨,可以同時蒐集網站(web)與應用程式(app)並放在同一個資源下可以作查詢,另外就是支援免費版GA4用戶匯出原始資料至BigQuery;BigQuery是GCP (Google Cloud Platform)中的一個產品,其主要是作為雲端資料倉儲系統,可以統合、管理及控管所有類型的資料,並透過內建查詢加速功能即時分析資料。BigQuery也內建了機器學習功能(BigQuery ML),能夠建構推薦與偵測系統(智慧數據分析設計模式),協助建立電子商務推薦系統、預測顧客終身價值,以及設計購買傾向解決方案,可以說是非常適合用來儲存包含GA4、客戶CRM等的大量數據,把GA4數據匯出至BigQuery其優點有以下幾個:
- 資料保存期限不再受到GA4的上限日期影響。在GA4預設的保存資料期限是2個月,可以透過設定最長延長為14個月,因此把資料匯出至BigQuery即能解決資料保存期限的難題。
資料來源:https://go.data360.cc/saiqo
-
GA4蒐集一定數據後為了讓報表更快的呈現會採取資料取樣的方式,只能呈現大致趨勢而非更精準的數據。若匯出至BigQuery後在上面查詢資料便不再受到資料取樣的限制。
註:免費版GA4每日匯出上限為一百萬個事件。
資料來源:https://go.data360.cc/u4ZI0 -
透過Looker Studio串接BigQuery的GA4數據,將不受免費版GA4 API存取限制,且在指標與維度可以更自由的透過SQL變化應用
GA4連結BigQuery請參考以下步驟
-
先登入GA4後台,並選擇一個GA4資源。
-
在「資源」下的列表裡,從「產品連結」清單中找到「BigQuery連結」並點擊進去。
-
點擊「連結」選擇一個GCP專案。
-
選擇專案後,設定此GA4資源的資料集要儲放在哪一個地區(有台灣可供選擇)。
註:一個資源僅能連結至一個BigQuery專案,但一個BigQuery專案可以承接多個GA4資源。
-
選擇要放在BigQuery的資料串流並設定匯出頻率,頻率選擇上有每天一次及即時匯出串流。免費版每天有100萬的事件數匯出限制,但其實在「調整設定」是可以選擇所需要的Data stream或選擇較重要的事件去做保留,以確保每一天的事件數不超過100萬。
註1:流使用串流匯出時,您需要為每 GB 的資料多支付 $0.05 美元的 BigQuery 費用;1 GB 相當於大約 60 萬個 Google Analytics (分析) 事件 (實際數量取決於事件大小)。
註2:即時匯出串流僅適用於「已啟用帳單的雲端專案」。
(BigQuery不超過免費額度就不會額外產生費用,來源:
https://cloud.google.com/bigquery/pricing?hl=zh-tw#free-tier )
-
確定資料每日(或即時)匯入BigQuery,匯入至BigQuery的資料會放在一個名為「analytics_{資源id}」的資料集(dataset)下面,名稱中的 {資源id} 即是代表GA4的資源編號,而每日的資料則會以「events_{日期}」整理成單一張表格;在GA4中設定提交後,可能隔天才會產生dataset
註1:events_intraday_{日期} 是當日資料,整理完成後會自動更名為「events_{日期}」。
註2:events_{日期} 在BigQuery的顯示上會用收疊的方式作呈現。
-
觀察events_intraday_{日期}的當日表格及資料是否有值,有當日資料的話即代表GA4已正確連結至BigQuery。
當做完設定時,即代表GA4會把每日資料自動送進BigQuery作儲存,能夠做更多的數據上的操作,也能結合其他數據達到更全面的運用;另外就是當設定連結完成而BigQuery中的table被建立後並匯入GA4資料後,當天資料會持續更新至72小時為止。