[Looker Studio] 混合資料 5-3:五種彙整設定 Configure join
前言
關於 Looker Studio 中的「混合資料 Blend data」功能系列文章,先前已經介紹了混合資料的基本用法以及其設定介面。本篇將介紹系列第三個主題:「彙整設定 Configure join」。
5-1. 認識「 混合資料 Blend data 」與 COALESCE 函數
5-2. 混合資料設定介面
5-3. 五種彙整設定 Configure join
5-4. GA4 與混合資料應用情境
5-5. Error?常見出錯情境與排除方法
彙整設定是什麼?
混合資料的彙整設定概念與 SQL 中的 Join 類似。我們已經知道混合資料是要將多張資料表結合,以呈現整合結果的圖表,其中「彙整設定」就是決定「資料被整合的方式」。
從混合資料的設定介面,可以看到表格1與表格2之間的「設定彙整」方塊,此方塊的設定將會決定這兩張表中的資料會如何被整理結合。
五種彙整方式
點開彙整設定,畫面顯示五種彙整方式,也就是畫面中的「聯結運算子」。包含五種方式:
- 左外部彙整 Left outer
- 右外部彙整 Right outer
- 內部 Inner
- 完整外部彙整 Full outer
- 交叉 Cross
對於初次使用這項功能的人來說乍看滿頭問號,實際上不會很難理解,觀察介面中的示意圖尤其有幫助。
接下來會一一說明各個彙整方式的原理,以及產出資料的結果。在此再次用「5-1. 認識「 混合資料 Blend data 」與 COALESCE 函數」這篇文章中,小美的寵物用品店 「Pet shop」 的「每日營業額」與「每日來客數」 兩張表格做為整合示範案例。注意此案例中「每日來客數」沒有6月7日的資料列,而「每日營業額」缺少6月3日的資料列。
(如果想跟著練習,點擊以下取得這兩份資料的存取權)
(範例資料:每日來客數)
(範例資料:每日營業額)
左外部彙整 Left outer
此模式會以左側資料表為主,保留主表所有的資料列。接著處理合併的表(位於右邊的表),只有當對應欄位(鍵 key)能對應到左表的值時,才會補充資料;否則該欄位值顯示為空白(null)。來看示範案例,採用「左外部彙整」以左邊的「每日來客數」為主表,並且用欄位"Date"作為對應欄位(key) 來合併右表「每日營業額」
經「左外部彙整」整理的結果表格。
1. 保留左表「每日來客數」的所有資料列
2. 右表「每日營業額」6 月 3 日無資料,Revenue 欄為 null
3. 「每日營業額」6 月 7 日的資料列因無對應左表日期而未出現
右外部彙整 Right outer
此模式與左外部彙整相反,右外部彙整以右側資料表為主。以此範例來說,會以位於右邊的「每日營業額」為主,左邊的「每日來客數」日期會一一比對在右表是否有符合的日期,如果有就將資料附加上去;無符合的日期時就忽略左表的該資料列。
結果表格如下:
- 保留右表「每日營業額」的所有資料列
- 左表「每日來客數」6 月 7 日無資料,Customer 欄為 null
- 「每日來客數」6 月 3 日的資料列因無對應右表日期而未出現
內部 Inner
此模式可以理解為「交集」。從示範圖可知,結果表格只會列出兩個圓交集的部分。以範例來說,只有兩張表格都有的日期,才會被列入結果表格。
結果表格如下:
- 僅保留左右表都擁有對應日期的資料列
- 左表的 6 月 3 日與右表的 6 月 7 日資料因缺乏對應關係未出現
- 結果表格只包含兩表皆有資料的日期:6 月 1、2、4、5、6 日
完整外部彙整 Full outer
此模式會保留左右兩張資料表中的所有資料列。若欄位值可對應,則合併為一列;若無對應值,則未對應欄位以 null 顯示。無對應顯示為null時需搭配 COALESCE 函數來處理合併問題。> 回顧 COALESCE 公式的用法
皆有資料 → 合併為單一列
僅左表有 → 右表欄位為 null
僅右表有 → 左表欄位為 null
結果表格如下:
- 保留 6 月 1 日至 6 月 7 日的所有日期資料列
- 左右表皆有資料的日期(如 6 月 1、2、4、5、6 日)合併為一列
- 6 月 3 日僅存在於左表,右表欄位為 null
- 6 月 7 日僅存在於右表,左表欄位為 null
- 使用 COALESCE(Date1, Date2) 公式合併日期欄位,避免日期欄位分裂

交叉 Cross
「交叉」用於列出表格中所有資料列可能的所有排列組合,因此該比對模式不需要比對的對應欄位(鍵 key)。
這種比對方式較不適用於每日來客數與每日營業額的場景,「列出所有可能組合」應用的場景案例:
- 「每種商品都有三個色號,列出所有可售的商品」
- 「有 10 款商品可以任選 2 款搭配,列出所有可能的組合」等。
在此用 Pet Shop 的「寵物牽繩」商品為例,老闆想要列出所有的寵物牽繩品項
- 款式:「伸縮款」、「彈力款」與「胸背款」
- 色號:「草莓粉」、「薄荷綠」、「帥氣黑」、「閃亮黃」
- 尺寸:L、M、S
結果表格如下:
使用「交叉」彙整後,右側的結果表格列出所有可能的「款式」+「色號」+「尺寸」的共36種組合。使用「交叉彙整」可以很快的完成列表。
提醒!由於 Cross join 不需比對鍵值,產生的資料筆數會是左右表的資料列數量相乘,資料量可能激增,需小心使用。
結論
這次介紹了 Looker Studio 中的五種彙整模式,也就是「混合資料 Blend data」這項功能的精髓。下一個章節「5-4. GA4 與混合資料應用情境」會介紹混合資料如何與GA4的資料搭配,幫我們做出更多變化的報表,讓分析更便利,並提供更多觀點。