Photo by NordWood Themes / Unsplash

什麼是數據模型/預測模型?行銷人必備入門第一課,搞懂數據的應用與限制-Part 1

Data Modeling Jul 20, 2023
快速導覽

前情提要

行銷界近兩年最重要的話題之一,無非在Apple逐步限制廣告可追蹤性、Google宣稱cookieless時代終將來臨的變化下,原先大幅利用第三方數據的媒體操作和行銷科技,該如何調整策略?隨之而來的熱趨勢,就是品牌主接下來應該如何善用自己所擁有的第一方數據,創造具持續性與成長性的商業策略。

身為行銷人一定或多或少聽過「數據預測模型」「AI-Powered」「模型預測」等關鍵字,但數據應用到底怎麼用?可以完成什麼目的?乃至想開始使用數據預測模型的話需要哪些前置作業呢?本文將帶您用淺顯易懂的方式了解數據的應用與限制,開啟AI行銷的大門。

適用閱讀者

  • 廣告代理商 業務/策略
  • 媒體代理商 業務/企劃/優化師
  • 品牌 BU/Marketing/CRM Team
  • 任何沒有數據背景但想有初步認識的人

什麼是數據預測模型

簡單來說,我們將既有的資料餵養給機器模型,而機器模型透過合適的演算法,計算人腦難以處理的複雜維度和處理數據間的複雜關聯性,最後產出具有預測性的結果。

有別於「統計模型」是依照歷史資料的脈絡計算後提供彙整的結果,「數據預測模型」是找到歷史資料間的關聯性及趨勢後,提供具備未來指向性的結果。

💡
在行銷應用的數據模型中,常見的有「監督式學習」與「非監督式學習」,可以理解為前者有標準答案如是否點擊、是否轉換;後者如分群結果。其中又以「監督式學習」較常見,故本篇內容以「監督式學習」的介紹為主。

輸入資料

在數據預測模型的世界裡任何資料都可以當作輸入的資料源,但我們常說「Garbage In, Garbage Out」,當輸入的資料有價值時,輸出的結果才會有價值。在清點可運用的資料時,請掌握幾個原則:

  • 以運用價值為單位切分資料
    從命題回推資料的切分細緻度。在無法回溯資料的前提下,從小單位彙總成大單位是容易的,但要從大單位再break down到小單位除了耗工、還不一定能達成。
    • 舉例1:
      要取得高點擊率文案的關鍵字,那比起一長串文字,將文字拆解成一組組的關鍵字,更能為模型所用。
      • 一串文字(大單位):「暑假限定套組,粉底+粉餅+定妝噴霧只要$1988」
      • 拆解成個別欄位(小單位):「暑假」「限定套組」「粉底」「粉餅」「定妝噴霧」「$1988」
      • 以這個例子來說,要從大單位拆解成小單位是可行的,但因為文字比數字難處理,會花費較多的資料清整時間
designed by {Freepik} from Flaticon https://www.flaticon.com/free-icons/foundation designed by {C-mo Box} from Flaticon https://www.flaticon.com/free-icons/cosmetic
    • 舉例2:
      要取得消費者對個別產品的消費傾向,那比起只有總額的消費紀錄,將品項的單價也拆解紀錄,更能為模型所用
      • 總額跟品項(大單位):「消費$1988,含粉底、粉餅、定妝噴霧」
      • 單價拆解(小單位):「消費$1988」「粉底$1000」「粉餅$494」「定妝噴霧$494」
      • 以這個例子來說,如果只記錄大單位,是沒辦法拆解成小單位的,因為資料庫沒有記錄產品單價。
designed by {iconixar} from Flaticon https://www.flaticon.com/free-icons/consumer
  • 若是監督式學習,需要可對答案
    輸入的資料與輸出的資料一定要具備可對照性。就像教小朋友認識蘋果時,一定會需要給他看蘋果長什麼樣子,並且告訴他這是蘋果。
    • 舉例:
      • 想要預測edm的開信率,訓練模型時就要有過去edm的開信表現。
      • 想要取得下個月會回購的名單,訓練模型時就要有消費者過去的消費表現。
      • 想要預測下一季各分店的業績,訓練模型時就要有各分店過去的業績表現。
      • 想要分析天氣對業績的影響,訓練模型時就要有過去每日天氣與當天業績資料
  • 格式統一
    數據預測模型畢竟不是人類,在沒有被訓練的前提下,它無法知道兩個長相不同的內容實際上指的是一樣的事情,所以將資料清整乾淨是建立數據預測模型前很重要的一步。
    • 舉例:
      • 女、Female、F,我們可能知道這些都指女性,但對數據預測模型來說,如果不做處理就直接輸入,這些會是三種不同值。
designed by {apien} from Flaticon https://www.flaticon.com/free-icons/robot


輸出結果

輸出結果依照商業命題的不同,可能是不同的呈現值。舉例來說:

  • 標籤(tag):模型運算完的興趣標籤,可以貼回群體甚至個人身上
  • 清單(list):就像媒體平台,數據預測模型運算後可以提供一包一包對應需求的消費者名單
  • 分數(score):假設要預測消費者下個月是否會回購,每個人會有對應的預測分數,分數越大代表回購機率越大

取得輸出結果後,依照人員需要,也可以用不同的方式來呈現或使用。舉例來說:

  • 將結果直接儲存於品牌的雲端或地端環境,由技術人員取得再做後續應用
  • 串接行銷工具(Salesforce, Facebook, Google, Braze, SMS發送工具...),由行銷人員直接取得做後續應用,或由行銷自動化工具讀取後觸發後續消費者旅程(user journey)
  • 串接成效追蹤儀表板(Dashboard),供商務人員透過視覺化界面瀏覽結果

數據預測模型的運作邏輯

數據預測模型的背後是機器學習(Machine Learning),我會說機器學習就像是智商200但心智年齡3歲的小朋友。怎麼說呢?

因為數據預測模型可以運算人類大腦無法負荷的多重維度、大量資料。就像人類或許只能同時觀察X+Y+Z三維的資訊,但機器學習可以運算非常多重維度的資訊,並找出其中的關連,這是它超級聰明彷彿智商200的地方。

但同時機器學習又需要我們Brief明確的需求來達成任務,如同還需要一個指令一個動作的3歲小朋友。在建置數據預測模型時,我們要先設好目標是「預測下個月業績」或是「預測每個人的渠道偏好」,再輸入「以價值為單位切分、具關連性且格式統一」的資料後,機器學習才能依照Brief完成對應的數據預測模型和結果。

了解數據預測模型的基礎背景後,Part 2我們將會進一步認識實際的行銷模型題目,以及市面上產品型、客製化型數據預測模型的優缺點。那麼我們下回見~

Key Takeaway

  • Garbage In, Garbage Out。輸入資料有價值,輸出結果才有價值。
  • 小朋友要看過蘋果,才能知道那是蘋果。監督式學習的機器模型要能夠對答案,才能訓練出結果
  • 機器學習可以解決高複雜性的資料和維度,但應設定明確的命題和目標

Tags