Etu Blog-藍衣人的視界

掌握大數據趨勢,解析消費者意圖

 

行為加語意,找到更符合您興趣的旅遊景點

 

旅遊景點推薦,我們常會看哪些景點最多人點擊按讚,哪些飯店、餐廳最多好評,再看看專家貼文或親朋好友都去哪些景點,來決定自己的旅遊行程規劃...

。所以有些網站會透過系統,收集網友點擊行為,分析網友都喜歡看什麼景點,訂什麼飯店或餐廳,透過協同過濾演算法,找出”您可能會喜歡的景點”、”別人也喜歡的景點”來推薦給你。但這種推薦旅遊景點,是基於網友的歷史景點瀏覽記錄,採用協同過濾演算法,其效果沒有不好,只是有些問題不是這個演算法可以解決的,例如:


  1. 網友的歷史景點瀏覽記錄稀疏
  2. 旅遊景點的推薦,常會是交通樞紐城市可能永遠綁在一起出現
  3. 冷啟動狀況比較嚴重,網站剛開始或網友剛加入時,瀏覽互動量太少

語意主題分析發掘網友意圖

網友打算出遊的時候,一般頭腦中會有一個或者多個旅遊主題(如:泰國海島渡假、曼谷血拼之旅、日本溫泉之旅、北極光生態之旅、西安廟宇建築之旅、中國百岳山旅等),然後會思考哪些景點是符合我這次的主題,然後根據景點,綜合季節、距離、價錢等因素選擇出發的城市。

因此自然的想到語意主題分析模型,對所有的景點進行內容語意分析,基於網友歷史的景點瀏覽頻率和長期偏好,給網友推薦其感興趣的旅遊主題,將該主題中景點推薦給網友。

 

讓語意主題分析模型實現推薦演算

一般提到語意主題分析模型,實務較常被使用的是 潛在狄利克雷分配 (Latent Dirichlet Allocation) ,是一種語意主題模型,將每篇文件內容的主題按照機率分布的形式計算出來。同時它是一種無監督學習演算法,在訓練時不需要人工標註的訓練資料,需要的僅僅是文件內容以及指定主題的數量 K 即可。此外,潛在狄利克雷分配的另一個優點是,對於每一個主題均可找出一些關鍵字詞來描述它。

實行語意主題分析產生 User-based 個人化推薦景點流程如下:(圖一)


  • 每個景點內容必須先進行斷詞斷句,粹取出景內容中的關鍵字詞,依字詞關聯產生主題,按照機率分布的形式計算出來。
  • 只要有景點內容以及指定主題的數量 K 即可,依景點內容的字詞進行主題的分類,分析景點內容間的關聯。這樣即可以產生景點間的關聯度,並產生 Item-based 推薦景點清單。
  • 若要做 User-based 個人化推薦,再輔以網友景點內容的瀏覽點擊行為,進行矩陣相乘,就可以找出網友可能對其他景點的偏好機率。

 


圖 1. 語意主題分析產生 User-based 個人化推薦景點流程
( 圖片出處:Blei, D. M.(2012). Probabilistic topic models. Communications of the ACM )

 

行為加語意讓推薦主題分析模型實現推薦演算

只要好好熟悉各種不同演算法的特點,及各種資料應用特性,即可以挖掘出更符合各種情境需求的推薦應用,透過多種資料來源的收集,與不同特性演算法的組合應用,即可以創造出百變的行銷推薦模式,提昇整體服務的營銷推薦成效。

 

本文作者為 Etu 資深產品處長 張聖丕(Peter Chang)