你剛在微信和朋友討論AJ款式,看公眾號就刷到了AJ的廣告,淘寶首頁也驚喜般地出現了AJ推薦;晚上刷抖音總是刷個不停,感覺刷到的每一個視頻都有某個點能戳中自己,你陷入尋找刺激的循環。
為什這些APP都知道你在想要什么且清楚你的興奮點,是他們監控你的聊天記錄?
不,是你的個人基礎信息和行為數據告訴了他們你需要這些,他們就把你的需要主動給到你罷了。
那他們是怎么做到的呢?下面我們就來簡單探討下個性推薦。這里是文章的結構圖,圖和文章可以對照看,方便理解。
首先,個性推薦系統是為了解決信息過載,通過個性化推薦提高信息分發的效率和準確性,使得用戶更有粘性而被廣泛使用的系統。通俗的說他就是為了讓你更爽,你要什么我就給你什么。
這很美好,但這里有一個陷阱,意思是你不要什么我就少點給你或者不給你——你也就失去了與你意見相左的知識領域接觸的機會,單一的內容被推薦多了用戶也會感到疲勞。
個性推薦用在電商領域來說應該叫“精準投放”——你想買什么淘寶就推薦給你什么,這像是雙贏的感覺。
但對于內容領域(短視頻等)來說,只推薦你有興趣的內容,刺激你興奮點的同時也讓你接觸世界的邊界越來越窄,沉浸于自己營造的狹小的世界;難道我們進入這種回音室的怪圈之后就無法破解了嗎?
(回音室效應:一些意見相近的聲音不斷重復,令身處其中的多數人認為這些聲音就是事實的全部。)我們先不急著解答,待我們逐步探討下個性推薦的內容后,自己就能解答以上的問題;
獨立因素推薦
獨立因素推薦,就是推薦系統基于單個因素篩選的內容或商品推送給用戶;我們在了解獨立因素推薦的同時也了解下推薦的兩種模式被動推薦和主動推薦;
被動推薦
推薦是用戶被動的接收信息,需要用戶去觸發而產生的推薦結果。
例如淘寶上用戶依據價格區間的獨立因素篩選商品,這種行為完全依據用戶有意識的自主操作告訴淘寶我需要特定獨立因素的商品,淘寶后臺會依據你的輸入信息進而對前端的你進行反饋。
假如用戶不是選一個因素而是同時選擇價了格區間+發貨地區+品牌這三個獨立因素時,這時后臺進行篩選,把同時具備這幾個獨立因素的商品推薦給用戶,這只是多個獨立因素的簡單物理標簽相的加可以說還是屬于獨立因素推薦的范疇。(當然淘寶真實推薦結果更為復雜,因為有商品競價排名,這些都會影響推薦的結果,目前是舉例說明)
與之類似的還有網易云音樂的歌單廣場,歌單廣場將歌單分為了流行、民謠、電子等不同的類別,每一個類別就是一個因素,用戶選擇哪個因素的標簽,后臺系統就更新屬于該因素的歌單的數據給到前端界面上展示,這類都是獨立因素的被動推薦。
主動推薦
主動推薦,由系統定時更新數據并主動推薦到用戶面前,用戶打開界面就能接觸到主動推薦的結果;如網易云音樂的熱歌榜,抖音的人氣熱搜榜等就是主動推薦的方式。
但這種熱榜這種統一推薦的方式有一定程度的成馬太效應——火的內容會得到更多的曝光越來越火,但大部分人喜歡的內容并不帶代表每一個用戶都是喜愛的,熱門推薦滿足用戶從眾心理的同時也忽略了用戶的個性差異體驗,所以就需要依據用戶個性的推薦來彌補,隨著用戶對自我獨特性的感知越來越強,需要個性化定制的需求也越來越明顯。如何讓特定的內容滿足特定的用戶,讓用戶開開心心的走進個性推薦的陷阱里就是接下來我們要講的重點。
融合因素推薦
融合因素推薦就是將幾個不同的因素依據特定算法融合而產生新的屬性標簽,并推薦到與該屬性標簽匹配的用戶手機上。我們把融合因素推薦分為基于內容本身屬性推薦、基于內容屬性與用戶屬性協同推薦、基于相似用戶協同推薦這三種推薦方式。
基于內容本身屬性推薦(推薦對象一般是所有人)
還是以抖音熱門短視頻為例,我們需要做的是依據內容的本身屬性建立內容畫像,用數據模型來表示內容的特征。
由抖音熱搜榜可看到,我們把點贊數排名在前30的視頻放上熱搜榜。
當然決定點贊數的因素除了視頻內容本身的類型及質量外,很大的關鍵還在于平臺給多少人推薦了這個視頻,即有多少人可以刷到了這個視頻。平臺判斷一個視頻是否值得推薦給更多的用戶群體,又與歷史用戶對視頻的交互行為息息相關。
例如:
短視頻平臺將一個審核過后的新視頻先推薦給10w人的基礎用戶池進行播放展示,如果這10w人有很多人進行完全播放、點贊、評論、轉發等操作,平臺就判斷該視頻為優質內容進而推薦給100w、1000w的用戶池如此類推。
如果該視頻在10w的展示量中大部分用戶對該視頻不感冒,很少播放完或點贊,就會減少該視頻的展示量或不會再推薦給更多的用戶。
這形成一個優質內容能得到更多展示劣質內容減少展示的良性循環。(用戶池也分不同種類的用戶池,舉例用非真實數據)
這樣判斷一個視頻能否進入到下一個用戶池的標準就成為了關鍵,現實中這個標準是根據模型動態變化的,現在我們先進行標準的性靜態分析這樣便于理解;根據下面初級的算法公式可看到一個視頻的優質程度與用戶對這個視頻的喜愛程度成正比,我們先用用戶的喜愛程度這個特性來反應視頻的優質程度。
視頻優質度=用戶喜愛度 X 視頻質量基數 X 題材類別基數 X 平臺廣告基數
影響用戶喜愛程度的獨立因素有用戶對視頻的平均播放時長、點贊、評論、分享、關注以及不感興趣等操作,每一個操作都會為一個獨立因素增加數值;而且每個獨立因素對與平臺判斷用戶對視頻的喜愛程度的重要性是不同的,如,分享>評論>點贊。我們用權重來表示,對喜愛度高的因素進行數據加權,數據加權一般有兩種常用方式;
自定義加權
產品經理、運營經理依據平時的數據報表人為的定義這些獨立因素和設置權重因子的數值,這種方式比較直接也比較簡單,但他局限于團隊的自身經驗,沒有經過大數據的驗證與現實還是有較大的偏差。
數據建模
數據建模簡單的說就是將時間變量、獨立因素、權重因子通過特定的算法公式進行計算得出該視頻的一個優質度數值。根據這個數值進行推薦和排名,隨著時間變量的改變,獨立因子、甚至是權重因子也會依據一定的函數關系進行改變,整個模型的輸入和輸出都是動態變化的,而且我們不斷的采集用戶行為數據用來訓練模型使其更加接近現實預測的數值。
基于以上信息我們就可以粗劣的得出一張反映用戶對視頻喜愛程度的參考表,該表也可以反映出視頻的優質程度;
用戶喜愛度=(播放時長量+點贊量+評論量+分享量 – 不感興趣量+…)X 權重因子 X 衰減因子
(正常情況下,需要對各個指標做線性方程回歸分析,確定各個指標具有獨立性后,再做權重分析,以上面表格是非真實數據)
根據以上思路我們可以對視頻進行優質程度和類型的評定,有了內容畫像現在只需找到對這個視頻內容感興趣的用戶把視頻推送給他就行了,下面就是我們要說到的基于內容屬性與用戶屬性的協同的推薦。
基于內容屬性與用戶屬性協同推薦(推薦給特定屬性的人)
我們通過采集一個人的基礎信息和行為數據來對一個用戶做定性分析,得出一個用戶在互聯網及現實中的各種特征,所有特征整合在一起就成為一個代表現實中用戶的虛擬畫像。
構建用戶畫像數據會用到靜態和動態兩類數據:
1.靜態用戶畫像數據
我們在注冊APP時通常會輸入姓名、年齡、性別、允許獲取位置、這些基礎信息相對穩定。
2.動態用戶畫像數據
用戶在平時生活對手機產生的操作行為,如你玩過的游戲、關注的公眾號、消費記錄,有沒有房貸車貸發過紅包買過保險,這些行為最后都會變成幾千個事實標簽,用這些事實標簽構建模型計算用戶的行為偏好。
(圖片來源于回形針PaperClip)
還是用上面提到的用戶對視頻的喜愛度的情況為例。
當用戶刷抖音看到一個標簽為美女類的視頻點了一個贊,并不意為者該用戶就喜歡看美女可能是不小心點的,這就需要更多的行為來判斷該用戶對美女類視頻的喜愛程度;根據前面提到的初級公式:
對美女的喜愛權重=(播放時長量+點贊量+評論量+分享量 – 不感興趣量+…)X 權重因子 X 衰減因子
除了點贊、評論、分享,關注了某作者這些行為外還有一個時間的限定,短期行為無法代表長期興趣,單次行為的權重會隨著時間流逝不斷衰減,用戶每次打開美女類內容都會生成一個興趣權重,把一段時間內你所有的美女類興趣權重進行累加,再用S型函數標準化就能得到一個0-10區間的興趣值,標簽值數值越高,就代表用戶對美女就越感興趣程度。
到了這里平臺已可以計算出用戶對某一類視頻的喜愛程度和厭惡程度,同時也對視頻做了分類處理,可直接根據用戶的偏好將視頻推薦給用戶。
平臺除了可以計算出用戶在內容興趣上面的權重外還可以在消費能力、社交偏好等方向進行建模計算,進而得出一個交為完整的用戶畫像。
另外通過行為直接推薦視頻的效果往往不如通過同類視頻推薦,找到和你一樣的人,把他們的瀏覽記錄推薦給你,往往比直接猜你喜歡什么效果更好!
基于相似用戶協同推薦(人以群分)
如何找到和你一樣的人
根據以上思路,我們在用戶的美女喜愛偏好權重、社交偏好權重、消費能力權重等多個維度建立模型,計算用戶的偏好,之后將這些偏好反映的權重值轉化為特征向量!
如,我們把用戶對美女的喜愛權重為8,社交偏好權重為5,消費能力權重為2,將向量理解成多維空間上的一個坐標,通過把每個用戶的向量坐標代入余弦公式和距離公式中,就能計算出和你相似的人,進而把用戶分類。
(這里用到的是鄰近技術:利用用戶的歷史喜好信息計算用戶之間的距離空間中的點越近越相似。)
這樣廣告主或平臺就可以依據與你相似群體的消費記錄和喜愛偏好給你推薦商品或視頻,這也恰巧就是你喜歡的類型。
需要說明的是,微信淘寶們采集的行為數據不僅僅對應你的賬號,更與你的手機唯一識別碼綁定在一起,這意味著你就算不注冊不登陸,你的行為數據一樣會被采集。同時廣告平臺也可以根據你的手機識別碼在其他APP上為你投放廣告,這樣你在刷抖音的時候也能看到淘寶的AJ廣告了!
總的來說,你的一切上網行為都會在手機上留下操作的痕跡(基礎信息和行為數據)。平臺采集到這些歷史痕跡進行數據清洗——結構化數據——建模分析,計算出你的行為偏好,根據你的偏好或同類人的偏好向你推薦商品和內容。
這也就是為什么你剛在微信和朋友討論AJ款式,刷公眾號就刷到了AJ的廣告,淘寶首頁也驚喜般的出現了AJ推薦;晚上刷抖音總是刷個不停,感覺刷到的每一個視頻都有某個點能戳中自己;
那么陷入回音室的怪圈又是怎么回事呢?(回音室怪圈:只推薦你有興趣的內容,讓你接觸世界的邊界越來越窄,沉浸于自己營造的狹小的世界)
回音室怪圈的陷阱是我們自己挖的
由個以上個性化推薦機制的流程可知,你現在的行為數據將決定你將來會接收到什么樣的內容,從這個角度看個性化推薦的結果完全取決于你自己本身的傾向。
如果你刷抖音時能包容那些和你意見不同的人,能耐心看完或評論互動,那么根據個性推薦的機制,你的內容信息流中既有自己喜歡的內容也會有自我認知之外的內容,不用擔心個性化推薦會把你留在回音室里面。
相反,如果你只接受那些你認同的意見或人,不能包容異己,將與自己觀點不對等的內容拉黑處理,長此以往你的信息流里就會只剩下你喜歡的內容,沉浸在自己打造的回音室里。
個性推薦只是依據你的習慣做出的推薦結果,讓你掉進回音室怪圈里的還是你自己。
本文由今科科技用戶上傳并發布,今科科技僅提供信息發布平臺。文章代表作者個人觀點,不代表今科科技立場。未經作者許可,不得轉載,有涉嫌抄襲的內容,請通過 反饋中心 進行舉報。
售前咨詢:0760-2332 0168
售后客服:400 830 7686
1998~2024,今科26年專注于企業信息化服務
立 即 注 冊 / 咨 詢
上 線 您 的 網 站 !