今日頭條搜索優化是今日頭條APP里內嵌的搜索引擎,不僅能搜索站內自媒體發布的相關信息,還能搜到站外信息,用戶可通過今日頭條上面的搜索框進行試用。今日頭條SEO優化有三個維度的變量。
第一個維度是內容
頭條現在已經是一個綜合內容平臺,圖文、視頻、UGC小視頻、問答、微頭條,每種內容有很多自己的特征,需要考慮怎樣提取不同內容類型的特征做好推薦。
第二個維度是環境特征
這是移動互聯網時代推薦的特點,用戶隨時隨地移動,在工作場合、通勤、旅游等不同的場景,信息偏好有所偏移。
第三個維度是用戶特征
包括各種興趣標簽,職業、年齡、性別等,還有很多模型刻畫出的隱式用戶興趣等。
結合三方面的維度,模型會給出一個預估,即推測推薦內容在這一場景下對這一用戶是否合適。
頭條指數“根據今日頭條熱度指數模型,將用戶的閱讀、分享、評論等舉動的數量加權求和得出響應的事件、文章或關鍵詞的熱度值”,考慮了用戶的多種舉動,它具有輔助創作、輿情分析和精準營銷三個重要作用,目前的頭條指數的更新是按照小時更新的,相對微信而言更及時,同時還能夠提供數據下載。
除了熱度,頭條指數還提供用戶畫像的分析功能。對相關關鍵詞匹配的人群,包括性別、年齡、地域、愛好都有直觀的呈現。選擇特定的時間段,還能回溯某段時間中響應的數據體現。
內容分析包括文本分析,圖片分析和視頻分析。頭條一開始主要做資訊,今天我們主要講一下文本分析。文本分析在推薦系統中一個很重要的作用是用戶興趣建模。沒有內容及文本標簽,無法得到用戶興趣標簽。另一方面,文本內容的標簽可以直接幫助推薦特征。
內容分析和用戶標簽是推薦系統的兩大基石。內容分析涉及到機器學習的內容多一些,相比而言,用戶標簽工程挑戰更大。
今日頭條常用的用戶標簽包括用戶感興趣的類別和主題、關鍵詞、來源、基于興趣的用戶聚類以及各種垂直興趣特征(車型,體育球隊,股票等)。還有性別、年齡、地點等信息。性別信息通過用戶第三方社交賬號登錄得到。
還有用戶的年齡信息通常由模型預測,通過不同機型、閱讀的時間分布等預估。常駐地點來自用戶授權訪問位置信息,在位置信息的基礎上通過傳統聚類的方法拿到常駐點。常駐點結合其他信息,可以推測用戶的工作地點、出差地點、旅游地點。這些用戶標簽非常有助于推薦。