社區搜索(社區搜索每多久至少組織居民參加一次消防教育)
社區的核心是用戶,用戶進入社區的主要目的是消費內容。內容可以是廣義上的圖形、音頻和視頻,也可以是通過社區解決問題的方案。優質的內容可以提升用戶活躍度,為平臺帶來流量和時長,實現用戶增長和留存,獲得更多商機和收益。
“搜索”是社區直接獲取內容的最有效方式,每個社區都在不斷解決以下搜索效果問題:如何準確理解用戶的搜索意圖并返回最匹配的結果?如何通過內容傳播的差異化和個性化,改善用戶的搜索體驗,提升社區歸屬感和忠誠度?社區內不同領域、不同品類、不同渠道之間如何在內容召回上實現互動和連接?如何實現非商業內容與商業內容更好的融合發展?
帶著上述思考,本文將分析內容社區行業搜索的特點和挑戰,并介紹阿里云智能開放搜索——內容社區行業解決方案的加強版及應用實踐。
曝光機會多——無結果率低;
更好的搜索質量-高搜索相關性和更高質量的排名;
更豐富的業務功能——結合業務功能調整搜索結果;
更全面的配套功能——智能糾錯、熱搜、底紋、下拉提示等配套能力;
擁有成本更低——比自建搜索引擎的開發、資源和運維成本更低;
開發使用更便捷——上線周期短,降低了搜索引擎開發和效果優化的難度;
用戶的搜索意圖具有很強的指向性——主搜索匯聚了多個渠道的內容,搜索結果的相關性更加精準;
以某論壇社區為例,產品線覆蓋多個平臺,包括網頁、app、小程序等多種形式,并在業務上區分多個渠道。隨著業務的發展,主頁綜合搜索(以下簡稱“主搜索”)的流量不斷增加,各種付費和引流服務的接入對搜索流量的運營變得更加重要。主搜索的業務需求越來越多,需要聚合多個渠道的內容,同時要求搜索結果的相關性更加準確。在考慮文本相關性的前提下,應加入更多的商業因素。
成熟的搜索引擎涉及離線模塊、在線模塊、查詢理解服務、算法平臺等系統,需要大量的開發、算法優化和持續復雜的運維。由于人力有限,自建搜索系統難以滿足業務需求。
文章搜索博文、問答、經驗分享等內容,搜索精品內容,發現熱點帖子,對付費資源進行分類篩選。
(圖片來自阿里云開發者社區)
話題搜索熱點活動、話題互動PGC、UGC熱搜、底紋、下拉提示等搜索指南個性化且及時。
(圖片來自阿里云開發者社區)
方案架構
功能介紹
內容行業增強版基于阿里巴巴最新的算法功能,契合不同垂直內容搜索場景的痛點和需求,提供內容行業專屬的智能語義理解能力、向量召回和排序算法,為內容行業的搜索性能和效果準確性提供了雙重保障,有效解決了超大詞庫數據帶來的搜索延遲高、資源消耗大、搜索失敗率高等行業重難點問題。對于內容行業,open search還提供了向量模型來實現向量召回和多渠道搜索,提高查詢準確率,并提供多模態搜索解決方案。
普通版與內容行業增強版之間的功能差異
功能列表
通用版
內容行業增強版
一站式配置
創建應用程序后,您需要手動創建和配置查詢分析、排序策略和下拉提示模型。
結合內容行業常見的搜索場景,選擇所需的能力和功能,并提供應用結構模板和索引結構模板,實現一鍵配置,降低新用戶門檻。
查詢分析
為通用行業提供同義詞擴展、停用詞省略、拼寫糾正、詞權重分析、類別預測等能力。
為內容行業提供增強的分析器和查詢分析功能。結合內容搜索場景和行業問題,可以更準確地構建索引并識別用戶的查詢意圖,優于通用版本。
策略排名
創建應用程序后,您需要結合業務場景手動配置和調試相應的排序策略。
基于結構模板和索引結構模板的應用,提供了內容行業常用的排名表達式,無需額外配置即可滿足大部分內容行業的排名效果需求。
函數迭代
定期更新分析器、查詢分析等系統的默認字典。
根據內容行業術語和產品的變化,我們將不斷迭代更新,優化原有的分詞和查詢分析能力,提供更及時的服務保障。查詢分析效果比較
與普通版相比,行業增強版在查詢分析功能上做了更深入的優化,不僅在普通版的基礎上更新了常見的不良案例,還為內容行業豐富了現有的詞庫。分詞:(帶空格的分詞)
詢問
通用版
行業增強版
為了減壓
為了理解壓縮
為了減壓
真實參與參數
真實參與參數
實參數和形參數
結構超載
結構重量負荷
結構超載
谷歌瀏覽器框架
谷歌瀏覽器框架
谷歌瀏覽器框架拼寫糾正:
詢問
通用版
行業增強版
淘寶只能看。
淘寶只能看。
淘寶智能視覺
Mybatics代碼生成
Mybatics代碼生成
Mybatis代碼生成
計算機網絡
計算機網絡
計算機網絡
微程序
微型小程序
微信小程序
向西方深入學習
向西方深入學習
深度學習
內容產業矢量召回
為內容行業的垂直行業數據分布提供高質量的向量召回模型,并確保長尾查詢的召回效果向量召回,包括錯別字查詢,以及依靠同義詞重寫召回查詢。
詢問
美國gmted2010的Shuju下載
向量召回top1
Gmt43相關代碼和數據下載地址。
矢量回憶top2
gmt0054-2010.pdf
向量召回top3
Gmted2010美國下載地址
詢問
3D游戲畫面處理
向量召回top1
3d游戲動畫處理基礎
向量召回top2
3d游戲動畫的基礎
向量召回top3
動畫游戲處理
詢問
禁用n卡
向量召回top1
網卡的禁止和啟動
矢量回憶top2
禁用網卡
向量召回top3
禁用和啟用網卡
CTR預測模型——個性化搜索效果基于Seq行為建模,實現個性化搜索。
例如,用戶的連續搜索:“interview”和“Java”與用戶僅搜索“Java”的結果不同,從而實現個性化召回,滿足不同用戶的搜索需求并提醒用戶搜索體驗。深度排名模型
模型參數規模可達千億級,保證了更好的搜索效果,且模型訓練和使用成本低,遠低于自研人力+機器+R&D支持的成本。深度召回模型集成了阿里云達摩院的NLP能力,提高了搜索效果,降低了無結果率。
根據用戶和數據的特點,結合阿里巴巴長期的技術積累,對模型結構進行深度定制,實現了Make for you獨有的深度模型結構。
輕松訪問,快速啟動,一鍵訪問行業模板,可根據自身業務定制選擇功能,并滿足非技術人員對業務干預和優化以及數字化運營的需求;點擊體驗互動演示
表格結構設計
有關詳細信息,請參考應用程序結構-》創建多表連接。
數據存取
開放式搜索支持用戶通過數據源或不通過數據源訪問數據。通過API/SDK/ console上傳文件導入數據的詳細信息如下:RDS數據源配置MaxCompute(原始ODPS)數據源配置POLARDB數據源配置API/SDK數據導入。
內容社區行業模板的配置
功能選擇:以“IT”行業為例,模板功能可自行勾選(默認全部選中)。
模板功能包括:查詢分析(IT詞權重、IT同義詞包、文本矢量化等。)、排序策略(多搜索、文本相關、向量相關)和下拉提示。
如果搜索測試需要使用“IT向量索引”進行搜索,則需要先配置查詢分析-文本矢量化功能,并在搜索測試中添加相應的IT向量索引:test:
效果定制服務
如果有深度召回、排名效果優化和個性化搜索需求,并且開放搜索團隊的專家支持效果定制服務,您可以填寫咨詢問卷:https://page.aliyun.com/form/act1638084369/index.htm.
作為一個中文IT內容社區,技術社區致力于為中國軟件開發人員提供知識傳播、在線學習和職業發展等全生命周期服務,包括各種產品。
自從我開始接觸阿里云的開放搜索產品以來,一年時間里我已經連接了PC端和移動端的多個平臺,涵蓋了首頁搜索、博客、下載、問答等子業務的渠道搜索。通過開放搜索,我們將為其產品的用戶提供高質量的搜索服務,并通過搜索能力的優化帶來更多業務轉型,提升整體業務收入。與基于開源和自建的服務相比,CTR提高了80%以上。后續算法專家繼續通過深度定制模型幫助客戶進行優化。每個曝光用戶的點擊量增加了16.7%,Item-CTR增加了11.8%,效果仍在提升。
原文鏈接:http://click.aliyun.com/m/1000339045/
本文為阿里云原創內容,未經允許不得轉載。