1、 搜索詞分析:系統(tǒng)需要對用戶的搜索詞進(jìn)行預(yù)處理,包括改寫糾正錯誤、近義詞、補全搜索詞等,很多用戶在搜索過程中都會為了方便輸入不完整的內(nèi)容或者是不小心輸錯,系統(tǒng)要提前做好準(zhǔn)備,才能去給出準(zhǔn)確的搜索答案。
2、 分詞計算:用戶的搜索詞比較長,就需要工具來就行拆分,若是用整個搜索詞來做匹配,召回率會非常低。不同的分詞工具使用的算法不同,因此最好就是要了解清楚如何置入工具。
3、 索引匹配:創(chuàng)建商品之后,系統(tǒng)就會把商品名稱分詞并且建立索引庫,商品類目和品牌也能納入其中,這樣就能獲得商品候選集。
4、 商品候選集:匹配出相關(guān)類目以及和文件相關(guān)的所有商品,以類目+文本為最高優(yōu)先級,對所有商品進(jìn)行排序,以便于用戶搜索的時候能夠搜索到自己想要的商品,也能讓信息整合分類變得更加簡單。