愛悠閑 > Inferring the Most Important Types of a Query: a Semantic Approach

Inferring the Most Important Types of a Query: a Semantic Approach

分類: 查詢意圖分類  |  標簽: semantic,types,query,搜索引擎,算法,框架  |  作者: killtayoto 相關  |  發布日期 : 2014-07-08  |  熱度 : 2°

一個很神奇的論文,據說是研究這個問題的第一篇論文。論文題目是《Inferring the Most Important Types of a Query: a Semantic Approach》,翻譯過來是《推測查詢的最重要的類型:一種語義方法》,作者是David。

 

摘要

本論文將講述一種方法,它能夠對于一個給定的查詢,將它所屬于的類型進行排序。傳統的搜索引擎對于搜索,返回的是結果列表,后來又逐漸根據結果的類別進行了分類,比如博客、新聞等。

后來出現的一個叫做“方面查詢(faceted approaches)”的框架,也就是針對一個查詢的一個方面。比如哈爾濱,那么最可能的方面就是“城市”。歲月對于方面查詢,一個最重要的問題就是找到一個查詢的最重要的方面,或者是對方面排序。

一個不同的趨勢是“實體檢索(Entity retrieval)”。實體是一個附著又語義類型的短語,比如:城市:哈爾濱。在實體檢索中,結果就不再是結果的排序,而是實體的排序。比如一個查詢“哈爾濱”,那么有百科語料的實體檢索的結果包括了哈爾濱的地點和重要的日期。也就是說地點和日期可能就是這個查需最重要的方面。我們把這樣的問題叫做“實體類型排序”。

 

方法

首先需要的就是這個實體排序的算法,在另外一個獨立的論文中有講解。假設對于一個查詢q,E(q)=e1,e2,...,en是返回的結果,現在需要得到T(q)=t1,t2,...,tm,也就是類型的排序。那么一個很簡單的公式當E(q)中的一個實體的類型是t是,就將其得分增加,也就是根據這些實體的類型來統計出來查詢的類型。

 

論文中還有很多的實驗結果,有興趣可以參閱一下。這個論文總的來說思想很簡單,但是是解決一個實際問題。這個過程有點像是knn,對于一個查詢,找到與他最相關的一些實體,然后由這些實體來投票得到自己的類型。這種思想很多都有用到,比如協同過濾等。



快乐彩中奖说明