【五術堪輿學苑】

 找回密碼
 【立即註冊】
查看: 699|回復: 0
打印 上一主題 下一主題

【關聯檢索系統】

[複製鏈接]
跳轉到指定樓層
作者
發表於 2012-11-29 03:51:26 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式

關聯檢索系統

 

AssociationRetrievalSystem

 

【辭書名稱】圖書館學與資訊科學大辭典

 

關聯檢索系統是將系統內的字彙,依照字彙與字彙同時出現的頻率,建立一套系統的字彙網路圖,使得系統內的字彙依照分類的架構自動串接起來。

 

在實際檢索時,讀者雖然只輸入少數幾個檢索語,但經過這個架構的輔助,將使檢索語與所有相關的字彙自動結合在一起,增進檢索的效果。

 

此種具備字彙網路圖的檢索系統,稱之為關聯檢索系統。

 

關聯檢索的概念最早是由史泰爾斯(H.E.Stiles)於1961年提出。

 

他於檢索系統中,定義出一個關聯因素值(AssociationFactor),以測定兩字彙同時出現的實際值與觀察值之差值。

 

從此之後,史賓格爾(J.Spiegel),古利耶洛(V.E.Giuliano)及鍾斯(P.E.Jones)等從事更深入的研究。

 

關聯檢索系統內的辭彙架構,可以是文章內的字彙,或是由專家所給予的描述語。

 

系統內的字彙依據字彙同時出現的機率,自動計算相關係數,並建立起一個字彙矩陣表。

 

從表中可以顯示出,字彙間同時出現於一篇文章段落的頻率。

 

凡是數值越高,則表示二字彙的關聯性越強,反之則越弱。

 

換言之,在這個字彙的矩陣表之中,字彙之間關聯性的強弱,乃由不同字彙同時出現的傾向程度決定。

 

在系統中,決定字彙關聯程度的指標又稱為關聯因素值(AssociationFactor),在語意上又可以字彙間距(Between-WordDistances)稱之。

 

關聯檢索方式可視為一種索引字彙的網路。

 

當此一網狀字彙,以機讀格式儲存於電腦後,系統網路可以由最初輸入的檢索辭彙,自動串連其他相連的字彙,檢索出相關的文獻。

 

在實際檢索時,檢索者輸入數個檢索字彙,系統自動將輸入之字彙,經由網狀的字彙圖中連接出第一代關聯字彙,並依第一代關聯字彙串接出第二代關聯字彙。

 

因此,雖然檢索者只輸入少數幾個檢索字彙,但系統自動將關聯的字彙聯接一起,使檢索出文獻更完整。

 

例如在一般的檢索策略中,若下「AandBandC」的指令,(其中A,B,C代表輸入的檢索字彙),則在非關聯的檢索系統中,必須同時具有A,B,C3個字彙的文獻,才可被檢索出來。

 

因此,往往檢索出來的文獻篇數偏低。

 

相對在關聯檢索系統中,當輸入相同的檢索策略時,系統自動透過字彙網路圖,以A,B,C為中心,連接出第一代關聯字彙A1,B1,C1,然後再串出第二代關聯字彙,A2,B2,C2。

 

最後的檢索策略成為:((AorA1orA2)and(BorB1orB2)and(CorC1orC2))依據上述的檢索策略,檢索程式自動計算每個字彙間的關聯因素值,作為檢索的依據。

 

使檢索的範圍擴大,增加檢索的文獻篇數。

 

關聯檢索方式比傳統的檢索方法,除了擴充檢索範圍的層面外,因第一、二代的字彙是依據字彙的關聯性所選出,因此也擴大了檢索語義的範圍。

 

這將有助於提高檢索的回現率(RecallRatio)。

 

 

轉自:http://edic.nict.gov.tw/cgi-bin/tudic/gsweb.cgi?o=ddictionary

評分

參與人數 1金幣 +500 收起 理由
天梁 值得鼓勵。

查看全部評分

【自由發言誠可貴、言辭水準需更高、若有污衊髒言顯、術龍五術堪輿學苑、不歡迎的喲!】
回復

使用道具 舉報

QQ|【google翻譯】|【手機版】|【Archiver】|【五術堪輿學苑】 ( 皖ICP備11003170號 )

GMT+8, 2024-11-17 06:37 , Processed in 0.828125 second(s), 19 queries , Gzip On.

Powered by Discuz! X3.1

© 2001-2013 Comsenz Inc.

快速回復 返回頂部 返回列表