【關聯檢索系統】

豐碩 · 發表於 2012-11-29 03:51:26

【關聯檢索系統】

AssociationRetrievalSystem

【辭書名稱】圖書館學與資訊科學大辭典

關聯檢索系統是將系統內的字彙，依照字彙與字彙同時出現的頻率，建立一套系統的字彙網路圖，使得系統內的字彙依照分類的架構自動串接起來。

在實際檢索時，讀者雖然只輸入少數幾個檢索語，但經過這個架構的輔助，將使檢索語與所有相關的字彙自動結合在一起，增進檢索的效果。

此種具備字彙網路圖的檢索系統，稱之為關聯檢索系統。

關聯檢索的概念最早是由史泰爾斯(H.E.Stiles)於1961年提出。

他於檢索系統中，定義出一個關聯因素值(AssociationFactor)，以測定兩字彙同時出現的實際值與觀察值之差值。

從此之後，史賓格爾(J.Spiegel)，古利耶洛(V.E.Giuliano)及鍾斯(P.E.Jones)等從事更深入的研究。

關聯檢索系統內的辭彙架構，可以是文章內的字彙，或是由專家所給予的描述語。

系統內的字彙依據字彙同時出現的機率，自動計算相關係數，並建立起一個字彙矩陣表。

從表中可以顯示出，字彙間同時出現於一篇文章段落的頻率。

凡是數值越高，則表示二字彙的關聯性越強，反之則越弱。

換言之，在這個字彙的矩陣表之中，字彙之間關聯性的強弱，乃由不同字彙同時出現的傾向程度決定。

在系統中，決定字彙關聯程度的指標又稱為關聯因素值(AssociationFactor)，在語意上又可以字彙間距(Between-WordDistances)稱之。

關聯檢索方式可視為一種索引字彙的網路。

當此一網狀字彙，以機讀格式儲存於電腦後，系統網路可以由最初輸入的檢索辭彙，自動串連其他相連的字彙，檢索出相關的文獻。

在實際檢索時，檢索者輸入數個檢索字彙，系統自動將輸入之字彙，經由網狀的字彙圖中連接出第一代關聯字彙，並依第一代關聯字彙串接出第二代關聯字彙。

因此，雖然檢索者只輸入少數幾個檢索字彙，但系統自動將關聯的字彙聯接一起，使檢索出文獻更完整。

例如在一般的檢索策略中，若下「AandBandC」的指令，（其中A,B,C代表輸入的檢索字彙），則在非關聯的檢索系統中，必須同時具有A,B,C3個字彙的文獻，才可被檢索出來。

因此，往往檢索出來的文獻篇數偏低。

相對在關聯檢索系統中，當輸入相同的檢索策略時，系統自動透過字彙網路圖，以A,B,C為中心，連接出第一代關聯字彙A1,B1,C1，然後再串出第二代關聯字彙，A2,B2,C2。

最後的檢索策略成為：((AorA1orA2)and(BorB1orB2)and(CorC1orC2))依據上述的檢索策略，檢索程式自動計算每個字彙間的關聯因素值，作為檢索的依據。

使檢索的範圍擴大，增加檢索的文獻篇數。

關聯檢索方式比傳統的檢索方法，除了擴充檢索範圍的層面外，因第一、二代的字彙是依據字彙的關聯性所選出，因此也擴大了檢索語義的範圍。

這將有助於提高檢索的回現率(RecallRatio)。

		自動登錄	找回密碼
密碼			【立即註冊】