【關聯檢索系統】 AssociationRetrievalSystem
【辭書名稱】圖書館學與資訊科學大辭典
關聯檢索系統是將系統內的字彙,依照字彙與字彙同時出現的頻率,建立一套系統的字彙網路圖,使得系統內的字彙依照分類的架構自動串接起來。
在實際檢索時,讀者雖然只輸入少數幾個檢索語,但經過這個架構的輔助,將使檢索語與所有相關的字彙自動結合在一起,增進檢索的效果。
此種具備字彙網路圖的檢索系統,稱之為關聯檢索系統。
關聯檢索的概念最早是由史泰爾斯(H.E.Stiles)於1961年提出。
他於檢索系統中,定義出一個關聯因素值(AssociationFactor),以測定兩字彙同時出現的實際值與觀察值之差值。
從此之後,史賓格爾(J.Spiegel),古利耶洛(V.E.Giuliano)及鍾斯(P.E.Jones)等從事更深入的研究。
關聯檢索系統內的辭彙架構,可以是文章內的字彙,或是由專家所給予的描述語。
系統內的字彙依據字彙同時出現的機率,自動計算相關係數,並建立起一個字彙矩陣表。
從表中可以顯示出,字彙間同時出現於一篇文章段落的頻率。
凡是數值越高,則表示二字彙的關聯性越強,反之則越弱。
換言之,在這個字彙的矩陣表之中,字彙之間關聯性的強弱,乃由不同字彙同時出現的傾向程度決定。
在系統中,決定字彙關聯程度的指標又稱為關聯因素值(AssociationFactor),在語意上又可以字彙間距(Between-WordDistances)稱之。
關聯檢索方式可視為一種索引字彙的網路。
當此一網狀字彙,以機讀格式儲存於電腦後,系統網路可以由最初輸入的檢索辭彙,自動串連其他相連的字彙,檢索出相關的文獻。
在實際檢索時,檢索者輸入數個檢索字彙,系統自動將輸入之字彙,經由網狀的字彙圖中連接出第一代關聯字彙,並依第一代關聯字彙串接出第二代關聯字彙。
因此,雖然檢索者只輸入少數幾個檢索字彙,但系統自動將關聯的字彙聯接一起,使檢索出文獻更完整。
例如在一般的檢索策略中,若下「AandBandC」的指令,(其中A,B,C代表輸入的檢索字彙),則在非關聯的檢索系統中,必須同時具有A,B,C3個字彙的文獻,才可被檢索出來。
因此,往往檢索出來的文獻篇數偏低。
相對在關聯檢索系統中,當輸入相同的檢索策略時,系統自動透過字彙網路圖,以A,B,C為中心,連接出第一代關聯字彙A1,B1,C1,然後再串出第二代關聯字彙,A2,B2,C2。
最後的檢索策略成為:((AorA1orA2)and(BorB1orB2)and(CorC1orC2))依據上述的檢索策略,檢索程式自動計算每個字彙間的關聯因素值,作為檢索的依據。
使檢索的範圍擴大,增加檢索的文獻篇數。
關聯檢索方式比傳統的檢索方法,除了擴充檢索範圍的層面外,因第一、二代的字彙是依據字彙的關聯性所選出,因此也擴大了檢索語義的範圍。
這將有助於提高檢索的回現率(RecallRatio)。
轉自:http://edic.nict.gov.tw/cgi-bin/tudic/gsweb.cgi?o=ddictionary
|