【關鍵字索引】 KeyWordInContextIndex,簡稱KWIC
【辭書名稱】圖書館學與資訊科學大辭典
關鍵字索引乃電腦製作的交替式索引。
KWIC索引首先由魯恩(H.P.Luhn)於1958年研究發明而成。
其設計之基本理念是將正文中的關鍵字彙提出作為索引款目。
它是利用電腦自文獻的題名、摘要或正文中直接摘取重要字彙輪流交替編排而成。
每一題名佔一行,換言之,一篇文獻的題名中有n個關鍵字,則在索引中,該一題名就會出現n次。
作為索引款目的關鍵字通常在固定的欄位,以收一目了然的檢索效果。
KWIC索引編印格式,亦即組成KWIC索引的要項,通常分為:關鍵字、上下文及文獻
出處:3部分。
關鍵字即索引款目本身,其選取是以顯示主題內容為主,非關鍵字或稱為剔除字(StopWord)或半剔除字(SemiStopWord)則於編製索引時交由電腦自動予以剔除。
剔除字通常包括冠詞、介詞、連接詞、代名詞、副詞、助動詞等;
半剔除字則為對文獻內容不具實質意義的字,例如:國際(International)、期刊(Journal)、學會(Society)等。
剔除字與半剔除字則由索引人員視學科性質而定。
例如:化學、食品科學或醫學類而言,作為冠詞的'A'則不可視為剔除字,因為維他命A是一有主題意義的關鍵字。
上下文乃關鍵字索引前後的字彙,即題名中其餘的字彙。
文獻
出處:,通常以各種代號指示,是進一步檢索原始文獻或文獻摘要的根據。
今舉例說明其結構如下:KWIC索引的作法乃將文獻的題名、摘要或正文輸入電腦可讀的媒體,而後與剔除字、半剔除字清單相比對,有意義的關鍵字可由電腦直接抓取,連帶關鍵字前後之上下文及文獻
出處:代號一併印出。
故KWIC索引法又稱為導出索引法(DerivedIndexing)。
因索引款目是電腦直接自文獻中擷取關鍵字編製而成,索引人員不必作主題分析及詞彙控制等智慧性判斷的工作,故製作簡單且快速,最能滿足讀者迫切的資訊需求,適合圖書館提供新知通告服務;
而且利用電腦大批處理,成本較低;
又文獻中每一個關鍵字均可作為索引款目,沒任何限制,故檢索點多,使用者只要知道主題中任何一個關鍵字均可找到所要的資料。
以上所述乃KWIC索引之優點。
KWIC索引雖有其特長,亦存在不少缺點,例如:(1)KWIC索引係採用自然語言索引法,對同義字、同形異義字或其他相關字未作有效控制,因此相同主題的文獻未必完全集中一處。
檢索時必須花上一段時間週詳的考慮並檢索所有可能與主題相關的字彙;
而且使用者一旦想找一篇自己真正需要的文獻,只有依賴上下文來辨識其意義。
(2)卷帙龐大、版面擁擠、不夠清晰、閱讀吃力。
(3)由於每一關鍵字都提作索引款目,因此在一廣義詞下經常會發生款目數量太多,致使使用不便的情況發生。
針對KWIC索引的缺點加以修正為成KWOC(KeyWordOutofContext)索引。
其基本作法與KWIC相同,惟將正文中的關鍵字以正常次序排列,但將索引款目個別提出置於最左邊,其後為正文,關鍵字會往正文中再出現一次。
其編印格式如下: 轉自:http://edic.nict.gov.tw/cgi-bin/tudic/gsweb.cgi?o=ddictionary
|