信息檢索語言主要的分類標(biāo)準(zhǔn)是:
1. 以內(nèi)容特征為分類標(biāo)準(zhǔn),信息檢索語言分為主題語言和分類語言。
2. 以外部特征為分類標(biāo)準(zhǔn),信息檢索語言分為名稱語言、著者語言和序號語言。
主題語言的含義:以自然語言中語詞文字為基礎(chǔ),以反映特定事物為中心,以主題詞字順為基本結(jié)構(gòu)的一種檢索語言。
主題語言的特點(diǎn):
1. 集中性。
2. 直觀性。
3. 靈活性。
分類語言的含義:分類語言亦稱體系分類語言,是以學(xué)科范疇和學(xué)科體系為基礎(chǔ)來劃分事物的一種檢索語言。
分類語言的特點(diǎn):分類語言最明顯的特征是系統(tǒng)性,具有族性檢索功能,有利于人們從科學(xué)專業(yè)的角度進(jìn)行全面性的檢索。
目前,世界上的信息檢索語言有幾千種,依其劃分方法的不同,其類型也不一樣。(一)按照標(biāo)識的性質(zhì)與原理劃分,(二)按照表達(dá)文獻(xiàn)的特征劃分。
按照標(biāo)識的性質(zhì)與原理劃分檢索語言 分類語言是指以數(shù)字、字母或字母與數(shù)字結(jié)合作為基本字符,采用字符直接連接并以圓點(diǎn)(或其他符號)作為分隔符的書寫法,以基本類目作為基本詞匯,以類目的從屬關(guān)系來表達(dá)復(fù)雜概念的一類檢索語言。
以知識屬性來描述和表達(dá)信息內(nèi)容的信息處理方法稱為分類法。著名的分類法有《國際十進(jìn)分類法》、《美國國會圖書館圖書分類法》、《國際專利分類表》、《中國圖書館圖書分類法》等。 關(guān)鍵詞是指出現(xiàn)在文獻(xiàn)標(biāo)題、文摘、正文中,對表征文獻(xiàn)主題內(nèi)容具有實(shí)質(zhì)意義的語詞,對揭示和描述文獻(xiàn)主題內(nèi)容是重要的、關(guān)鍵性的語詞。關(guān)鍵詞法主要用于計算機(jī)信息加工抽詞編制索引,因而稱這種索引為關(guān)鍵詞索引。在檢索中文醫(yī)學(xué)文獻(xiàn)中使用頻率較高的《CMCC》數(shù)據(jù)庫就是采用關(guān)鍵詞索引方法建立的。
3、代碼語言代碼語言是指對事物的某方面特征,用某種代碼系統(tǒng)來表示和排列事物概念,從而提供檢索的檢索語言。例如,根據(jù)化合物的分子式這種代碼語言,可以構(gòu)成分子式索引系統(tǒng),允許用戶從分子式出發(fā),檢索相應(yīng)的化合物及其相關(guān)的文獻(xiàn)信息。
按照表達(dá)文獻(xiàn)的特征劃分檢索語言 表達(dá)文獻(xiàn)外部特征的檢索語言主要是指文獻(xiàn)的篇名(題目)、作者姓名、出版者、報告號、專利號等。將不同的文獻(xiàn)按照篇名、作者名稱的字序進(jìn)行排列,或者按照報告號、專利號的數(shù)序進(jìn)行排列,所形成的以篇名、作者及號碼的檢索途徑來滿足用戶需求的檢索語言。
表達(dá)文獻(xiàn)內(nèi)容特征的檢索語言主要是指所論述的主題、觀點(diǎn)、見解和結(jié)論等。
信息檢索語言是為查找信息服務(wù)的,因此,它必須具備以下的功能。
1.信息檢索語言應(yīng)可表示文獻(xiàn)內(nèi)容、數(shù)據(jù)或其他信息形式。為了滿足不同信息用戶的需要,信息檢索語言應(yīng)能根據(jù)不同的信息需求,表達(dá)不同的類型。例如,檢索某種器材的性能時,信息檢索語言應(yīng)能表達(dá)某些數(shù)據(jù)指標(biāo);而在檢索某種物質(zhì)結(jié)構(gòu)時,又能表達(dá)物質(zhì)名稱和物質(zhì)結(jié)構(gòu)方式。
2.有專用概念表示用戶的信息提問。信息檢索不單純是字面上的組合,而是一種概念上的匹配。例如,計算機(jī)繪圖,這里有兩個名詞,既可拆又可合。拆開后,依據(jù)“計算機(jī)”可查出“計算機(jī)解題”、“計算機(jī)控制”、“計算機(jī)維修”、“計算機(jī)繪圖”等信息;但“繪圖”卻涉及到美術(shù)繪圖、工程繪圖、計算機(jī)繪圖等
信息檢索語言是為查找信息服務(wù)的,因此,它必須具備以下的功能。
1.信息檢索語言應(yīng)可表示文獻(xiàn)內(nèi)容、數(shù)據(jù)或其他信息形式。為了滿足不同信息用戶的需要,信息檢索語言應(yīng)能根據(jù)不同的信息需求,表達(dá)不同的類型。
例如,檢索某種器材的性能時,信息檢索語言應(yīng)能表達(dá)某些數(shù)據(jù)指標(biāo);而在檢索某種物質(zhì)結(jié)構(gòu)時,又能表達(dá)物質(zhì)名稱和物質(zhì)結(jié)構(gòu)方式。 2.有專用概念表示用戶的信息提問。
信息檢索不單純是字面上的組合,而是一種概念上的匹配。例如,計算機(jī)繪圖,這里有兩個名詞,既可拆又可合。
拆開后,依據(jù)“計算機(jī)”可查出“計算機(jī)解題”、“計算機(jī)控制”、“計算機(jī)維修”、“計算機(jī)繪圖”等信息;但“繪圖”卻涉及到美術(shù)繪圖、工程繪圖、計算機(jī)繪圖等。
檢索語言的種類很多。按描述文獻(xiàn)的內(nèi)容性質(zhì)劃分,可分為分類語言和主題語言。
1、分類語言。用分類號和相應(yīng)的分類款目來表達(dá)各種概念,以學(xué)科體系為基礎(chǔ)將各種概念按學(xué)科性質(zhì)和邏輯層次結(jié)構(gòu)進(jìn)行分類和系統(tǒng)排序,能反映事物的從屬派生關(guān)系,便于按學(xué)科門類進(jìn)行族性檢索。按照分類方式的不同,分類語言又分為體系分類語言、組配分類語言和混合分類語言。
2、主題語言。主題語言就是對表達(dá)信息主題內(nèi)容特征的主題詞匯概念,經(jīng)規(guī)范化處理所形成的檢索語言。由于主題詞匯表達(dá)概念準(zhǔn)確,所以主題途徑是檢索信息的主要途徑。主題語言按照主題性質(zhì)的不同,它又可分為標(biāo)題詞語言、單元詞語言、敘詞語言、關(guān)鍵詞語言和引文語言。
主題法檢索語言是另一種從內(nèi)容角度標(biāo)引和檢索信息資源的方法。它不象分類法以學(xué)科體系為中心,而是利用詞語來表達(dá)信息資源中論述的主題概念。用來表達(dá)信息內(nèi)容的詞語稱為主題詞。主題詞不同于自然語言,它是將自然語言中的詞語經(jīng)過人工規(guī)范后的語言,即經(jīng)過詞匯控制的詞語。所謂主題法,就是以自然語言中的詞語或規(guī)范化的詞語作為揭示文獻(xiàn)主題的標(biāo)識,并以此標(biāo)識編排組織和查找文獻(xiàn)的排檢方法。主題指文獻(xiàn)所具體論述的對象和研究的問題,它以語詞作為檢索標(biāo)識,按字順排列,直觀性強(qiáng),也是一種普遍使用的信息組織方法。該方法提供了一種直接面向具體對象、事實(shí)或概念的信息組織方法和信息檢索途徑。主題的類型主要有:
1、標(biāo)題法
標(biāo)題法,也稱標(biāo)題詞法,是主題法系統(tǒng)中最早出現(xiàn)的-種,它是以標(biāo)題詞(規(guī)范的事物名稱、名詞術(shù)語)作為文獻(xiàn)主題內(nèi)容的標(biāo)識和檢索標(biāo)識。標(biāo)題法的主要特征是事先編表,標(biāo)題詞以固定的組合方式組織在主題表中,形成標(biāo)題,檢索按既定組配執(zhí)行。標(biāo)題表通常由一個主表和若干個輔助表組成。《美國國會圖書館標(biāo)題表》(LCSH)是當(dāng)今最著名的標(biāo)題表。標(biāo)題法比較直觀、容易掌握;查找速度快,但查全一門學(xué)科或具某一屬性事物的文獻(xiàn)卻較為困難。
2、敘詞法
敘詞法,又稱為主題詞法。是將自然語言的語詞概念,經(jīng)過規(guī)范化和優(yōu)選處理,通過組配來標(biāo)識文獻(xiàn)主題的方法。敘詞具有概念性、描述性、組配性的特點(diǎn)。敘詞法綜合了多種信息檢索語言的原理和方法,采用靈活的概念組配,并在詞與詞之間建立參照系統(tǒng)。敘詞法適用于計算機(jī)和手工檢索系統(tǒng),是目前應(yīng)用較廣的一種主題檢索語言。CA、EI等著名檢索工具都采用了敘詞法進(jìn)行編排。我國目前使用最廣的《中國分類主題詞表》(前身是《漢語主題詞表》)就是屬于敘詞法,有電子版和印刷版兩種形式?!吨袊诸愔黝}詞表》是分類主題一體化的詞表,與《中圖法》相互對應(yīng),這對文獻(xiàn)信息的組織和檢索十分方便。
文獻(xiàn)檢索途徑包括以下幾種:
一、著者途徑 許多檢索系統(tǒng)備有著者索引、機(jī)構(gòu)(機(jī)構(gòu)著者或著者所在機(jī)構(gòu))索引,專利文獻(xiàn)檢索系統(tǒng)有專利權(quán)人索引,利用這些索引從著者、編者、譯者、專利權(quán)人的姓名或機(jī)關(guān)團(tuán)體名稱字順進(jìn)行檢索的途徑統(tǒng)稱為著者途徑。
二、題名包括書名、刊名、篇名等途徑。 一些檢索系統(tǒng)中提供按題名字順檢索的途徑,如書名目錄和刊名目錄。
三、分類途徑 按學(xué)科分類體系來檢索文獻(xiàn)。這一途徑是以知識體系為中心分類排檢的,因此,比較能體現(xiàn)學(xué)科系統(tǒng)性,反映學(xué)科與事物的隸屬、派生與平行的關(guān)系,便于我們從學(xué)科所屬范圍來查找文獻(xiàn)資料,并且可以起到"觸類旁通"的作用。從分類途經(jīng)檢索文獻(xiàn)資料,主要是利用分類目錄和分類索引。
四、主題途徑 通過反映文獻(xiàn)資料內(nèi)容的主題詞來檢索文獻(xiàn)。由于主題法能集中反映一個主題的各方面文獻(xiàn)資料,因而便于讀者對某一問題、某一事物和對象作全面系統(tǒng)的專題性研究。我們通過主題目錄或索引,即可查到同一主題的各方面文獻(xiàn)資料。
五、引文途徑 文獻(xiàn)所附參考文獻(xiàn)或引用文獻(xiàn),是文獻(xiàn)的外表特征之一。利用這種引文而編制的索引系統(tǒng),稱為引文索引系統(tǒng),它提供從被引論文去檢索引用論文的一種途徑,稱為引文途徑。
六、序號途徑 有些文獻(xiàn)有特定的序號,如專利號、報告號、合同號、標(biāo)準(zhǔn)號、國際標(biāo)準(zhǔn)書號和刊號等。文獻(xiàn)序號對于識別一定的文獻(xiàn),具有明確、簡短、唯一性特點(diǎn)。依此編成的各種序號索引可以提供按序號自身順序檢索文獻(xiàn)信息的途徑。
七、代碼途徑 利用事物的某種代碼編成的索引,如分子式索引、環(huán)系索引等,可以從特定代碼順序進(jìn)行檢索。
八、專門項(xiàng)目途徑 從文獻(xiàn)信息所包含的或有關(guān)的名詞術(shù)語、地名、人名、機(jī)構(gòu)名、商品名、生物屬名、年代等的特定順序進(jìn)行檢索,可以解決某些特別的問題。
(1)按照信息搜集方法分類
按照信息搜集方法的不同,搜索引擎系統(tǒng)可以分為三大類:
·目錄式搜索引擎(Directory Search Engine)
自動方式搜集信息,由編輯員查看信息之后,人工形成信息摘要,并將信息置于事先確定的分類框架中。信息大多面向網(wǎng)站。這類搜索引擎代表是:Yahoo!、LookSmart、Ask Jeeves、Snap、Open Directory。
·機(jī)器人搜索引擎(Crawler-Based Search Engine):
由一個稱為蜘蛛(Spider)的機(jī)器人程序以某種策略自動地在Internet中搜集和發(fā)現(xiàn)信息,由索引器為搜集到的信息建立索引,由檢索器根據(jù)用戶的查詢輸入檢索索引庫,并將查詢結(jié)果返回給用戶。服務(wù)方式是面向網(wǎng)頁的全文檢索服務(wù)。這類搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google。
·元搜索引擎(Meta Search Engine):
這類搜索引擎沒有自己的數(shù)據(jù),而是將用戶的查詢請求同時向多個搜索引擎遞交,將返回的結(jié)果進(jìn)行重復(fù)排除、重新排序等處理后,作為自己的結(jié)果返回給用戶。服務(wù)方式為面向網(wǎng)頁的全文檢索。這類搜索引擎的代表是WebCrawler、InfoMarket。
目前,商業(yè)的搜索引擎站點(diǎn)正在結(jié)合各種搜索引擎的優(yōu)點(diǎn),在類型上有逐漸融合的趨勢。另外搜索引擎站點(diǎn)?“門戶化”的傾向。
(2)按照檢索軟件分類
按照服務(wù)提供方式的不同,檢索軟件也可以分為三大類:全文數(shù)據(jù)庫檢索軟件、非全文數(shù)據(jù)庫檢索軟件、主題指南類檢索軟件。
全文數(shù)據(jù)庫檢索軟件正常運(yùn)作的前提是網(wǎng)站擁有大量的信息,因此必須依靠強(qiáng)大的數(shù)據(jù)庫作為后盾。它能夠提供完整的文獻(xiàn)和信息檢索,查全率很高。
非全文數(shù)據(jù)庫檢索軟件具有速度快、使用簡便、索引量大的特點(diǎn)。
主題指南類檢索軟件是目前網(wǎng)絡(luò)檢索中最常用的檢索軟件。這種軟件查準(zhǔn)率高,速度快,使用方便?,F(xiàn)大部分網(wǎng)站都具備主題指南類檢索功能。
(3)按照檢索語言分類
成熟完備的信息檢索語言應(yīng)具有以下幾項(xiàng)功能。
1)對文獻(xiàn)的信息內(nèi)容(及某些外表特征)加以標(biāo)引的功能。要求利用檢索語言能夠正確標(biāo)引文獻(xiàn)信息內(nèi)容及其外表特征。
2)集中文獻(xiàn)的功能。對內(nèi)容相同及相關(guān)的文獻(xiàn)信息加以集中或揭示其相關(guān)性,提高信息檢索效率。
3)信息組織的功能。對大量文獻(xiàn)信息加以系統(tǒng)化或組織化,使文獻(xiàn)信息的存儲集中化、系統(tǒng)化,便于信息檢索者按照一定的排列次序進(jìn)行有序化檢索。
4)一致性功能。便于將標(biāo)引用語和檢索用語進(jìn)行相符性比較,保證不同檢索人員表述相同文獻(xiàn)內(nèi)容的一致性,以及檢索人員與標(biāo)引人員對相同文獻(xiàn)內(nèi)容表述的一致性。
5)獲得最高查全率和查準(zhǔn)率的功能。保證檢索者在按不同需要檢索文獻(xiàn)時,都能獲得最高的查全率和查準(zhǔn)率。
6)橋梁和紐帶功能。在文獻(xiàn)信息標(biāo)引者和檢索者之間發(fā)揮橋梁和紐帶作用,使二者在理解和表達(dá)文獻(xiàn)信息主題方面達(dá)到一致,以提高信息檢索的準(zhǔn)確性。
聲明:本網(wǎng)站尊重并保護(hù)知識產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請在一個月內(nèi)通知我們,我們會及時刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習(xí)鳥. 頁面生成時間:3.585秒