基本檢索的特點?
即簡單檢索、快速檢索。檢索的可選項少或者沒有,輸入查詢詞,就能快速得到結果。但檢索的準確性差、精度低。
基本檢索方法
一、布爾檢索
利用布爾邏輯算符進行檢索詞或代碼的邏輯組配,是現代信息檢索係統中最常用的一種方法。常用的布爾邏輯算符有三種,分別是邏輯或“OR”、邏輯與“AND”、邏輯非“NOT”。用這些邏輯算符將檢索詞組配構成檢索提問式,計算機將根據提問式與係統中的記錄進行匹配,當兩者相符時則命中,並自動輸出該文獻記錄。 下麵以“計算機”和“文獻檢索” 兩個詞來解釋三種邏輯算符的含義。
(1)“計算機”AND“文獻檢索”,表示查找文獻內容中既含有“計算機”又含有“文獻檢索”詞的文獻。
(2)“計算機”OR“文獻檢索”,表示查找文獻內容中含有“計算機”或含有“文獻檢索”以及兩詞都包含的文獻。
(3)“計算機”NOT“文獻檢索”,表示查找文獻內容中含有“計算機”而不含有“文獻檢索”的那部分文獻。
檢索中邏輯算符使用是最頻繁的,對邏輯算符使用的技巧決定檢索結果的滿意程度。用布爾邏輯表達檢索要求,除要掌握檢索課題的相關因素外,還應在布爾算符對檢索結果的影響方麵引起注意。另外,對同一個布爾邏輯提問式來說,不同的運算次序會有不同的檢索結果。布爾算符使用正確但不能達到應有檢索效果的事情是很多的。
二、截詞檢索
截詞檢索就是用截斷的詞的一個局部進行的檢索,並認為凡滿足這個詞局部中的所有字符(串)的文獻,都為命中的文獻。按截斷的位置來分,截詞可有後截斷、前截斷、中截斷三種類型。
不同的係統所用的截詞符也不同,常用的有?、$、*等。分為有限截詞(即一個截詞符隻代表一個字符)和無限截詞(一個截詞符可代表多個字符)。下麵以無限截詞舉例說明:
(1)後截斷,前方一致。如:comput表示computer,computers,computing等。 (2)前截斷,後方一致。如:computer表示minicomputer,microcomputers等。
(3)中截斷,中間一致。如comput表示minicomputer,microcomputers等。
截詞檢索也是一種常用的檢索技術,是防止漏檢的有效工具,尤其在西文檢索中,更是廣泛應用。截斷技術可以作為擴大檢索範圍的手段,具有方便用戶、增強檢索效果的特點,但一定要合理使用,否則會造成誤檢。
三、原文檢索
“原文”是指數據庫中的原始記錄,原文檢索即以原始記錄中的檢索詞與檢索詞間特定位置關係為對象的運算。原文檢索可以說是一種不依賴敘詞表而直接使用自由詞的檢索方法。
原文檢索的運算方式,不同的檢索係統有不同的規定,其差別是:規定的運算符不同;運算符的職能和使用範圍不同。原文檢索的運算符可以通稱為位置運算符。從RECON、ORBIT和STAIRS三大軟件對原文檢索的規定,可以看出其運算符主要是以下4個級別:
(1)記錄級檢索,要求檢索詞出現在同一記錄中;
(2)字段級檢索,要求檢索詞出現在同一字段中;
(3)子字段或自然句級檢索,要求檢索詞出現在同一子字段或同一自然句中;
(4)詞位置檢索,要求檢索詞之間的相互位置滿足某些條件。
原文檢索可以彌補布爾邏輯檢索、截詞方法檢索的一些不足。運用原文檢索方法,可以增強選詞的靈活性,部分地解決布爾檢索不能解決的問題,從而提高文獻檢索的水平和篩選能力。但是,原文檢索的能力是有限的。從邏輯形式上看,它僅是更高級的布爾係統,因此存在著布爾邏輯本身的缺陷。