0引言
隨著網絡技術發展,圖書館館藏資源揭示大致經歷了提供 OPAC、建立數字資源導航、引進聯邦檢索系統等階段,2010 年前后又掀起引進“網域發現服務”(以下簡稱“發現服務”)熱潮。2013 年 11 月對中國“985 工程”高校[1]圖書館網站的調查發現主頁上有Summon、Primo、超星發現、e 讀等發現服務鏈接的圖書館達 32 家。發現服務的典型國外產品代表有Serials Solutions公 司 的 Summon、 Exlibris 公 司 的 Primo、EBSCO公司的 EDS 和 OCLC 的 Worldcat,國內產品代表有超星公司的超星發現和CALIS的 e讀。國內針對上述服務開展研究的論文多使用“發現系統”指代這幾個產品,國外文獻則多使用“Web scale discovery service”.由于“發現服務”源于國外,本文也使用“發現服務”指代上述對象。國內外“發現服務”的相關論文已有一定數量,綜合多位學者給“發現服務”下的定義,筆者認為如下描述較準確:發現服務是以覆蓋范圍巨大的中央索引和功能豐富的服務層為基礎,向用戶提供本、異地獲取資源及開放獲取資源一站式檢索和獲取的服務。
網絡時代圖書館讀者既是發現服務的用戶,又是谷歌、百度等通用搜索引擎的用戶,通過Summon、Primo、超星發現、e 讀等專用發現服務能查到的文獻,使用通用搜索引擎也有一定的收獲。擺在圖情工作者及用戶面前的問題是:發現服務與搜索引擎誰的文獻保障能力更強?此處的文獻保障能力有兩層含義:一是作為待選的文獻獲取途徑,哪個途徑能提供更多的所需文獻;二是提供同樣的文獻,哪個途徑更便捷、效率更高。
2014年 4 月使用中國知網查詢標題中含有關鍵詞“發現服務”或“發現系統”,同時含有“搜索引擎”的論文,僅得到一篇名為 《基于搜索引擎的 Web 服務發現系統》 的文獻,該文顯然與本文研究內容不符,于是將檢索范圍擴大到標題中含有“發現服務”或“發現系統”的文獻,發現國內有關論文集中在發現服務的發展歷史、基本概念、相關技術、現狀與展望等方面,尚無直接研究發現服務文獻保障能力的論文。但論文中關于發現服務資源覆蓋范圍的內容與發現服務文獻保障能力密切相關。孫宇提出不同發現系統的核心競爭力在于索引元數據的覆蓋面等三個因素,考察發現系統的重要因素是考察系統元數據的覆蓋范圍和覆蓋深度[2].該文提出了考察元數據的具體要求,但沒有實際考察的方法和例子。包凌、蔣穎的論文中關于發現系統資源覆蓋范圍的信息是直接使用服務供應商提供的信息,包括覆蓋多少種期刊、多少個數據庫等[3],但這種方式無法解決本文提出的問題。秦鴻、錢國富的論文提出了發現系統的評估框架,其中元數據是評估內容的一級指標,涉及元數據規模、質量、對資源的覆蓋度、與 OA資源集成等。在獲取系統元數據信息方面除了引用商家自述外,還使用“空值檢索”“元數據記錄類型值估算”等方法進行主動驗證,該文還提到數據庫級別的本館資源覆蓋率比較[4],但仍無法解決發現服務與搜索引擎文獻保障能力比較的問題。竇天芳、姜愛蓉指出,“對圖書館而言,合理評估發現系統的元數據質量既重要又富有挑戰性”,在論及對系統元數據質量評價時,提出通過檢驗重點期刊及清華著者作品在系統中的覆蓋情況來評估系統元數據范圍的思路[5],但沒有具體實踐的信息。朱前東提出“資源發現系統評價體系構建”,強調資源覆蓋信息在評價發現系統時的重要性,也指出用戶是發現系統實現價值的重要主體,要注重發現系統滿足用戶實際需求的能力[6],但該文欠缺發現系統滿足用戶文獻需求的量化評估。
使用谷歌學術及清華大學的“水木搜索”[7],以“Web scale discovery”和“search engine”為標題關鍵詞檢索,命中文獻中也沒有密切相關的文獻。擴展到檢索標題中含有“Web scaledis covery”的文獻,查到的相關文獻顯示,國外針對發現服務的研究起步早,多數是關于發現服務的產生、基本概念、選擇服務要考慮的因素、發現服務部署的經驗、用戶信息素質教育等內容,也涉及資源覆蓋范圍的評價。DanyaLeebaw等認為了解發現服務資源范圍很重要[8],Amy I. Kornblau 等則指出發現服務覆蓋范圍的評估不好比且經常變化[9].
在具體評價發現服務資源覆蓋范圍方面,Jason Vaughan 提出發現服務供應商提供館藏期刊覆蓋分析的方法,但部分供應商未響應[10].MichaelKelley提到應關注發現服務的覆蓋范圍,但具體方法仍需供應商提供資源列表[11].也有通過執行一定的檢索任務推測系統資源覆蓋情況的努力,如 Andrew D. Asher 通過指定 4 個檢索任務,讓志愿者分組檢索參評系統,并對結果進行統計分析[12],這種做法有一定參考價值,但該文重點不在對發現服務實際文獻保障能力的比較研究。
綜上所述,國內外同行都認識到發現服務資源覆蓋范圍對客觀評價發現服務十分重要,但具體評價方法尚不足以回答本文提出的問題。
依靠商家自述顯然過度依賴供應商的自律,而僅根據少量檢索實例就推測某服務的整體資源覆蓋情況則缺乏統計學依據。截止 2014 年 11 月底本文成文階段的文獻復查尚無從用戶實際使用的參考文獻保障角度比較發現服務文獻保障能力的論文,更無具有統計學意義的量化對比發現服務與搜索引擎文獻保障能力的文獻。筆者認為,發現服務和搜索引擎對用戶而言都是待選文獻的獲取途徑,選擇哪個途徑能提供更全面的文獻保障才是用戶最關注的問題。
為此,筆者提出通過定量考察不同文獻獲取途徑對實際使用過的參考文獻的保障情況來衡量其文獻保障能力的方法,并進行了實踐。本文以 2013 年 Web of Science 平臺(以下簡稱“WOS”)中國著者發表論文使用參考文獻的保障情況為切入點,通過抽樣統計的方法定量比較“985 工程”高校使用較多的 5 種發現服務---超星發現、e 讀、Summon、Primo、EDS與 3 種通用搜索引擎---谷歌、谷歌學術、百度保障參考文獻情況,試圖定量比較幾種文獻獲取途徑的實際保障能力,從而為用戶選擇文獻獲取途徑、圖情機構優化服務提供參考。