大數據具有規模龐大、處理速度快、價值密度低的特點。在大數據時代,信息在各行各業的應用價值逐漸凸顯。信息環境是不斷變化的,信息用戶也表現出多樣化的行為特征。信息機構在大數據環境下積極革新信息組織方法,通過有效的信息處理方式滿足信息用戶的需求尤為必要。作為信息資源建設的主體,了解信息用戶的需求與行為特征是開展信息組織的主要依據。根據信息用戶的行為特點開展信息組織,遵循系統性、易獲取性、標準性等原則,大體可以分為收集用戶信息、組織信息資源、構建信息系統3步,有助于提升大數據時代的信息服務質量。
物聯網、云計算等新技術的發展促進了信息量的迅猛增長,而微信、微博等即時通訊工具的出現,也讓信息的發布與傳播方式更為多樣化。當前快速增長的信息將全球數據聯合起來,構成了一個龐大的數據集,海量信息數據也標志著大數據時代的到來。人們如今置身于無處不在的數據中,獲取與傳播信息更為便捷,并且提高了對信息質量與對信息服務的要求。但是在大數據時代,信息機構如何改變傳統的信息組織模式,采用必要的信息處理方式,將這些信息轉化為符合用戶需求的內容,這是當前需要重點解決研究的問題。
1大數據理念概述
1.1大數據的定義
大數據是指規模龐大的數據資料量,在規定時間對這些數據進行采集、處理與管理,能夠為企業運營提供有價值的信息。阿爾文·托夫勒于1980年指出,大數據是第三次科技浪潮中的"華彩樂章".
這個詞匯真正成為互聯網流行語大約開始于2009年[1].當前對于大數據還沒有給出明確的定義,但是已經得到多個行業的關注。
IBM指出大數據具有多樣性、高速性、規模性等特點。這就表明數據信息的種類多樣,處理以及分析數據信息的速度不斷加快,并且數據的規模逐漸增大。維基百科將大數據解釋為規模龐大的數據集,指出依靠常規軟件很難完成信息的獲取與處理,或者采用常規軟件需要耗費大量時間。
1.2大數據的特點互聯網技術的提高讓信息數據量迅速增加,對海量信息數據進行專業化處理,對于掌握市場先機并實現盈利有重要意義。大數據具有的特點包括:①龐大的規模。各種高新技術的廣泛使用,讓用戶能夠便捷地獲取信息,而用戶在轉載、分享等過程中也會產生數據信息。如今互聯網中數據發揮的作用越來越大,其數量也在成倍增長[2].②多樣的類型。用戶在獲取信息數據的同時也會產生新的數據,這些主動產生的大多為非結構化數據,并且具有隨機性,這也體現了大數據類型多樣、結構復雜的特點。③處理速度快?,F代技術的發展提高了數據的產生速度,并且規模正在不斷擴大,而相應的就需要提升數據的處理速度與能力,如此才能保障數據的高效利用。大數據能夠迅速識別并處理海量信息,這也是它十分重要的一個特征。④較低的價值密度。大數據主要通過采集整體數據,進而掌握某事物全方位的信息,而并非單純采集特定的信息[3].對于總量較大的數據,其構成包括非結構化與結構化兩類,但非結構化數據之間的并沒有較大的價值關聯。非結構化數據缺乏限制,若這些數據組合起來很容易產生錯誤,即大數據的價值密度較低。
2大數據環境下信息用戶的需求特點與行為特征分析
2.1信息用戶的需求特點
大數據環境下信息量呈指數增長,而用戶為了解決各種問題產生了多樣化的信息需求。信息用戶所處的環境是不斷變化的,這就決定了他們具有不同的心理與需求特點。①信息用戶對信息的需求更加多樣化,他們不僅要求獲取更多的專業知識,也產生了相應的娛樂需求[4].②大數據環境下用戶完全不用擔心獲取信息的數量,而要解決的問題就是如何篩選大量信息。當前信息用戶更加注重專業性與創新性,對于信息質量的要求更高,而要滿足用戶的需求就需要對信息資源進行精確組織與管理。③全球經濟發展的不均衡性也導致信息資源分布的差異性,在經濟發達地區總體來看信息化普及程度高,而經濟欠發達地區信息化水平較低,這也進一步導致信息用戶信息需求的不均衡性。
2.2信息用戶的行為特征
信息用戶行為是指用戶表現出對信息的需求,并且逐漸將這種需求外化,最終采取必要的行動來獲取與利用信息的過程。開展信息數據服務的主體就是信息用戶,他們也可以看做是處于特定情境下的信息消費者。與一般的用戶行為研究方法不同,對于信息用戶行為的研究應該放在特定的信息組織體系下,而不需要涉及所有的領域。在信息組織體系下,用戶的主要目標之一就是尋求信息,這也是信息需求的外在體現[5].同時,在信息組織體系下信息用戶可以扮演多種角色:
①作為數據信息服務對象,即接受信息系統提供的各類信息服務,如新書通告、資訊訂制等。
②作為數據信息的傳播者,即在與他人、組織溝通交流時傳播各類信息。
③作為數據信息的使用者,信息用戶在應用各類信息資源時系統會產生一系列操作,包括存儲、顯示、生成、包裝等。
信息用戶作為一個社會個體,他們在特定的社會環境中需要完成各種特定的工作,并且也會根據職業需要開展相應的活動。同時在不同的社會群體中,他們所承擔的活動任務也有所區別,只有完成特定任務并達到規定的績效,才能滿足社會的需求[6].
由此可見,任何個體都處于特定的環境中,并且信息行為受到周圍文化、政治、自然環境的影響。個體所處的環境對于其信息行為有重要影響,而信息用戶扮演的角色與承擔的責任,也直接決定了其產生信息行為的特點??傮w來看,用戶的信息行為是受到多種因素影響的,不僅包括情感、認知能力等因素,也包括周圍環境、人際關系以及個體情緒等。
3大數據環境下基于信息用戶行為的信息組織的必要性與原則
3.1基于信息用戶行為的信息組織的必要性
大數據環境下各類信息得到迅速增長,人們更加容易獲取與共享信息,極大增加了信息的流通量,許多原本私有、孤立的信息也得以公開。但是在當前信息資源日漸豐富的狀態下,依然存在部分信息貧乏或無法使用的情況,形成信息爆炸與信息孤島并存的局面。在當前的形勢下,信息資源建設工作中用戶所發揮的作用更加顯著。采用傳統信息組織方式將獲取的信息資源進行有序化處理,在當前信息用戶素質提升以及對信息質量要求更高的情況下,可以說是很難符合要求的[7].傳統的信息組織方式雖然提高了用戶獲取信息的效率,但是加大了用戶從海量檢索信息中進行篩選的難度,也增加了信息系統的檢索量。當前信息服務機構的高速發展更加凸顯出用戶的主體地位,這也表明信息機構應該開展以信息用戶行為為導向的信息服務,注重滿足用戶的信息需求,以提供符合需求的數據資源。
3.2基于信息用戶行為的信息組織原則
在大數據環境下,針對用戶的信息需求與行為進行分析研究,并根據分析結果開展信息資源組織工作,構建有針對性、實用性的信息系統的過程,這就是基于信息用戶行為的信息組織。在信息組織過程中遵循的原則包括以下幾個方面。
3.2.1系統性原則。信息組織具有系統性原則,就是要求信息組織工作的開展應該站在一定的高度上,并且需要把握全局,以保障信息資源的效能得到充分發揮。從哲學的角度來看,整體就相當于系統[8].一個整體可以分為多個部分,并且每一部分的功能不盡相同。同時要求信息組織采用多種信息存儲、組織方法,并且處理好各個組織部門之間的關系,最終將信息資源組織為一個有序的知識系統。
3.2.2易獲取原則。大數據環境下各種類型的信息數據紛繁復雜,并且出現了多種信息檢索工具與信息組織方式。用戶面對多樣的信息與檢索方式,大多會感覺不知所措,也增大了出現檢索錯誤的概率[9].要解決這一問題,就要求信息組織工作以方便用戶為宗旨,堅持易獲取原則。保障信息檢索方式的統一性,保障信息檢索界面清晰、操作簡便,并且構建準確度高、信息傳遞及時的檢索系統,進而滿足信息用戶的需求,提高信息資源的利用效率。
3.2.3標準性原則。大數據環境下信息資源的分布是隨機、無序的,各種圖書館資源、互聯網資源離散分布,為信息管理帶來了一定的難度。開展信息組織工作需要有統一的標準,若信息資源的整理、加工缺乏統一的模式,將導致最終獲得的信息資源更加混亂。
3.2.4全方位原則。當前學科知識更加注重全面性,并且出現多個領域知識的逐步融合。這個特點也要求信息組織具備多方位的延展能力,進而保障信息數據的完整性與豐富性。信息機構在開展信息組織工作時,也需要處理好分工協作、經濟效益等方面的問題,并且在現有知識的基礎上深入研究其歷史發展情況。
3.2.5主動性原則。用戶信息需求的產生并不是一蹴而就的,而是出于學習工作的需要或者在瀏覽頁面信息時逐漸形成的,這就是說,信息需求的產生是隨機的,但是信息用戶的行為是可以預知的。根據用戶的信息需求開展信息組織工作,主動為用戶提供感興趣的信息,不僅能夠及時滿足用戶的信息需求,也有助于促進信息增值。
4大數據環境下基于信息用戶行為的信息組織的實現方法
基于信息用戶行為的信息組織的實現可分為3個部分,即收集用戶信息、組織信息資源、構建信息系統。其中首要也是最為重要的部分就是收集用戶信息,只有了解用戶的行為,明確用戶的需求并把握用戶的心理、行為特征,才能更好地確定信息組織的目標。在了解用戶的行為特點后,結合用戶感興趣的內容來制定信息組織方案,并且確定信息檢索界面的風格與檢索模式。最后構建相應的數據庫,以為用戶獲取與應用信息提供便利。
4.1收集用戶信息
這是大數據背景下開展信息組織的第一步,也是十分關鍵的一步??梢圆捎檬袌稣{研、收集傳統數據點擊流以及查看網絡日志等方式,將大量分散的用戶信息收集起來,構建用戶信息數據庫。然后經過信息整理后進行分析統計,進一步從中了解用戶的信息需求,把握用戶的行為特征與需求方向,最終提取出能夠為信息組織提供指導的有用資源。
信息資源在沒有被使用前是無序分布的,只有用戶獲取并使用這些信息資源后,它們才能真正體現出應有的價值??梢哉f用戶的智力讓這些信息資源得以利用,并且在生產生活中產生更大的效能。具有信息需求與相應的信息素質,并且具有信息獲取、觀察、理解與交流能力的個體,就可以稱之為信息用戶。他們是信息的發布、使用與流通者,也是信息價值的創造者[10].充分搜集并了解信息用戶的需求,這是提升信息資源價值的必要方式。具體實踐過程中需要收集的信息包括用戶的專業、興趣愛好、瀏覽習慣以及信息使用頻率等。在獲取信息后及時分類整理,并借助數據庫技術構建相應的二維表,以便于調出和使用。部分網絡資源需要進行格式轉換,并且建立表格后錄入數據進行統一管理。
4.2組織信息資源
根據收集的用戶信息制定信息資源組織方案,進而為用戶提供易獲取、易理解以及準確的信息資源。信息組織的開展以信息用戶的需求為中心,并且針對特殊任務提供專門的信息。歸納來看,這是一種以信息用戶為中心的服務模式,見圖1.信息組織的覆蓋面十分廣泛,包括互聯網、圖書館、數據庫等媒介上的各種信息數據。開展信息組織前需要首先明確信息來源,通過多種方式進行信息數據搜集、整理,然后將這些轉換為能夠進行信息組織的素材[11].信息資源收集工作與后續信息組織的完整性直接相關,也影響到數據庫建設的豐富性[12].但是數據庫的豐富性并非表明信息資源越多越好,而是需要根據主題整理資料,并去除重復、與主題無關以及虛假的信息。
此外,在對信息資源進行收集整理后,還需要經過信息過濾、標引、重構等過程讓信息資源有序化,并且需要采用信息抽取、更新等方式進行管理,若有需要也會用到數據庫建設技術。對信息資源進行組織的方法多種多樣,常用的方法有數據庫組織法、超文本組織法等[13].這種信息組織方式以用戶的需求為出發點,并以此進行信息資源有序化,同時注重對信息資源的深層次挖掘與利用。由圖1可知,這種信息組織方式在傳統信息組織模式的基礎上進行了改造,并且增加了主動服務模塊與深層次開發與服務模塊,能夠對信息資源進行深入挖掘并構建特定數據庫,也為主動開展服務創造了條件。無論是收集用戶信息,或者組織各類信息資源,其最終目的就是為了提供優質信息服務[14].大數據環境下的信息組織是建立在信息用戶需求的基礎上的,其主要服務內容包括信息檢索、個性化定制、信息推送、在線咨詢等。
4.3構建信息系統
所有的信息資源在經過收集、組織后,只有將它們根據功能的差異進行分類,并且放置于一個系統中,才能保障所有信息資源的有序性與協同作用。這個信息系統的主要對象包括信息服務、用戶、信息組織等,其中用戶是信息組織的中心,也扮演著信息傳播者、使用者的角色。用戶獲取的服務內容不僅包括各類知識資源,也有根據用戶需要設置的特色服務[15].由于用戶所處的信息環境是不斷變化的,這就需要在信息組織過程中及時接受反饋信息,并定期對數據庫內容進行更新。
5結束語
大數據環境下的信息組織是一項復雜的工程,首先需要解決用戶信息的收集與整理問題。通過對信息用戶的需求、行為等進行分析,并結合分析結果構建用戶信息數據庫,能夠為用戶獲取信息資源提供便利,并促進信息資源的增值。當前信息資源在社會生活中發揮的作用日益凸顯,將進一步促進以信息用戶為中心的信息組織的發展。
參考文獻:
[1]孟小峰,慈祥.大數據管理:概念、技術與挑戰[J].計算機研究與發展,2013,(1)。
[2]溫浩宇,李京京.大數據時代的數字圖書館異構數據集成研究[J].圖書館雜志,2013,(9)。
[3]陳臣,陳雙飛.一種基于大數據的數字圖書館高效搜索引擎[J].現代情報,2014,(1)。