藏刊網,職稱文章發表、期刊投稿權威機構

投稿咨詢

投稿在線咨詢

專著咨詢

合著&獨著&編委

編輯在線咨詢

專利咨詢

專利申請&轉讓

編輯在線咨詢

軟著版權

軟著版權

編輯在線咨詢

在線溝通

論文&專著&專利

編輯在線咨詢

微信聊

微信掃一掃

首頁 > 其他論文 > > 智能搜索引擎在政府門戶網站的實現
智能搜索引擎在政府門戶網站的實現
>2022-06-02 09:00:00



一、引言

1999年,中國政府上網工程開啟,政府門戶網站建設逐漸受到各級政府領導和職能部門的重視,其發展歷程可以歸結為起步、普及、深度發展、融合發展四個階段。近年來,政府門戶網站的功能定位從信息發布、政府信息公開、公共服務向智慧政府門戶轉變,在技術、業務、需求、大數據四輪驅動下,網站內容不斷豐富,運維保障機制日趨完善,已經成為構建服務型政府、面向公眾提供服務的重要支撐和主要渠道。
而另一方面,政府網站的整體發展與用戶需求仍存在一定差距,在保障民生、改善企業發展環境等方面的內容和服務匱乏、服務方式單一、服務獲取不便捷和服務體驗差等現象普遍存在,導致政府網站無法滿足用戶日益增長的需求。據《第32次中國互聯網絡發展狀況統計報告》發布的數據,截至2013年6月底,中國網民規模達5.91億,互聯網普及率持續上升至44.1%,網民規模穩居全球第一。這一龐大的社會群體正通過信息技術手段帶來的便利,不斷創造出互聯網時代一個又一個應用高潮,他們對政府網站和政務服務也提出了更高的要求。如何打破傳統政府網站建設模式的瓶頸,打造名副其實的服務型政府網站,更好地滿足公眾的需求,亟需電子政務工作者們不斷地發展政府網站建設理念,創新政府網站服務模式。
以北京市農業局網站為例,自建站以來始終通過“信息公開、公共服務、公共參與”等內容建設服務于農業局職能,致力于提高行政效率和促進職能轉變。然而,在智慧農業和服務型政府建設的背景下,伴隨著新技術的不斷涌現和用戶需求的不斷增長,為滿足新時期的要求,更好地為公眾服務,農業局門戶網站亟需進行深度改版升級。本次改版以更好地服務經濟社會發展、服務百姓生活為主線,以服務內容、服務質量、服務實效、用戶體驗顯著提升為目標,旨在服務集成、業務協同、資源共享、集約建設、渠道創新等方面取得實質性突破,將農業局門戶網站打造成“以用戶為中心的服務型網站”。改版圍繞“農業服務、信息公開、在線辦事、公眾互動”四大主題,建設了包括網上服務基礎平臺、公眾互動平臺、網上服務應用平臺、農業資源信息服務平臺、服務監測平臺等在內的業務應用系統,建立了知識庫與智能搜索問答系統,可全方位、多維度為用戶提供服務。網站信息量大、結構復雜,準確、迅速地定位到具體需求對一般用戶(尤其是初次來訪者)來說難度較大,因此,“搜索”功能強大與否直接決定了用戶體驗的好壞。本次改版采用智能搜索引擎系統較好地解決了這一難題,以此為突破口極大地提升了用戶體驗,是以用戶為中心、打造服務型政府門戶網站的最佳體現,是諸多電子政務工作者轉變理念、創新模式的有益嘗試。本文通過深入分析政府門戶網站搜索引擎應用現狀,展望未來發展趨勢,解析智能搜索引擎工作機制和原理,提出了一條提升用戶體驗的新途徑。

二、政府門戶網站搜索引擎發展現狀分析

總體來看,政府門戶網站目前存在著實用性易用性不足、公眾滿意度低、智能程度低和用戶體驗差等問題。具體到搜索引擎層面,搜索引擎是大多數政府門戶網站的標準配置,也有極個別政府機構將搜索作為訪問網站的第一入口(如北京市海淀區、大連市等)。雖然大部分搜索引擎能在查找某些信息(如新聞)時發揮一定作用,但是,從用戶對搜索引擎的普遍運用方法和對政府網站搜索功能的預期來看,政府門戶網站的搜索功能實在差強人意,種種不便嚴重影響了用戶體驗。

(一)重視程度低,服務響應慢

大多數政府門戶網站對搜索引擎的重視程度非常低,主要體現在如下幾個方面:第一,有些網站改版升級多次,但搜索系統卻改動不大,性能停滯不前,有些搜索引擎甚至成了擺設,根本不可用,輸入任何關鍵詞都返回空白頁;第二,搜索引擎的位置不顯眼,有些放置在首頁頁面中下部,有些隱藏在某個二級欄目下,用戶很難找到;第三,更有甚者,網站不提供搜索功能,如公安部、國家海洋局、國家公務員局等網站,用戶只能用肉眼在海量信息中查找。
通過對有搜索引擎的政府門戶網站的模擬體驗,筆者發現,大多數網站搜索的響應速度較慢,普遍需要0.1秒以上,尤其是需要多次搜索才能找到所需信息時,用戶要有極大的耐心等待搜索結果。而且,大多數網站做不到實時搜索,如某地政府一周前在新聞動態欄目發布的信息,直接在搜索框中輸入信息標題都無法在搜索結果中找到這一信息。

(二)搜索結果雜亂分散,查全率和查準率有待提高

在對有搜索引擎的政府門戶網站的試用過程中,筆者發現,大多數網站搜索引擎的搜索機制比較單一,搜索結果僅能呈現與查詢關鍵詞完全一致的信息,一般按照時間或相關度進行排序,但其他與查詢關鍵詞相關的信息卻無法展示,搜索結果頁也不能按照主題、欄目、發布日期等進行分類查看,在一堆無重點、無序的結果中,用戶很難找到所需信息。隨著政府門戶網站承載的信息量越來越大,目前的搜索引擎根本不能實現整合分散在各子站、各欄目服務資源的目標,更無法進一步對這些服務資源進行深入的開發和利用。
與搜索結果無序、雜亂相比,目前大多數網站搜索引擎的查全率和查準率更讓人擔憂。一方面,搜索結果查不全,在網站上隨機選取一條最新發布的新聞,直接按照標題進行搜索,很多網站的搜索結果都為空;另一方面,搜索結果查不準,以搜索“開設動物診所”為例,絕大多數網站都無法查詢出與“動物診療許可證核發”相關的搜索結果,這種查不準的例子比比皆是。

(三)人性化與智能化程度低,用戶體驗與使用友好度較差

政府門戶網站搜索引擎的人性化和智能化程度主要體現在對用戶訴求的識別準確率上,能從分詞、糾錯、模糊檢索、拼音和繁體檢索等各個方面進行判斷,直接影響著用戶體驗的評價??傮w來看,目前大部分政府門戶網站的搜索引擎找不到用戶的真正所需,難以識別用戶訴求。
在分詞方面,很多分詞不夠準確,很多專有名詞并未被更多重視。以搜索“華人”為例,很多網站的搜索結果中都有與“中華人民共和國”有關的信息,與用戶需求不符。在糾錯方面,很多用戶由于各種原因可能會輸入一些錯別字進行檢索,系統不會進行智能識別和轉換,搜索結果大多為空。在模糊檢索方面,很多用戶對政府的專用詞匯不甚了解,會用相對口語化的詞語進行搜索,如“申請拖拉機號牌”“糧種買賣”等,大多數網站的搜索結果都為空。在拼音和繁體檢索方面,很多網站都不支持以這兩種形式進行檢索。

三、政府門戶網站搜索引擎的發展趨勢

從搜索引擎的功能定位來看,其發展經歷了三個階段(參見表1)。
結合搜索引擎的總體發展背景,筆者認為,在政府門戶網站領域,未來搜索引擎的范圍將極大化擴展,搜索引擎將成為政府服務公眾的首要渠道、面向用戶聚合展示知識的重要窗口、為用戶提供個性化服務的主要途徑。

(一)政府服務公眾的首要渠道

據《第32次中國互聯網絡發展狀況統計報告》統計,截至2013年6月底,中國搜索引擎網民規模為4.70億,較2012年底增長了1928萬人,半年增長率為4.3%,網民使用率高達79.6%。搜索引擎作為互聯網的基礎應用,是網民獲取信息的重要工具,其使用率自2010年后始終保持在80%左右。通過搜索引擎獲取信息已經成為絕大多數用戶的習慣行為,不會輕易改變,而且這種習慣必將延續到用戶訪問政府門戶網站的經歷中。另外,隨著政府門戶網站建設時間和信息量的不斷增長,各種政務服務必將被淹沒在眾多“大數據”中,讓用戶無所適從。因此,搜索引擎必須也一定會成為政府門戶網站建設中最重要的一環,成為用戶通過網站了解政府信息、獲取政務服務的第一入口。隨著搜索入口不斷向前端遷移,政府行業“搜索門戶化”極有可能成為現實。

(二)聚合展示知識的重要窗口

一般來說,大型搜索引擎門戶,如百度、Google、搜搜等,因為用戶的不確定性較大,很難實現且不必實現比較細致的分類搜索,只需按照網頁、圖片、視頻等進行簡單分類即可。再進一步,可以按照新聞、檔案(介紹)、政策等進行分類,如中國搜索在某些關鍵詞檢索時所呈現的。而在政府門戶網站上,用戶是基本一定的,而且用戶的主要需求也是可推測的,提供雜亂無序的搜索結果或不能對結果進行細致分類,對政府門戶網站搜索引擎來說是比較失敗的,完全不能滿足用戶的預期和需求。
據艾瑞咨詢公司數據顯示,搜索引擎發展的趨勢之一是對結果進行篩選及聚合,以提升搜索結果質量,使用戶更易觸達所需信息。試圖對搜索結果進行“預篩選”,從海量的搜索結果中篩選出高質量、功能性強、指向性明確的信息,并將其以聚合的形式向用戶呈現,以便用戶快速獲取所需結果??鐧谀?、跨分類整合網站中的各類服務資源,以更好的形式聚合展現給用戶,在滿足客戶基本需求的同時展示更多相關知識幫助客戶作出決策,將是未來政府門戶網站搜索引擎的發展趨勢之一。當搜索引擎能夠將網站的所有信息進行有序組織和合理呈現時,政府門戶網站將不再需要“專題”,依靠人工篩選海量信息、費心設計制作專題的時代也終將結束。

(三)個性化服務的主要途徑

在政府門戶網站上,個性化服務目前主要通過APP、RSS訂閱、市民主頁等途徑實現,雖然基本能滿足一些“群體”的共性需求,但是,這些途徑需要電子政務工作者定期維護,因此信息實效性較差,用戶體驗不夠好。
搜索引擎的發展趨勢之一是“個性化搜索”和“情境搜索”?!皞€性化搜索”的核心是根據用戶以往在政府門戶網站上的瀏覽記錄、辦事記錄、搜索歷史及用戶在其他社交網絡中的博客、微博等內容,建立一套準確的個人興趣模型,從這些信息中提取出關鍵詞及其權重?!扒榫乘阉鳌钡暮诵氖菍崟r感知人與人所處的環境,針對“此時此地此人”來建立模型,試圖理解用戶查詢的目的和訴求。將情境搜索與個性化搜索結合起來,未來政府門戶網站搜索引擎就能夠依據模型,按照用戶本次檢索詞為用戶提供獨具特色、針對性強、分類明晰、重點突出的搜索結果,實現從為“人民”服務到為“人人”服務的轉變,大大提高用戶的滿意度。

(四)搜索能力極大化提高

在傳統的數據庫系統中,信息的檢索一般以數值和字符型為主,而在多媒體數據庫中集成的圖像、視頻、音頻等非格式化信息,具有數據量大、信息不定長、結構復雜等特點,難以用傳統的搜索引擎進行檢索。通過對有搜索引擎的政府門戶網站的模擬體驗,筆者發現,大多數網站目前僅能實現對信息的全文檢索,支持對附件、對流媒體進行檢索的少之又少。
然而,隨著信息技術的不斷發展,QBIC系統、Visual Seek系統、Video Q、TV-FI、JJACOB、Informmedia等視頻檢索系統相繼出現,語義級音頻信息檢索技術也取得突破,已有個別政府門戶網站開展了針對附件檢索的初步嘗試。不難預見,未來政府門戶網站可能會直接與用戶對話,“聽取”用戶訴求,然后智能地搜尋網站資源,支持對Word、Excel、PowerPoint、PDF等附件以及音視頻內容的檢索,最終為用戶合理呈現所需的信息。

四、智能搜索引擎在政府門戶網站的實現

與上述諸多政府門戶網站一樣,北京市農業局也面臨類似挑戰,本著“一切為了用戶體驗”的全新建站理念,通過采用全新的內容管理系統和智能搜索引擎系統,改版升級后的農業局網站煥然一新,用戶體驗滿意度不斷提高。

(一)智能搜索引擎系統整體框架及基本工作機制

智能搜索引擎系統總體分為四層:信息層、采集層、加工層、用戶層。信息層支持各種結構化數據和非結構化數據,采集層負責從信息層進行數據采集,加工層對采集的信息進行處理,用戶層為用戶提供相應的搜索服務(參見圖1)。
智能搜索引擎主要通過采集器、索引器和檢索器運作,其工作機制如圖2所示。智能檢索功能包括全文索引和強大的信息搜索功能,采用多線程并發搜索技術、智能分詞技術和個性化配置技術實現對于標題、文本、HTML、RTF、Office文檔、PDF等多種文件和數據庫內容的全文搜索。
采集器是通常所說的“網絡蜘蛛/爬蟲”或“機器人”程序,能夠不間斷地執行某種任務。網絡蜘蛛是通過網頁的鏈接地址來尋找網頁,從網站某一個頁面\\(通常是首頁\\)開始,讀取網頁的內容,找到在網頁中的其他鏈接地址,然后通過這些鏈接地址尋找下一個網頁,這樣一直循環下去,直到把這個網站所有的網頁都抓取完為止。
索引器的功能是理解搜索器所搜集的信息,從中抽取出索引項,用于表示文檔及生成文檔庫的索引表。
檢索器的功能是根據用戶的查詢在索引庫中快速檢索出文檔,進行文檔與查詢的相關度評價,對將要輸出的結果進行排序,并實現某種用戶相關性反饋機制。首先,檢索器采用與索引文檔相似的方法來處理用戶查詢請求;然后在索引庫中進行搜尋,提取滿足條件的網頁;最后采用特定的算法計算網頁和關鍵詞的相關度,并將所有網頁按照相關度遞減的順序排列返回給用戶。用戶界面的作用就是提供用戶輸入查詢、顯示查詢結果及提供用戶相關性反饋機制的接口,其目的在于方便用戶使用搜索引擎,高效率、多方式地從搜索引擎中得到有效、及時的信息。

(二)智能引導用戶找到所需信息

根據筆者對互聯網搜索引擎及政府門戶網站搜索引擎的研究,發現用戶經常使用拼音輸入或者直接選擇關聯詞語中的關鍵詞進行搜索。為此,在系統研發過程中提供了智能引導功能。智能搜索引擎系統具有自動糾錯功能,對于經常性輸入錯誤的詞語,提示按正確詞語作為關鍵詞進行搜索,減少重復輸入操作。同時,很多人在輸入檢索詞時,因為沒有切換輸入法可能直接輸入一大串拼音。為了減少重復輸入,智能搜索引擎系統還提供拼音搜索功能,將用戶輸入的拼音等同于中文內容,從而提高檢索效率。此外,系統還提供關鍵詞聯想功能。即當用戶輸入某個檢索詞的一部分時,可自動聯想到與該輸入詞相關的詞語,方便用戶直接選擇。

(三)框計算支持當前頁直接運行

傳統政府門戶網站搜索引擎只是以簡單的信息列表形式對搜索結果進行展示,而對許多用戶而言,搜索的目的是為了使用對應的服務。在傳統模式下,用戶首先需要對搜索結果中的信息進行篩選,然后跳轉到對應頁面享受相應的服務。智能搜索引擎系統則通過定制關聯規則和搜索引擎應用容器,對應用服務在搜索結果頁面進行展示,包括應用服務的填寫、查詢、辦理等,用戶可以在搜索結果當前頁中直接使用相應服務,可大大提高用戶的搜索效率。

(四)智能識別“百姓體”關鍵詞

通過認真分析政府網站用戶的行為模式,我們發現,找不到信息的很大原因在于社會公眾對政府業務的認知障礙:一是政府網站的信息分類用戶看不懂;二是各個服務事項的稱謂過于專業,用戶無法理解。這樣很多用戶可能會輸入白話文(百姓體)直接進行搜索,而很多辦事事項因其專業性描述特點,使得系統根本無法搜索出結果。比如輸入“買賣獸藥店”,對應的辦事事項是“開辦獸藥經營企業許可”,如果通過關鍵詞匹配就很有可能檢索不到相關內容。
為了解決上述問題,智能搜索引擎系統通過收集用戶在政府網站的搜索關鍵詞,并抓取所輸入搜索關鍵詞搜索得到的網頁,根據搜索關鍵詞和網頁中的關鍵詞的相似度,查詢出與搜索關鍵詞相似的網頁中的關鍵詞,并將所搜網頁中的關鍵詞和所輸入搜索關鍵詞作為白話詞,根據語義分析和概率統計對所述白話詞與官方詞語的對應關系進行篩選,并依據所述對應關系生成百姓體詞庫。智能搜索引擎系統接收用戶輸入的白話詞后,會查詢所述百姓體詞庫,獲取與用戶輸入的白話詞相匹配的官方詞語,并依據所獲取的官方詞語搜索網站。這樣搜索結果為空的現象將大大減少,網站的友好度、人性化程度大大提升。

(五)聚合提供與關鍵詞相關的知識圖譜

政府門戶網站大多積累了豐富的信息和服務資源,而這些信息和服務資源往往按照部門、政務主題、題材等方式進行分類,且有些信息和服務標題比較專業,甚至晦澀難懂,致使目前搜索引擎檢索不到。智能搜索引擎將知識圖譜技術應用于政府網站,檢索結果集和關鍵詞自動進行關聯,使得檢索結果更廣泛、更準確。
當用戶對政府門戶網站中的信息或服務進行搜索時,通過模板庫、模板庫中的模板和模板包括的要素類別,以及信息索引庫將與查詢關鍵詞有關聯的信息內容或鏈接一并通過展示模板展示給查詢用戶(參見圖3)。由此,實現了與查詢關鍵詞相關聯的信息全面展示給查詢用戶,解決了現有搜索引擎在對政府門戶網站中的信息進行搜索時,只能給出摘要中包含有查詢關鍵詞的鏈接,不能將與查詢關鍵詞相關聯的一系列信息智能地進行聚合后,一并提供給查詢用戶的問題。
(六)智能排序和分類搜索精準定位用戶需求

用戶在搜索引擎上進行信息查詢時,返回結果過多就會使用戶不得不繼續在結果中進行“人工篩選”,而用戶主要關注的是搜索結果是否符合自己的需求。通過智能排序,與一般用戶需求緊密相關的結果就會自動靠前顯示,基本不需要用戶重復篩查。另外,該系統還提供分類搜索,用戶在搜索結果頁面可以根據自身需求自主選擇不同類別,有助于更快、更準地找到所需信息。
傳統的政府網站搜索引擎僅僅簡單地使用了關鍵詞匹配相關度和更新時間兩個維度來進行搜索結果排序,智能搜索創新性地采用了關鍵詞匹配相關度、更新時間、業務權重、當前社會熱點、頁面熱度、搜索結果點擊率的多維度排序算法模型,是最科學合理的政府業務排序算法,可給出最佳排序結果。

(七)實時搜索保障搜索及時性與查全率

傳統搜索引擎采用“網絡蜘蛛”的方式對網站數據進行采集,此種方式采集周期較長,當網站數據進行修改后無法在搜索引擎中進行實時搜索。智能搜索引擎系統后臺數據更新采用主動觸發(Trigger)技術,系統管理人員可以根據網站數據更新情況配置觸發器的最短更新周期,可達到實時搜索效果。即網站只要發布了最新文章,通過實時觸發機制,第一時間(如5分鐘內)即可將網站數據導入到檢索系統中,確保搜索結果與網站內容更新保持一致。

五、小結

通過采用智能搜索引擎系統,北京市農業局用戶體驗迅速提升,站內可見性也得到較大優化,用戶通過搜索引擎獲取服務信息和資源更加迅速、便捷,網站資源得到了較充分的整合與利用。如前所述,只要把握“以用戶為中心”的原則,服務型政府門戶網站建設很容易解決。實際上,整個政府門戶網站搜索引擎的前臺體驗過程非常簡單,即“用戶輸入關鍵詞→系統進行識別→系統給出搜索結果”三個環節,服務型政府門戶網站搜索引擎則需要在這些環節中充分體現人性化和智能化的特點,從而消除社會公眾對政府業務的認知障礙。具體如在用戶輸入關鍵詞時給出人性化的引導(拼音聯想、關鍵詞聯想),對用戶輸入的錯誤關鍵詞給出糾正,系統對輸入關鍵詞進行識別時提供模糊智能匹配(即提供用戶的口頭用語與政府專業詞匯間的智能匹配),搜索結果中將用戶所關注的相關知識進行聚合展示。毫無疑問,這樣一個以用戶為中心的產品能輕易破解當前政府門戶網站信息和服務獲取難的問題。
任何事物的發展都是在曲折中前進,中國電子政務的發展在不同階段都存在著特定的難以逾越的困難和阻礙,而服務型政府建設工作的推進更亟需電子政務工作者的大力支撐,唯有采用創新的思維和理念才能破解服務和信息供求之間的矛盾。如上文對政府網站搜索引擎存在的問題和解決之道所闡述的,看似不大的一個創新即可在很大程度上提升政府門戶網站的服務水平,解決許多社會公眾的實際問題。因此,只要政府門戶網站管理者堅持“以用戶為中心”的創新服務理念,“服務型政府網站”將不再遙不可及!

參考文獻:
[1]于施洋,王建冬,劉合翔. 基于用戶體驗的政府網站優化:提升搜索引擎可見性[J]. 電子政務,2012\\(8\\).
[2]周敏. 中國省級政府門戶網站設計調查分析[J]. 圖書館學研究,2009\\(7\\).

綜合排序
投稿量
錄用量
發行量
教育界

主管:廣西壯族自治區新聞出版局

主辦:廣西出版雜志社

國際:ISSN 1674-9510

國內:CN 45-1376/G4

級別:省級期刊

中國報業

主管:中國報業協會

主辦:中國報業協會

國際:ISSN 1671-0029

國內:CN 11-4629/G2

級別:國家級期刊

中國房地產業

主管:中華人民共和國住房部和...

主辦:中國房地產業協會

國際:ISSN 1002-8536

國內:CN 11-5936/F

級別:國家級期刊

建筑與裝飾

主管:天津出版傳媒集團有限公司

主辦:天津科學技術出版社有限...

國際:ISSN 1009-699X

國內:CN 12-1450/TS

級別:省級期刊

財經界

主管:國家發展和改革委員會

主辦:國家信息中心

國際:ISSN 1009-2781

國內:CN 11-4098/F

級別:國家級期刊

文化月刊

主管:中華人民共和國文化部

主辦:中國文化傳媒集團有限公司

國際:ISSN 1004-6631

國內:CN 11-3120/G2

級別:國家級期刊

期刊在線投稿系統
上傳文件
支持上傳.doc、.docx、.pdf文件
18年國內外學術服務,發表國際文獻請認準藏刊網官網

資深編輯團隊

專業設計投入方案

投稿成功率極高

企業信譽保障

對公交易更安全

人民群眾口碑好

高效投稿流程

審稿快!出刊快!檢索快!

正規刊物承諾

無假刊!無套刊!

投稿成功!

藏刊網提醒您

1.稿件將進入人工審稿階段,審稿后會有編輯聯系您,請保持手機暢通。

2.為避免一稿多投、重刊等現象影響您的發表,請勿再投他刊。

確定

投稿失??!

藏刊網提醒您

由于網絡問題,提交數據出現錯誤,請返回免費投稿頁面重新投稿,謝謝!

確定

藏刊網收錄400余種期刊,15年誠信發表服務。

發表職稱文章,覆蓋教育期刊、醫學期刊、經濟期刊、管理期刊、文學期刊等主流學術期刊。

  投稿郵箱:cangkan@163.com

本站少量資源屬于網絡共享如有侵權請您聯系我們,將在第一時間刪除。

版權 2009-2022 版權所有:河北藏刊文化發展有限公司 工信部備案:ICP備20016223號 冀公網安備13010502002858號

青青青爽不卡一区二区_操婷婷色六月中文字幕_国产精品yjizz视频网_中文无码一级大片_A级毛片100部免费观