藏刊網,職稱文章發表、期刊投稿權威機構

投稿咨詢

投稿在線咨詢

專著咨詢

合著&獨著&編委

編輯在線咨詢

專利咨詢

專利申請&轉讓

編輯在線咨詢

軟著版權

軟著版權

編輯在線咨詢

在線溝通

論文&專著&專利

編輯在線咨詢

微信聊

微信掃一掃

首頁 > 計算機論文 > > 探討運用Wiki技術和主題搜索技術構建新型科普教育平臺
探討運用Wiki技術和主題搜索技術構建新型科普教育平臺
>2024-01-02 09:00:00

1、平臺的功能結構設計

基于社會計算的科普教育平臺是一個面向科普領域的開放平臺,主要由社會化科普信息搜索和科普 Wiki 兩大部分構成。面向科普領域的社會化搜索旨在向用戶提供精準的科普信息檢索,具體包括用戶查詢、科普信息檢索、和社會化結果展示三部分??破?Wiki 模塊利用 Wiki 技術,允許平臺中科普領域任何人添加和修改科普領域的術語詞條,從而日積月累逐漸形成一個完整嚴密的和相對權威的專業科普領域知識庫。該模塊包含用戶管理、問題提交、學習討論、協作共創、頁面管理、科普知識編輯等六部分。此平臺為用戶提供了網上學習交流、協作共創和問題解決的環境,更為透明的搜索服務,允許用戶對搜索結果進行評價,通過對搜索結果進行評分能夠影響對結果的排序。

2、關鍵技術

2.1 社會化科普搜索引擎設。

本文提出的社會化科普搜索引擎主要強調兩方面設計 :\\(1\\)科普領域數據采集器的設計 ;\\(2\\) 社會化檢索機制設計。

2.1.1 科普數據采集器

科普數據采集器主要完成從網絡中抓取科普領域信息并入庫的工作,是一種面向領域的主題爬蟲。圖 2 所示為采集器架構圖。其中,科普領域信息分類器是采集器的核心組件,負責主要的科普網頁分類工作。為提高爬取效率,本文同時添加種子域名判斷組件,用以實現站內頁面預判,減少分類器開銷。

2.1.2 科普領域信息分類算法

科普領域信息覆蓋度大,內容繁雜,比如天文、地理、自然、科技等類別均屬于科普信息。為處理如此粗粒度的分類問題,本文將科普領域信息進行細粒度劃分,提出多細粒度分類器融合的集成分類方法。其基本思想是 :給定一待分樣本,由科普領域細粒度分類器為其打分(0 或 1),最后匯總得分,分值高于某一閾值則認為該樣本屬于科普領域。本文選擇支持向量機 \\(SVM\\) 作為細粒度分類器的分類算法,該算法是目前已知分類效果非常好的一種文本分類算法,具體實現上本文選用開源的 LibSVM。

2.1.3 分類器準確率實驗

本文選擇百度百科作為細分科普領域信息的依據和訓練樣本數據源。本次實驗選擇其開放分類中的天文、歷史、地理、自然、科技等幾個大類作為科普細分類別,從百度百科中抽取各類別下子類的 top-50 的詞條用作訓練樣本,共得到 10000 篇科普類樣本。對于細分非科普類,本文以搜狗互聯網分類語料庫中的非科普類子類目錄為依據,從各子類中隨機選取非科普訓練樣本,同樣得到 10000 篇語料作為非科普類樣本集。兩者合計共 20000篇用作實驗的開放測試數據集。

本文選擇保持(Holdout)方法對各細分分類器進行訓練,其中訓練集和檢驗集的劃分比為 2:1。選擇常用的準確率、召回率和 F-Measure 作為科普分類器的評價指標。經計算,本系統科普領域分類器的各項指標結果如下 :

由此可知,本文基于多細粒度分類器融合的集成分類器具有較高的分類性能,準確率和召回率均達 90% 以上。

2.1.4 基于 Lucene 的社會化檢索機制

Lucene 是一個開放源代碼的全文檢索引擎工具包,提供了完整的查詢引擎和索引引擎,具有索引文件格式獨立于應用平臺、優秀的面向對象架構、分塊索引、語言和文件格式易于擴展等諸多優點?;?Lucene 的檢索框架,本系統將社會化搜索的概念引入到科普信息檢索中,在 Lucene 的相關度評分機制上引入社會因子,使搜索結果更加社會化。社會因子起到人為調節結果權重的作用,允許用戶對搜索結果打分。這種評分機制,使得社會化科普信息搜索能夠更個性化地對結果排序,從而為用戶提供更好的檢索體驗。

2.2 科普 Wiki 的實現

基于維基百科的理念,本系統采用 JSPWiki 引擎設計并實現科普 Wiki 模塊。JSPWiki 本身自帶了身份認證、版本控制等基本功能。在其基礎上,本文添加各項教育相關的子功能,如科普教學中的問題提交功能,允許注冊用戶提交各種科普問題,其他注冊或非注冊用戶可以對所瀏覽問題進行回答。本系統以文本文件的形式存儲用戶產生的各種數據,為了方便用戶權限管理,采用MySQL 存儲用戶信息。

3、小結

基于社會計算,本文綜合運用社會化搜索技術及 Wiki 技術,設計并實現了一個面向科普領域的教育平臺。該平臺主要包括社會化科普信息搜索和科普 Wiki 兩大模塊。在科普領域數據采集中,本文設計采用人工干預與先采集后過濾相結合的爬取策略,提出多細粒度分類器融合的集成分類方法進行數據過濾。實驗表明,該方法對于科普領域具有較高的分類性能。本文在檢索部分引入社會因子,允許用戶對搜索結果打分,從而為用戶提供更個性化的搜索服務。同時基于維基百科的理念,采用 JSPWiki 引擎實現一個科普 Wiki,可供用戶添加、編輯、評論科普信息,自創科普資源,提升自主學習能力。本平臺對于推進全民科普、提升素質教育具有重要意義。(參考文獻與圖標略)

綜合排序
投稿量
錄用量
發行量
教育界

主管:廣西壯族自治區新聞出版局

主辦:廣西出版雜志社

國際:ISSN 1674-9510

國內:CN 45-1376/G4

級別:省級期刊

中國報業

主管:中國報業協會

主辦:中國報業協會

國際:ISSN 1671-0029

國內:CN 11-4629/G2

級別:國家級期刊

中國房地產業

主管:中華人民共和國住房部和...

主辦:中國房地產業協會

國際:ISSN 1002-8536

國內:CN 11-5936/F

級別:國家級期刊

建筑與裝飾

主管:天津出版傳媒集團有限公司

主辦:天津科學技術出版社有限...

國際:ISSN 1009-699X

國內:CN 12-1450/TS

級別:省級期刊

財經界

主管:國家發展和改革委員會

主辦:國家信息中心

國際:ISSN 1009-2781

國內:CN 11-4098/F

級別:國家級期刊

文化月刊

主管:中華人民共和國文化部

主辦:中國文化傳媒集團有限公司

國際:ISSN 1004-6631

國內:CN 11-3120/G2

級別:國家級期刊

期刊在線投稿系統
上傳文件
支持上傳.doc、.docx、.pdf文件
18年國內外學術服務,發表國際文獻請認準藏刊網官網

資深編輯團隊

專業設計投入方案

投稿成功率極高

企業信譽保障

對公交易更安全

人民群眾口碑好

高效投稿流程

審稿快!出刊快!檢索快!

正規刊物承諾

無假刊!無套刊!

投稿成功!

藏刊網提醒您

1.稿件將進入人工審稿階段,審稿后會有編輯聯系您,請保持手機暢通。

2.為避免一稿多投、重刊等現象影響您的發表,請勿再投他刊。

確定

投稿失??!

藏刊網提醒您

由于網絡問題,提交數據出現錯誤,請返回免費投稿頁面重新投稿,謝謝!

確定

藏刊網收錄400余種期刊,15年誠信發表服務。

發表職稱文章,覆蓋教育期刊、醫學期刊、經濟期刊、管理期刊、文學期刊等主流學術期刊。

  投稿郵箱:cangkan@163.com

本站少量資源屬于網絡共享如有侵權請您聯系我們,將在第一時間刪除。

版權 2009-2022 版權所有:河北藏刊文化發展有限公司 工信部備案:ICP備20016223號 冀公網安備13010502002858號

青青青爽不卡一区二区_操婷婷色六月中文字幕_国产精品yjizz视频网_中文无码一级大片_A级毛片100部免费观