- 相關(guān)推薦
高校圖書館信息檢索課程教學(xué)的改革
第1篇:高校圖書館信息檢索課程教學(xué)改革
一、高校信息檢索課程教學(xué)現(xiàn)狀
隨著信息技術(shù)的不斷發(fā)展以及信息的快速更新,信息檢索課在提高學(xué)生的信息情報(bào)意識(shí),培養(yǎng)大學(xué)生自主學(xué)習(xí)能力方面的作用更加顯著,同時(shí)有利于全面提升大學(xué)生綜合解決問(wèn)題的能力。掌握信息檢索方法、技能和技巧已成為當(dāng)代大學(xué)生更新知識(shí)的重要手段,所以,各大高校應(yīng)將提高大學(xué)生的信息檢索能力放在重要位置,開(kāi)設(shè)專業(yè)的信息檢索課程。圖書館信息檢索課程具有很強(qiáng)的實(shí)用性,首先表現(xiàn)在拓寬了大學(xué)生獲取知識(shí)和信息的渠道;其次表現(xiàn)在為學(xué)生提供了獲得專業(yè)最新動(dòng)態(tài)的途徑;最后表現(xiàn)在為學(xué)生的畢業(yè)論文寫作提供了全面的素材基礎(chǔ)。所以,高校應(yīng)該積極開(kāi)展信息檢索課程,培養(yǎng)學(xué)生終身學(xué)習(xí)的能力。
目前,手工信息檢索已經(jīng)逐漸淡出了高校信息檢索教學(xué),計(jì)算機(jī)借助Internet網(wǎng)進(jìn)行信息檢索的技術(shù)已經(jīng)普遍應(yīng)用。但是,部分高校教師和學(xué)生的觀念還沒(méi)有轉(zhuǎn)變,沒(méi)有與時(shí)俱進(jìn),教學(xué)手段相對(duì)比較落后,教師的專業(yè)素養(yǎng)還有待提高,學(xué)校整體對(duì)信息檢索課程的重視程度不夠。信息檢索課程中存在的問(wèn)題也逐漸顯露出來(lái),大學(xué)生的信息敏感度和知識(shí)收集能力有待提高,迫切需要掌握最新的信息檢索技術(shù)。
二、信息檢索教學(xué)存在的問(wèn)題
1.信息檢索課程授課范圍有限,大部分學(xué)生不能掌握信息檢索技術(shù)。從目前高校開(kāi)設(shè)的信息檢索課程來(lái)看,多數(shù)高校開(kāi)設(shè)的信息檢索課程范圍還比較有限,經(jīng)常出現(xiàn)圖書館老師無(wú)課可講的狀態(tài)。同時(shí),真正學(xué)習(xí)和掌握信息檢索知識(shí)的學(xué)生也非常有限。作為現(xiàn)代化信息教育的主要途徑,信息檢索課在提高大學(xué)生綜合素質(zhì)方面具有重要作用,但是大多數(shù)學(xué)生沒(méi)有熟練掌握信息檢索技術(shù),對(duì)信息檢索工具的掌握和運(yùn)用了解不夠深入,不具備準(zhǔn)確獲取信息資源的能力,對(duì)信息的重要性缺乏認(rèn)識(shí)。部分高校領(lǐng)導(dǎo)、教師以及學(xué)生對(duì)信息檢索課重視程度不夠,使得開(kāi)課范圍十分有限,這也導(dǎo)致信息檢索課程陷入一種無(wú)足輕重的地位。因此,高校應(yīng)該根據(jù)自己學(xué)校的實(shí)際情況,逐漸擴(kuò)大授課范圍,將信息檢索課程定位為必修課程,進(jìn)一步普及信息檢索知識(shí),讓更多的學(xué)生可以通過(guò)信息檢索課程獲取專業(yè)知識(shí)和專業(yè)動(dòng)態(tài)。所以,如何擴(kuò)大課程的普及范圍就成為高校亟待解決的問(wèn)題。
2.信息檢索課程在高校中的受重視程度比較低。信息檢索課在大多數(shù)高校被設(shè)為選修課的原因有:一方面,信息檢索課程不受學(xué)生重視,選擇這門課程的學(xué)生比較少。另一方面,高校對(duì)信息檢索課程的軟硬件投入非常低,專業(yè)教師更是少之又少。大多數(shù)信息檢索課教師由圖書館工作人員兼任,他們?nèi)狈I(yè)的教學(xué)方法。以上因素嚴(yán)重制約了大學(xué)信息檢索課程的發(fā)展。
3.學(xué)生忽視信息檢索課程,導(dǎo)致教學(xué)達(dá)不到預(yù)期效果。高校信息檢索課程涉及的知識(shí)范圍比較廣,這對(duì)教師的專業(yè)素質(zhì)要求比較高,同時(shí)由于課程的專業(yè)術(shù)語(yǔ)較多,學(xué)生很難理解和接受,導(dǎo)致課程教學(xué)達(dá)不到預(yù)期效果。在大多數(shù)高校內(nèi),信息檢索課往往采用傳統(tǒng)課堂講授和上機(jī)教學(xué)兩種方式,而且上機(jī)教學(xué)模式單一,主要以教師的講解為核心,學(xué)生只能被動(dòng)接受。這不利于學(xué)生的自主學(xué)習(xí),使得學(xué)生的學(xué)習(xí)積極性不高。由于沒(méi)有統(tǒng)一教材,學(xué)生無(wú)法預(yù)習(xí)和復(fù)習(xí),也使得學(xué)生在潛意識(shí)中忽視信息檢索課程。因此,使得整個(gè)檢索課程的教學(xué)效果較低。
4.信息檢索課程在教學(xué)計(jì)劃中得不到重視。在高校的教學(xué)安排中,信息檢索通常安排的課時(shí)較少,大多數(shù)是合班課,沒(méi)有精細(xì)的小班授課,再加上學(xué)生的課程實(shí)習(xí)場(chǎng)地有限,使得學(xué)生對(duì)信息檢索課程的興趣也逐漸淡化,課程開(kāi)展的根本目的得不到實(shí)現(xiàn)。
5.信息檢索課程教學(xué)效果的評(píng)價(jià)方式比較單一。學(xué)校開(kāi)設(shè)信息檢索課程是為了培養(yǎng)大學(xué)生對(duì)信息檢索技能的掌握能力,提高大學(xué)生的綜合學(xué)習(xí)能力和自主解決問(wèn)題的能力。但是在實(shí)際的教學(xué)實(shí)踐過(guò)程中,教師和學(xué)生都以考試過(guò)關(guān)為最終目的,教學(xué)僅僅達(dá)到了理論層面,而忽略了對(duì)學(xué)生實(shí)踐能力的培養(yǎng)和考核,課程的實(shí)用價(jià)值也在不斷降低。
三、信息檢索課程教學(xué)的改進(jìn)與創(chuàng)新
1.配備專業(yè)師資隊(duì)伍,提高教學(xué)質(zhì)量。對(duì)于開(kāi)展信息檢索課程的圖書館來(lái)說(shuō),在開(kāi)設(shè)課程之前,要統(tǒng)一對(duì)講授信息檢索課程的教師進(jìn)行嚴(yán)格培訓(xùn)和考核;定期組織召開(kāi)信息檢索課的教學(xué)研討會(huì),教師之間相互學(xué)習(xí)和交流教學(xué)經(jīng)驗(yàn);鼓勵(lì)教師積極申報(bào)和參與學(xué)校的教學(xué)和科研立項(xiàng),用教師自己掌握的信息檢索技術(shù)來(lái)解決教學(xué)和科研立項(xiàng)中的實(shí)際問(wèn)題;通過(guò)舉辦講座、論壇和走訪的形式,加強(qiáng)與學(xué)校各學(xué)院系老師的溝通,普及和宣傳信息檢索課程的重要意義。提高學(xué)校領(lǐng)導(dǎo)以及教師對(duì)信息檢索課程的重視程度,尤其是硬件和軟件配置的提高。硬件配置可以在短時(shí)間內(nèi)獲得改善,但是軟件配置,尤其是師資力量的配備和能力培養(yǎng)是一個(gè)長(zhǎng)期的過(guò)程。團(tuán)隊(duì)教師的個(gè)人素養(yǎng)關(guān)系著課程教學(xué)的質(zhì)量,要積極引進(jìn)專業(yè)團(tuán)隊(duì),開(kāi)發(fā)專業(yè)教師的個(gè)人潛力,最終打造出高能力的專業(yè)授課團(tuán)隊(duì)。
2.提高學(xué)生獲取科學(xué)信息的實(shí)踐能力。在教學(xué)過(guò)程中,教師不能局限于教學(xué)大綱,而是必須在教學(xué)大綱的基礎(chǔ)上,結(jié)合教師的計(jì)劃和學(xué)生的接受能力,提升教學(xué)標(biāo)準(zhǔn)。教學(xué)不能以完成教學(xué)大綱為最終目標(biāo),而是必須以提高學(xué)生的實(shí)踐能力為最終目標(biāo),要讓學(xué)生學(xué)以致用,切實(shí)提高學(xué)生的信息獲取能力。
3.靈活運(yùn)用教材,實(shí)現(xiàn)課程教學(xué)的創(chuàng)新。信息檢索課程是非常實(shí)用的一門學(xué)科,檢索技術(shù)隨著網(wǎng)絡(luò)技術(shù)的發(fā)展而不斷提高。教學(xué)是以教材為基礎(chǔ)的,但不能局限于教材。為實(shí)現(xiàn)信息檢索課程教學(xué)的創(chuàng)新,教師應(yīng)根據(jù)學(xué)科特點(diǎn),將教材靈活運(yùn)用起來(lái),結(jié)合自己的教研和科研立項(xiàng)實(shí)例講解知識(shí)點(diǎn),整合教學(xué)資源,力爭(zhēng)實(shí)現(xiàn)教學(xué)水平的提高,為學(xué)生適應(yīng)現(xiàn)代網(wǎng)絡(luò)信息提供途徑。
4.為不同層次的學(xué)生設(shè)定不同的課程內(nèi)容。學(xué)校要針對(duì)不同層次的學(xué)生設(shè)定不同的課程內(nèi)容,教師應(yīng)該重視學(xué)生檢索技能的培訓(xùn),促進(jìn)學(xué)生綜合能力的提高。教師在安排課程的過(guò)程中,要結(jié)合不同層次學(xué)生的水平以及學(xué)習(xí)能力,積極調(diào)整教學(xué)計(jì)劃,不同年級(jí)學(xué)生的教學(xué)內(nèi)容要有不同的重點(diǎn)。例如,在本科低年級(jí)可以重點(diǎn)安排理論性課程以及一些操作容易的內(nèi)容,因?yàn)榈湍昙?jí)學(xué)生對(duì)文獻(xiàn)檢索的需求比較少,檢索的內(nèi)容是比較簡(jiǎn)單的。針對(duì)高年級(jí)學(xué)生安排課程時(shí),要多涉及一些專業(yè)知識(shí)的教授,因?yàn)楦吣昙?jí)學(xué)生的專業(yè)課程已經(jīng)學(xué)習(xí)到了一定程度,大部分學(xué)生的外語(yǔ)能力以及專業(yè)知識(shí)素養(yǎng)都有了很大提高,可以檢索一些專業(yè)的內(nèi)容或者國(guó)外文獻(xiàn),檢索需求比較大。
5.不斷改進(jìn)教學(xué)方式方法,提高學(xué)生對(duì)知識(shí)的運(yùn)用能力。教師在信息檢索課程的教授過(guò)程中,要結(jié)合實(shí)際情況,不斷改進(jìn)教學(xué)方式方法,不僅要傳授基礎(chǔ)知識(shí),而且要提高學(xué)生對(duì)知識(shí)的運(yùn)用能力,重視對(duì)學(xué)生實(shí)踐能力的培養(yǎng)。例如,教師在教學(xué)過(guò)程中,要加強(qiáng)演示環(huán)節(jié)力度,應(yīng)該通過(guò)對(duì)論文或者課題的信息收集的示范來(lái)教授學(xué)生實(shí)際應(yīng)用技能。同時(shí)可以布置一個(gè)課題,讓學(xué)生根據(jù)自己所學(xué)到的知識(shí)進(jìn)行查詢,并通過(guò)集體匯報(bào)的方式進(jìn)行成果檢驗(yàn),為學(xué)生創(chuàng)造交流的機(jī)會(huì)。
四、結(jié)語(yǔ)
高校開(kāi)展信息教育,必須重視信息檢索課程。網(wǎng)絡(luò)技術(shù)的發(fā)展促進(jìn)了文獻(xiàn)檢索的發(fā)展,同時(shí)也對(duì)文獻(xiàn)檢索提出了新的要求,信息檢索課程的教學(xué)必須與時(shí)俱進(jìn),教學(xué)方法和手段以及教學(xué)內(nèi)容都要與科學(xué)技術(shù)的發(fā)展接軌,這樣學(xué)校才能培養(yǎng)出具備現(xiàn)代信息應(yīng)用技能的綜合型人才。
第2篇:對(duì)語(yǔ)義網(wǎng)格及其在數(shù)字圖書館信息檢索中應(yīng)用的探討
數(shù)字圖書館在快速發(fā)展的同時(shí),其種種缺陷也逐漸暴露,如檢索服務(wù)器智能化程度低、返回大量無(wú)關(guān)結(jié)果,不同系統(tǒng)之間互操作困難、資源難于共享、形成一個(gè)個(gè)信息孤島等問(wèn)題。這是因?yàn)椋蟛糠志W(wǎng)頁(yè)上的內(nèi)容設(shè)計(jì)是供人閱讀的,并不能使機(jī)器理解。利用HTML語(yǔ)言,計(jì)算機(jī)雖能熟練地解析網(wǎng)頁(yè)的版面,知道哪里是標(biāo)題,哪里有與其他頁(yè)面的鏈接,但卻無(wú)法理解網(wǎng)頁(yè)內(nèi)容,如無(wú)法區(qū)別人名和地名等,因?yàn)闆](méi)有可靠的方法來(lái)處理其中的語(yǔ)義。于是出現(xiàn)了把語(yǔ)義網(wǎng)和網(wǎng)格技術(shù)應(yīng)用到數(shù)字圖書館建設(shè)的動(dòng)向。語(yǔ)義網(wǎng)在數(shù)字圖書館中的應(yīng)用,可對(duì)信息資源進(jìn)行語(yǔ)義標(biāo)注,提供基于語(yǔ)義的資源瀏覽與檢索。而在數(shù)字圖書館中應(yīng)用網(wǎng)格技術(shù),則為整合分布、異構(gòu)、自治的數(shù)字資源,實(shí)現(xiàn)對(duì)資源的透明調(diào)用提供了可能。但從數(shù)字圖書館要求基于語(yǔ)義的資源整合來(lái)看,上述兩種技術(shù)各有其局限性[1]。
網(wǎng)格雖為我們描繪了一幅誘人的藍(lán)圖,即遍布世界各地的資源都可“即插即用”。但現(xiàn)實(shí)情況與目標(biāo)存在較大差距,實(shí)現(xiàn)網(wǎng)格的目標(biāo)并不容易,網(wǎng)格還面臨著許多問(wèn)題和挑戰(zhàn)。當(dāng)前網(wǎng)格缺乏機(jī)器可讀可理解的數(shù)據(jù)語(yǔ)義,缺乏人和機(jī)器很好地合作的支撐,機(jī)器難以處理異構(gòu)資源,難以聯(lián)合、再利用信息,難以靈活協(xié)作、高度易用和無(wú)縫自動(dòng)化,難以根據(jù)用戶的需求自動(dòng)地生產(chǎn)知識(shí)。而語(yǔ)義網(wǎng)雖然實(shí)現(xiàn)了計(jì)算機(jī)可理解的數(shù)據(jù)語(yǔ)義問(wèn)題,但難以實(shí)現(xiàn)互聯(lián)網(wǎng)上各種資源(包括硬件和軟件資源)的共享,難以滿足日益增長(zhǎng)的計(jì)算需求[2]。
數(shù)字圖書館需要一個(gè)新型的技術(shù)基礎(chǔ),這個(gè)基礎(chǔ)應(yīng)充分支持虛擬資源體系在語(yǔ)義層面上的集成,充分支持語(yǔ)義描述,為實(shí)現(xiàn)虛擬資源體系的語(yǔ)義導(dǎo)航、語(yǔ)義查詢以及推理機(jī)提供可行性,于是語(yǔ)義網(wǎng)格的概念被提出。
1語(yǔ)義網(wǎng)的基本概念
1.1語(yǔ)義網(wǎng)的體系結(jié)構(gòu)
2001年,TimBerners-Lee提出語(yǔ)義網(wǎng)的概念[3],其出發(fā)點(diǎn)是通過(guò)改變現(xiàn)有互聯(lián)網(wǎng)依靠文字信息來(lái)共享資源的模式,利用本體來(lái)描述語(yǔ)義信息,達(dá)到語(yǔ)義級(jí)的共享。語(yǔ)義網(wǎng)構(gòu)建于自定義標(biāo)記的XML和數(shù)據(jù)表示靈活的RDF之上。
①Unicode和URI層,是整個(gè)語(yǔ)義Web的基礎(chǔ)。Unicode處理資源的編碼,保證所使用的是國(guó)際通用字符集。URI負(fù)責(zé)標(biāo)識(shí)語(yǔ)義網(wǎng)上所有的對(duì)象和資源,為精確的信息檢索提供基礎(chǔ)。
②XML+NameSpace+XmlSchema,XML層具有名稱空間(NameSpace)和XMLSchema,XML置標(biāo)語(yǔ)言將網(wǎng)上資源信息的結(jié)構(gòu)、內(nèi)容與表現(xiàn)形式相分離,可確保語(yǔ)義網(wǎng)的定義,并支持與其他基于XML的標(biāo)準(zhǔn)進(jìn)行無(wú)縫集成。XML讓每個(gè)人都能通過(guò)自己創(chuàng)建的標(biāo)簽,來(lái)對(duì)網(wǎng)頁(yè)或頁(yè)面的部分文字進(jìn)行注釋。腳本,或者說(shuō)是程序,可以將這些標(biāo)簽運(yùn)用到復(fù)雜的應(yīng)用中。
③RDF+RDFSchema,該層用于描述Web上的資源及其類型,為網(wǎng)上資源描述提供了一種通用框架,也為實(shí)現(xiàn)數(shù)據(jù)集成提供了一個(gè)元數(shù)據(jù)解決方案。
RDF是W3C提出的一個(gè)基于XML的數(shù)據(jù)模型,采用獨(dú)特的“資源——屬性——值”的三元組結(jié)構(gòu)來(lái)描述互聯(lián)網(wǎng)資源特性及其關(guān)系。通過(guò)這個(gè)抽象的數(shù)據(jù)模型,RDF為定義和使用元數(shù)據(jù)建立了一個(gè)框架,元數(shù)據(jù)的元素可看成元數(shù)據(jù)所描述的資源的屬性,由此人們就可以利用RDF來(lái)解讀所引用的元數(shù)據(jù)。通過(guò)這種通用的框架,RDF可以描述Web上的各種資源,真正做到了以不變應(yīng)萬(wàn)變。
由于對(duì)不同資源的描述需要采取不同的詞匯表,RDF并沒(méi)有定義描述資源所用的詞匯表,而是定義了一些規(guī)則,這些規(guī)則是各領(lǐng)域和應(yīng)用定義用于描述資源的詞匯表時(shí)必須遵循的。RDF也提供了描述資源時(shí)具有基礎(chǔ)性的詞匯表,這就是RDFS,RDF可以依據(jù)這些詞匯來(lái)描述資源[5]。如果最底層的URI標(biāo)識(shí)了網(wǎng)上的對(duì)象,那么RDF和RDFS層則可對(duì)URI標(biāo)識(shí)的對(duì)象進(jìn)行陳述,支持有類型的資源與鏈接的類型。
④Ontology(即本體),是語(yǔ)義網(wǎng)的核心層,用于揭示資源本身以及資源之間更為復(fù)雜和豐富的語(yǔ)義信息,避免“一詞多意”或“多詞一意”,使網(wǎng)上的信息具有計(jì)算機(jī)可理解的語(yǔ)義。本體的目標(biāo)是獲取、描述和表示相關(guān)領(lǐng)域的知識(shí),提供對(duì)該領(lǐng)域知識(shí)的共同理解,確定該領(lǐng)域內(nèi)共同認(rèn)可的詞匯,并從不同層次的形式化模式上,給出這些詞匯與詞匯間相互關(guān)系的明確定義。
⑤邏輯層,在上述4層的基礎(chǔ)上進(jìn)行邏輯推理操作。
⑥驗(yàn)證層,根據(jù)邏輯陳述進(jìn)行驗(yàn)證以得出結(jié)論。
⑦信任層,用于在用戶間建立信任關(guān)系。
其中,第②、③、④層是語(yǔ)義網(wǎng)的關(guān)鍵層,用于表示W(wǎng)eb信息的語(yǔ)義,也是現(xiàn)在語(yǔ)義Web研究的熱點(diǎn)所在。
1.2語(yǔ)義網(wǎng)的形式化描述語(yǔ)言
語(yǔ)義網(wǎng)需要專門的描述語(yǔ)言對(duì)Web文檔中的術(shù)語(yǔ)含義進(jìn)行形式化描述,大量的研究工作者活躍在該領(lǐng)域,因此誕生了許多種本體描述語(yǔ)言,如RDF、DAML、OIL、OWL等,它們的演進(jìn)關(guān)系。
W3C提出的本體語(yǔ)言棧如3所示,OWL處于最上層,它是在總結(jié)幾種語(yǔ)言開(kāi)發(fā)經(jīng)驗(yàn)的基礎(chǔ)上由W3C于2004年2月正式推出,是語(yǔ)義網(wǎng)發(fā)展過(guò)程中的一個(gè)重要里程碑,經(jīng)過(guò)廣泛的討論并已得到一致認(rèn)可。
在此語(yǔ)言棧中,XML是結(jié)構(gòu)化文檔的表層語(yǔ)法,它對(duì)文檔沒(méi)有任何語(yǔ)義約束,XMLSchema是定義XML文檔的結(jié)構(gòu)約束的語(yǔ)言;RDF是描述對(duì)象以及它們之間關(guān)系的數(shù)據(jù)模型,并為數(shù)據(jù)模型提供了簡(jiǎn)單的語(yǔ)義,這些數(shù)據(jù)模型能夠用XML進(jìn)行表達(dá),RDFSchema是描述資源的屬性和類型的詞匯表,并提供對(duì)這些屬性和類型的普遍層次的語(yǔ)義。RDFS在RDF的基礎(chǔ)上提供了更多建模原語(yǔ)用于元數(shù)據(jù)定義,這些原語(yǔ)對(duì)進(jìn)一步構(gòu)造本體有一定作用。事實(shí)上,RDFS所構(gòu)造的元數(shù)據(jù)已經(jīng)是一種輕型的本體知識(shí),不過(guò)RDFS的功能仍然很有限。為了構(gòu)造更加完備的本體信息以支持自動(dòng)推理,就需要更加完備的本體描述語(yǔ)言。OWL就是在這種需求下出現(xiàn)的,它在RDF和RDFS的基礎(chǔ)上通過(guò)增加更多建模原語(yǔ)來(lái)描述特性、類,以及它們之間的關(guān)系,并針對(duì)特性提供了更加豐富的類型定義和屬性描述[6]。
總而言之,在語(yǔ)義網(wǎng)中,XML、RDF和本體將網(wǎng)絡(luò)的作用發(fā)揮到極至,網(wǎng)絡(luò)中的數(shù)據(jù)、軟件均是資源,它們將自動(dòng)被計(jì)算機(jī)理解,自動(dòng)化處理、集成、共享和重用,并由機(jī)器根據(jù)用戶需求確定連接方式,從而支持智能軟件代理Agent對(duì)WWW上異構(gòu)、分布信息的有效檢索和訪問(wèn),實(shí)現(xiàn)網(wǎng)上信息資源在語(yǔ)義層上的全方位互聯(lián),并在此基礎(chǔ)上,實(shí)現(xiàn)更高層的基于知識(shí)的智能應(yīng)用。
2網(wǎng)格技術(shù)概況
眾所周知,利用網(wǎng)關(guān)、網(wǎng)橋、路由器和光纖、電纜等基礎(chǔ)設(shè)施,傳統(tǒng)因特網(wǎng)實(shí)現(xiàn)了計(jì)算機(jī)硬件的連通;利用HTTP、URI等協(xié)議,因特網(wǎng)進(jìn)一步升級(jí),實(shí)現(xiàn)了網(wǎng)頁(yè)的連通。而網(wǎng)格不僅可以連通計(jì)算機(jī)和網(wǎng)頁(yè),還將各種信息資源,如數(shù)據(jù)庫(kù)、軟件以及各種信息獲取設(shè)備都連接成一個(gè)整體,整個(gè)網(wǎng)絡(luò)如同一臺(tái)巨大無(wú)比的計(jì)算機(jī),向每個(gè)用戶提供包括計(jì)算能力、數(shù)據(jù)存儲(chǔ)能力以及各種應(yīng)用工具等一體化的透明服務(wù)。它強(qiáng)調(diào)的是全面地共享資源、全面地應(yīng)用服務(wù)。那么,究竟什么是網(wǎng)格呢?
簡(jiǎn)單的講,網(wǎng)格就是利用互聯(lián)網(wǎng)把分散在不同地理位置上的多個(gè)資源全面連通,建立邏輯關(guān)系,并進(jìn)行統(tǒng)一管理、協(xié)調(diào)分配,組成一臺(tái)“虛擬的超級(jí)計(jì)算機(jī)”。這臺(tái)機(jī)器把每臺(tái)參與其中的計(jì)算機(jī)都作為自己的一個(gè)“節(jié)點(diǎn)”,成千上萬(wàn)個(gè)這樣的“節(jié)點(diǎn)”并聯(lián)起來(lái),就組成了“一張有超級(jí)計(jì)算能力的網(wǎng)格”。網(wǎng)格計(jì)算模式首先把要計(jì)算的數(shù)據(jù)分割,然后,不同節(jié)點(diǎn)的計(jì)算機(jī)依自己的處理能力下載一個(gè)或多個(gè)數(shù)據(jù)片斷。當(dāng)用戶不使用本節(jié)點(diǎn)的計(jì)算機(jī)時(shí),其閑置的計(jì)算能力就會(huì)被調(diào)用。這樣,每一位將自己的計(jì)算機(jī)連接到網(wǎng)格上的用戶,都可隨時(shí)隨地調(diào)用其中的計(jì)算和信息資源,在獲得一體化信息服務(wù)的同時(shí),最大程度地實(shí)現(xiàn)資源共享[7]。
作為一種新興的技術(shù),網(wǎng)格的優(yōu)勢(shì)不僅在于超強(qiáng)的數(shù)據(jù)處理能力,而且還在于利用網(wǎng)上的閑置處理能力來(lái)節(jié)約計(jì)算成本,實(shí)現(xiàn)資源的共享,消除資源孤島。網(wǎng)格的研究開(kāi)發(fā)工作已受到許多國(guó)家的重視,然而遺憾的是,到目前為止,國(guó)際上還沒(méi)對(duì)其確切含義及外延達(dá)成共識(shí),也沒(méi)有什么約定的標(biāo)準(zhǔn)。盡管如此,其關(guān)注的問(wèn)題卻很明確,即如何有效安全地管理和共享連接到Internet上的各種資源,并提供相應(yīng)的服務(wù)[8]。
3語(yǔ)義網(wǎng)格及其在數(shù)字圖書館信息檢索中的應(yīng)用
語(yǔ)義網(wǎng)格是語(yǔ)義Web和網(wǎng)格相結(jié)合產(chǎn)生的新研究領(lǐng)域,最初的提出是為了加速e-Science的發(fā)展。e-Science最大的要求是知識(shí)共享,需要跨越不同機(jī)構(gòu)、國(guó)家和學(xué)科來(lái)進(jìn)行聯(lián)合的實(shí)驗(yàn)、使用遠(yuǎn)程昂貴的科學(xué)設(shè)備、交換信息和思想。網(wǎng)格本身致力于資源共享,但卻因信息格式異構(gòu),語(yǔ)義的多重性以及關(guān)系的匱乏等問(wèn)題無(wú)法滿足要求。要達(dá)到e-Science所設(shè)想的高度易用性和無(wú)縫自動(dòng)化,必須實(shí)現(xiàn)盡量多的機(jī)器可處理性和盡量少的人類介入,這卻和語(yǔ)義Web的目標(biāo)有一些相似,于是DavidDeRoure等學(xué)者2001年在《ResearchAgendafortheSemanticGrid:AFuturee-ScienceInfrastructure》中第一次提出了語(yǔ)義網(wǎng)格(SemanticGrid)概念,并把語(yǔ)義網(wǎng)格作為未來(lái)e-Science的基礎(chǔ)架構(gòu)[9]。此后,OGSA的提出,給語(yǔ)義網(wǎng)格的發(fā)展注入了新的活力,使語(yǔ)義網(wǎng)技術(shù)應(yīng)用于網(wǎng)格變得更為簡(jiǎn)單。語(yǔ)義網(wǎng)格研究小組(GlobalGridForumSemanticGridResearchGroup,簡(jiǎn)稱SEM-GRG)的成立,也為語(yǔ)義網(wǎng)格的發(fā)展提供大力支持,該研究組仿照語(yǔ)義網(wǎng)的定義,提出:語(yǔ)義網(wǎng)格是當(dāng)前網(wǎng)格的延伸,因?yàn)樾畔⒑头⻊?wù)有了清晰明了的含義,人與計(jì)算機(jī)能夠更好地合作[10]。在這個(gè)定義里,有清晰含義的是信息和服務(wù),表明語(yǔ)義網(wǎng)格研究的語(yǔ)義的對(duì)象包括信息和服務(wù)。它把所有的資源,包括服務(wù),都用一種機(jī)器可理解、可處理的方式來(lái)描述,實(shí)現(xiàn)語(yǔ)義的互操作性[11]。其本質(zhì)就是通過(guò)更好的形式化描述網(wǎng)格上的信息來(lái)解決語(yǔ)義問(wèn)題,以使計(jì)算機(jī)盡可能取代人在網(wǎng)格上進(jìn)行信息處理,通俗講就是讓傳統(tǒng)網(wǎng)格更智能化,從而讓其他的深層次應(yīng)用,如數(shù)字圖書館等智能化服務(wù)在網(wǎng)格上開(kāi)展成為可能。
語(yǔ)義網(wǎng)格主要解決3個(gè)方面的問(wèn)題[12]:規(guī)范組織,即提出資源空間模型及規(guī)范化組織管理的理論、方法、技術(shù)和工具,使各種無(wú)序資源(信息、知識(shí)和服務(wù))規(guī)范化組織,從而使用戶能正確有效地操作各種資源,提高使用效率;語(yǔ)義互聯(lián),即通過(guò)多層語(yǔ)義互聯(lián)和單一語(yǔ)義映像,使分布在全球的各種網(wǎng)絡(luò)資源在語(yǔ)義層上互聯(lián),消除資源孤島;智能聚合,主要通過(guò)軟設(shè)備來(lái)解決資源間的互操作,使各種資源能根據(jù)用戶的需求有效、動(dòng)態(tài)、智能地聚合。
總而言之,網(wǎng)格是Web在計(jì)算能力上的提升,而語(yǔ)義網(wǎng)格是網(wǎng)格在語(yǔ)義能力上的擴(kuò)展;從另一個(gè)角度說(shuō),語(yǔ)義Web是在現(xiàn)有Web上增強(qiáng)了語(yǔ)義能力,而語(yǔ)義網(wǎng)格是語(yǔ)義Web對(duì)計(jì)算能力的擴(kuò)展。語(yǔ)義網(wǎng)格集成了語(yǔ)義Web的機(jī)器可閱讀能力和網(wǎng)格強(qiáng)大的計(jì)算能力,能更好的幫助數(shù)字圖書館為用戶提供優(yōu)質(zhì)信息檢索服務(wù)。
語(yǔ)義網(wǎng)格的研究在國(guó)內(nèi)外已陸續(xù)開(kāi)展起來(lái),特別是英國(guó)的e-Science計(jì)劃,已建立了100余個(gè)試驗(yàn)型項(xiàng)目,是語(yǔ)義網(wǎng)格的典型代表。美國(guó)、歐盟一些國(guó)家也相繼開(kāi)展了語(yǔ)義網(wǎng)格項(xiàng)目研究工作,并取得了階段性進(jìn)展。我國(guó)也很重視這方面的研究工作,2004年9月科技部批準(zhǔn)了國(guó)家重點(diǎn)基礎(chǔ)研究計(jì)劃(簡(jiǎn)稱973計(jì)劃):“語(yǔ)義網(wǎng)格的基礎(chǔ)理論、模型與方法研究”。
3.1基于語(yǔ)義網(wǎng)格的數(shù)字圖書館的結(jié)構(gòu)模型
基于Web的數(shù)字圖書館屬于技術(shù)主導(dǎo)型,凸顯各種關(guān)鍵技術(shù);基于網(wǎng)格的數(shù)字圖書館屬于資源主導(dǎo)型,凸顯分布式異構(gòu)資源的整合;基于語(yǔ)義Web的數(shù)字圖書館屬于服務(wù)主導(dǎo)型,凸顯服務(wù)的集成與共享,并在一定程度上使服務(wù)增值[13];基于語(yǔ)義網(wǎng)格的數(shù)字圖書館則融合了語(yǔ)義Web功能與網(wǎng)格結(jié)構(gòu)體系,在實(shí)現(xiàn)資源集成的同時(shí),也凸顯數(shù)據(jù)計(jì)算能力。語(yǔ)義網(wǎng)格技術(shù)的應(yīng)用可以為數(shù)字圖書館構(gòu)建一個(gè)良好的中間環(huán)境,一方面能形式化地描述知識(shí),使機(jī)器理解語(yǔ)義,另一方面使知識(shí)實(shí)現(xiàn)負(fù)載平衡與松散耦合,進(jìn)而有效地與服務(wù)和用戶整合。
分布式資源是數(shù)字圖書館的最底層,也是數(shù)字圖書館得以展開(kāi)各種智能化服務(wù)的生命之源,涵蓋了數(shù)字圖書館中類型、內(nèi)容各異的館藏資源,這些資源通過(guò)網(wǎng)格服務(wù)層虛擬地整合在一起。
網(wǎng)格服務(wù)層負(fù)責(zé)資源的整合、管理、調(diào)度和計(jì)算,采用開(kāi)放網(wǎng)格服務(wù)結(jié)構(gòu)(OpenGridServicesArchitecture,OGSA)實(shí)現(xiàn)計(jì)算服務(wù)、數(shù)據(jù)服務(wù)、信息服務(wù)的共享,并為上層提供應(yīng)用接口,具體包含計(jì)算服務(wù)層(如資源發(fā)現(xiàn)與分配、資源監(jiān)控、用戶認(rèn)證、任務(wù)調(diào)度或合作調(diào)度、容錯(cuò)處理等)、數(shù)據(jù)服務(wù)層(如數(shù)據(jù)存儲(chǔ)管理、元數(shù)據(jù)管理、數(shù)據(jù)回復(fù)和傳遞管理等)和信息服務(wù)層(為用戶提供一個(gè)統(tǒng)一的服務(wù)接口,使各種異構(gòu)數(shù)據(jù)資源能夠相互訪問(wèn))。具體來(lái)說(shuō),其構(gòu)成如圖5。各種資源分布在資源層中,采集節(jié)點(diǎn)負(fù)責(zé)對(duì)描述資源內(nèi)容的元數(shù)據(jù)進(jìn)行采集,元數(shù)據(jù)收集和傳輸服務(wù)機(jī)制把所采集的全部元數(shù)據(jù)進(jìn)行整合,并按照一定的規(guī)則和機(jī)制,將這些元數(shù)據(jù)分別存儲(chǔ)在各個(gè)檢索服務(wù)器節(jié)點(diǎn)中,索引器負(fù)責(zé)對(duì)服務(wù)器上的元數(shù)據(jù)進(jìn)行索引管理,并定期對(duì)新增的元數(shù)據(jù)進(jìn)行索引更新。檢索節(jié)點(diǎn)為用戶檢索提供接口,將收到檢索請(qǐng)求分發(fā)到服務(wù)器節(jié)點(diǎn),并執(zhí)行檢索,經(jīng)調(diào)度服務(wù)排序后,再將檢索結(jié)果返回。調(diào)度服務(wù)存儲(chǔ)有包含數(shù)據(jù)提供者列表的配置文件,依照此配置文件,系統(tǒng)向任務(wù)節(jié)點(diǎn)分配任務(wù),任務(wù)完成后還要記錄節(jié)點(diǎn)和信息資源的參數(shù),以便為新的任務(wù)分配提供參考[14]。
語(yǔ)義服務(wù)層則是根據(jù)領(lǐng)域本體中的知識(shí),從語(yǔ)義層面對(duì)這些虛擬的資源進(jìn)行整合。作為語(yǔ)義網(wǎng)格的核心層,該層使用本體和元數(shù)據(jù)描述信息,按照計(jì)算機(jī)理解的格式表示知識(shí),可提供多種服務(wù),如數(shù)據(jù)/計(jì)算服務(wù),處理計(jì)算資源的分配、調(diào)度并選擇執(zhí)行的方式,可快速傳送網(wǎng)絡(luò)數(shù)據(jù);信息服務(wù),處理被描述、存儲(chǔ)、接收、共享及保留的信息;知識(shí)服務(wù),處理知識(shí)獲得、使用、檢索、發(fā)布以及維護(hù)的方式。這里的知識(shí)是指應(yīng)用于實(shí)現(xiàn)目標(biāo)、解決問(wèn)題或做出決定的信息[15]。值得注意的是,本體作為一種能在語(yǔ)義上描述信息系統(tǒng)的概念模型,可以把各類元數(shù)據(jù)方案聯(lián)系成一個(gè)立體的知識(shí)網(wǎng)絡(luò),并能使資源按照知識(shí)網(wǎng)絡(luò)中的不同屬性,或同一種屬性的不同編碼體系,呈現(xiàn)出規(guī)范有序的知識(shí)地圖。它還可以通過(guò)某些標(biāo)準(zhǔn)的開(kāi)放的元數(shù)據(jù)接口,或提供某些可供格式轉(zhuǎn)換的映射表,向某些登記系統(tǒng)(如UDDI)進(jìn)行注冊(cè),來(lái)達(dá)到更大范圍的互操作。
知識(shí)服務(wù)層則通過(guò)文本挖掘、數(shù)據(jù)挖掘等方法,實(shí)現(xiàn)知識(shí)服務(wù),并通過(guò)接口與高級(jí)網(wǎng)格應(yīng)用互聯(lián),為用戶提供各種服務(wù)。通過(guò)知識(shí)服務(wù)層,用戶的查詢請(qǐng)求可到達(dá)模型的本體部分,本體利用元數(shù)據(jù)和語(yǔ)義視圖組件對(duì)其進(jìn)行解析,形成具有語(yǔ)義的表達(dá)式后,再與語(yǔ)義空間內(nèi)的數(shù)字資源進(jìn)行匹配,然后依據(jù)系統(tǒng)所提供的計(jì)算資源、存儲(chǔ)資源等參數(shù)信息,將最終結(jié)果返回給用戶[16]。
3.2語(yǔ)義網(wǎng)格環(huán)境下用戶獲取信息的基本過(guò)程
在語(yǔ)義網(wǎng)格環(huán)境下,數(shù)字圖書館的各個(gè)節(jié)點(diǎn)上有類型、內(nèi)容各異的信息資源,其發(fā)布過(guò)程可簡(jiǎn)單概括為以下幾步:
3.2.1通過(guò)信息資源發(fā)現(xiàn)機(jī)制尋找到數(shù)字圖書館所需的信息資源
發(fā)現(xiàn)機(jī)制分主動(dòng)發(fā)現(xiàn)和被動(dòng)發(fā)現(xiàn),主動(dòng)發(fā)現(xiàn)是基于用戶的需求進(jìn)行,被動(dòng)發(fā)現(xiàn)是基于系統(tǒng)默認(rèn)的規(guī)則進(jìn)行,即根據(jù)數(shù)據(jù)提供者所描述信息資源的屬性狀態(tài)值,選擇合適的資源。系統(tǒng)所管理的是可擴(kuò)展的有限多個(gè)數(shù)據(jù)庫(kù)和節(jié)點(diǎn),除了特定的情況下需要工作人員的參與,其增加和擴(kuò)充一般是通過(guò)被動(dòng)發(fā)現(xiàn)信息資源機(jī)制完成的。
3.2.2通過(guò)索引機(jī)制對(duì)所選信息進(jìn)行描述、索引和命名,然后將索引信息匯總到索引中心
在各節(jié)點(diǎn)中,構(gòu)成網(wǎng)格系統(tǒng)的計(jì)算機(jī)因在體系結(jié)構(gòu),操作系統(tǒng)、數(shù)據(jù)庫(kù)管理系統(tǒng)及元數(shù)據(jù)模式等多個(gè)方面均存在異構(gòu),所以,必須對(duì)新加入的信息資源重新命名,這樣,用戶在不知道資源所屬數(shù)據(jù)庫(kù)或節(jié)點(diǎn)的情況下,也可以下載使用信息。
3.2.3通過(guò)信息資源發(fā)布機(jī)制把檢索結(jié)果呈現(xiàn)給用戶
檢索時(shí),當(dāng)用戶發(fā)出檢索請(qǐng)求后,系統(tǒng)將根據(jù)用戶請(qǐng)求在索引中心內(nèi)查找匹配的索引,然后追根溯源,找到信息資源所在的網(wǎng)格節(jié)點(diǎn)。找到節(jié)點(diǎn)后,系統(tǒng)便根據(jù)節(jié)點(diǎn)和資源的狀態(tài)信息參數(shù)進(jìn)行信息資源預(yù)置(信息資源預(yù)置通常用來(lái)保證對(duì)多個(gè)信息資源的并發(fā)存取,其作用類似于一個(gè)記錄器,記錄所需信息目前的狀態(tài),以確保被順利傳輸)。接著進(jìn)行狀態(tài)估計(jì),即依據(jù)信息資源當(dāng)前狀態(tài)和傳送時(shí)間等參數(shù)為任務(wù)調(diào)度提供參考信息。最后通過(guò)任務(wù)調(diào)度環(huán)節(jié),確定任務(wù)執(zhí)行的相關(guān)順序,以確保把檢索結(jié)果提交給用戶[17]。
4結(jié)語(yǔ)
基于語(yǔ)義網(wǎng)格的數(shù)字圖書館平臺(tái),以不同領(lǐng)域本體互操作組成的知識(shí)空間、分布式的網(wǎng)絡(luò)和計(jì)算環(huán)境作為技術(shù)支持和應(yīng)用基礎(chǔ),可對(duì)海量的、多媒體的信息資源在語(yǔ)義層面上進(jìn)行組織、存儲(chǔ)和發(fā)布,可提供分布式數(shù)字資源松散耦合與集中管理,能解決數(shù)字圖書館中某些復(fù)雜的和計(jì)算密集型的服務(wù),能提高機(jī)器的閱讀能力、實(shí)現(xiàn)人機(jī)之間良好溝通,能實(shí)現(xiàn)用戶基于語(yǔ)義的資源利用、推動(dòng)用戶之間的協(xié)作和數(shù)據(jù)共享,還可以針對(duì)不同需求的用戶群體提供主動(dòng)的、個(gè)性化的信息服務(wù)。因此,語(yǔ)義網(wǎng)格技術(shù)的應(yīng)用將是數(shù)字圖書館信息檢索的發(fā)展方向。隨著語(yǔ)義網(wǎng)格的概念和相關(guān)技術(shù)的日趨成熟,語(yǔ)義網(wǎng)格技術(shù)將更加全面的應(yīng)用于數(shù)字圖書館。
盡管如此,到目前為止,語(yǔ)義網(wǎng)、網(wǎng)格和Web服務(wù)都還不夠成熟,還處在不斷發(fā)展中。語(yǔ)義網(wǎng)格作為全新的概念,既要良好融合、兼容三者的最新技術(shù),還要注意自身各方面的進(jìn)一步發(fā)展,前進(jìn)的道路將充滿挑戰(zhàn)。
今后主要的研究?jī)?nèi)容包括:①語(yǔ)義網(wǎng)基礎(chǔ)理論的研究,如本體描述語(yǔ)言、本體自學(xué)習(xí)技術(shù)、本體互操作等。在語(yǔ)義網(wǎng)中,本體起著非常重要的作用。但目前許多本體仍處在非形式化階段,只提供了領(lǐng)域術(shù)語(yǔ)的自然語(yǔ)言描述。這種本體只能用于幫助人與人之間的交互和相互理解,不能被計(jì)算機(jī)所處理。此外,大多數(shù)領(lǐng)域本體都是由手工開(kāi)發(fā)的,缺乏有效的本體管理工具和評(píng)價(jià)工具。所創(chuàng)建的領(lǐng)域本體是否完全反映出特定領(lǐng)域的概念、領(lǐng)域本體中各種概念是否一致、在本體重用時(shí)是否會(huì)產(chǎn)生沖突、不同本體之間如何互操作等等,都需要進(jìn)一步的研究。②網(wǎng)格基礎(chǔ)理論研究,如自動(dòng)化虛擬組織的創(chuàng)建和管理,需要發(fā)展怎樣的通用模型和機(jī)制以適合虛擬組織的運(yùn)作;如服務(wù)的協(xié)商和協(xié)議,研究適合網(wǎng)格系統(tǒng)的協(xié)議類型,可利用智能代理進(jìn)行協(xié)商,以互操作方式達(dá)成協(xié)議;如普適計(jì)算,怎么使一切能聯(lián)上互聯(lián)網(wǎng)的計(jì)算裝置都可無(wú)縫鏈接并透明地訪問(wèn)網(wǎng)格;如內(nèi)容的處理和長(zhǎng)期保存,網(wǎng)格系統(tǒng)如何處理各種各樣的媒體內(nèi)容,并使內(nèi)容能自動(dòng)化長(zhǎng)期保存等等。③語(yǔ)義Web與網(wǎng)格的融合研究,如在OGSA基礎(chǔ)上融合了語(yǔ)義網(wǎng)技術(shù)的語(yǔ)義網(wǎng)格體系結(jié)構(gòu)是否要變化,怎樣變化等等。
【高校圖書館信息檢索課程教學(xué)的改革】相關(guān)文章:
高校圖書館應(yīng)有序作文09-22
教學(xué)改革作文11-12
小學(xué)課程教學(xué)08-13
關(guān)于恐龍的課程教學(xué)實(shí)錄03-12
江西高考改革詳解02-29
改革開(kāi)放作文01-17
改革在我身邊作文12-29
小組“大改革”作文03-09
圖書館作文07-22