捷易拍文件拍攝儀搭建數(shù)字圖書館一、 什么是數(shù)字圖書館 數(shù)字圖書館就是一個不需要閱覽室的圖書館,只要有網(wǎng)絡存在的地方,任何人都可以隨時隨地查閱資料、獲取信息。 數(shù)字圖書館系統(tǒng)是現(xiàn)代計算機及網(wǎng)絡技術(shù)與傳統(tǒng)圖書館信息檢索技術(shù)相融合的結(jié)晶。傳統(tǒng)圖書館管理面臨著技術(shù)與設備的落后的局面,但是長期針對海量數(shù)據(jù)的管理積累了豐富的信息檢索經(jīng)驗; 數(shù)字化革命和因特網(wǎng)的大發(fā)展,帶來了經(jīng)濟、
貿(mào)易、信息傳播的全球化,深刻影響著社會的各個層面。巨量信息涌入因特網(wǎng),使其信息極為豐富,也使信息查詢、檢索十分困難,尤其是對于上網(wǎng)漫游的新手更是如此。這主要是由于因特網(wǎng)上的信息資源很大程度上處于混亂的無政府狀態(tài),大大影響了信息利用的效率。這一重大的弊端,清楚地表明了在因特網(wǎng)這種全球信息服務網(wǎng)絡中,急需一個管理信息資源的新模式,所有上網(wǎng)的資源必須按照這個模式統(tǒng)一管理。這就是提出數(shù)字圖書館的主要背景。 數(shù)字圖書館是采用現(xiàn)代高新技術(shù)所支持的數(shù)字信息資源系統(tǒng),是下一代因特網(wǎng)網(wǎng)上信息資源的管理模式,它將從根本上改變目前因特網(wǎng)上信息分散不便使用的現(xiàn)狀。 數(shù)字圖書館建設是以統(tǒng)一的標準和規(guī)范為基礎,以數(shù)字化的各種信息為底層,以分布式海量資源庫群為支撐,以智能檢索技術(shù)為手段,以電子商務為管理方式,以寬帶高速網(wǎng)絡為傳輸通道,將豐富多彩的多媒體信息傳遞到千家萬戶。它涉及數(shù)字信息資源的生產(chǎn)、加工、存儲、檢索、傳遞、保護、利用、歸檔、剔除等全過程。它不是個別圖書館所能完成的任務,需要全國范圍的圖書館、博物館、美術(shù)館、檔案館和情報信息提供單位等攜手共同完成。 在數(shù)字圖書館概念出現(xiàn)之前,人們從電子圖書館、無圍墻圖書館和數(shù)字化圖書館等不同側(cè)面討論了圖書館的未來發(fā)展。電子圖書館主要是指以電子形式(媒介)存貯、傳遞并提供服務的圖書館,如各個圖書館建立的電子閱覽室、OPAC檢索等,它重點強調(diào)個別圖書館借助于計算機技術(shù)在一定范圍內(nèi)提供讀者服務。無圍墻圖書館是指讀者通過網(wǎng)絡通信系統(tǒng)檢索多個圖書館的數(shù)字化館藏,強調(diào)用戶獲取信息的廣泛性和網(wǎng)絡傳輸?shù)闹匾?。而?shù)字化圖書館則主要側(cè)重于館藏的數(shù)字化,將數(shù)字化的書刊文獻上網(wǎng)提供讀者使用。可以看出,電子圖書館主要側(cè)重在個別圖書館的電子化檢索,無圍墻圖書館主要強調(diào)通過網(wǎng)絡檢索多個圖書館的館藏,而數(shù)字化圖書館的重點則在館藏的數(shù)字化。電子圖書館、虛擬圖書館和數(shù)字化圖書館的建設難度、使用的方便程度都遠遠不如數(shù)字圖書館,但它們是數(shù)字圖書館的基礎,是建設數(shù)字圖書館必不可少的前期準備工作?! ‖F(xiàn)代網(wǎng)絡計算經(jīng)過互連網(wǎng)時代的飛速發(fā)展,在信息的數(shù)字化技術(shù)、多媒體技術(shù)、信息的存儲與安全、網(wǎng)絡發(fā)布與搜索技術(shù)等方面日趨成熟,但是面臨海量信息的管理暴露出諸多問題,如何將兩者有機地結(jié)合,是數(shù)字圖書館系統(tǒng)設計的關(guān)鍵。二、建設數(shù)字圖書館的意義 1.對社會發(fā)展的意義 傳統(tǒng)的紙張作為信息媒介存在著巨大的資源浪費,以圖書為例,大量的有用和沒用的信息都要印刷出成千上萬冊,經(jīng)過存儲、運輸、批發(fā)、銷售等耗資巨大的環(huán)節(jié)后送到讀者面前,然后無論是買出去還是沒買出去的圖書無非都是兩種結(jié)果,束之高閣直至發(fā)霉腐爛,或者再耗費人力物力進行銷毀。 這樣不僅一方面社會資源和自然資源被嚴重浪費,另一方面信息無法永久保存,更談不上信息的增殖。而隨著人類社會需求的發(fā)展和信息的膨脹,為傳統(tǒng)紙媒介所做的信息移植的代價越來越大。下圖為傳統(tǒng)信息傳播方式和Internet時代信息傳播方式的比較。 數(shù)字圖書館的建設具有以下社會經(jīng)濟意義: 知識經(jīng)濟的基礎建設; 帶動相關(guān)信息資源; 全球文化科技競爭的焦點; 可觀的效益前景 信息增值和知識創(chuàng)新?! ?.對國家的戰(zhàn)略意義 數(shù)字圖書館已經(jīng)成為國際高科技競爭中新的制高點,同時也成為一個國家信息基礎設施建設的重要標志。與數(shù)字圖書館相關(guān)的工程項目層出不窮,各國在數(shù)字圖書館建設方面的投資力度也逐年加大?! ∶绹鴱?0世紀90年代初就把數(shù)字圖書館作為新興的有發(fā)展?jié)摿Φ闹匾芯款I域,并把數(shù)字圖書館研究納入克林頓政府所倡導的國家信息基礎設施計劃(NII)。1994年至1998年,美國共動用7800萬美元,調(diào)集國防部、國家宇航局、聯(lián)邦調(diào)查局、國會圖書館、國家科學基金會、人文科學基金會等重要部門,聯(lián)合數(shù)十所大學和研究機構(gòu),大力研究和推廣數(shù)字圖書館項目,預計在今后的幾年中,這一計劃還將動用上億美元的投入。美國實施數(shù)字圖書館計劃的主要目的就是要促進美國社會各類信息的高效傳遞,為美國公民的終身學習提供保障,使美國在知識生產(chǎn)和信息發(fā)布方面充當國際霸主,并利用互聯(lián)網(wǎng)盡快占領信息資源的戰(zhàn)略制高點。這一做法引起國際社會的高度重視,英國、法國、日本、德國、意大利等西方發(fā)達國家和新加坡、韓國等亞洲國家也先后步其后塵緊緊追趕?! ”M管我們國家起步較晚,但在基礎研發(fā)上,我們已經(jīng)不落后了。相對于技術(shù)的研發(fā)來講,在我國進行數(shù)字圖書館的推廣方面,卻要遇到很多非技術(shù)層面的難處。目前,最大的問題是社會各界對數(shù)字圖書館的重要意義還認識不夠,有關(guān)部門(特別是核心部門)參與的程度還不是很高,資金投入力度還很不夠?! ≡诨ヂ?lián)網(wǎng)時代的信息角逐中,擁有它,就是擁有了一塊中文陣地,失去它,可能將意味著失去整個中文世界?! 粑臋n信息化系統(tǒng)的特點 實用的文檔信息化系統(tǒng)具有以下特點: 本身是一套集成最新技術(shù)的商業(yè)實現(xiàn); 自動化加工過程,解決海量圖書的數(shù)據(jù)化; 實現(xiàn)安全控制和版權(quán)保護; 可以基于internet的商務模式; 良好的開放性,和已有系統(tǒng)的集成?! ∥臋n信息化系統(tǒng)有三個要素: 1.數(shù)字化資源 大量的數(shù)字化資源是數(shù)字圖書館的 物質(zhì) 基礎。數(shù)字圖書館的目的是直接提供讀者所需的最終信息,而不只是二次文獻(獲得文獻的線索),但數(shù)字圖書館并不排斥書目數(shù)據(jù),索引文摘等二次文獻,因而它們也是數(shù)字圖書館的組成部分?! ∪f千世界統(tǒng)一于數(shù)字圖書館中的0和1,書籍、期刊、錄音錄像帶、乃至古籍善本、稀世字畫甚至X光片,都消失了原本的物理形態(tài),只要有相同的屬性,就能被同時獲取。因此多媒體也是數(shù)字圖書館的一個基本特征?! ?.網(wǎng)絡化存取 高速的數(shù)字通信網(wǎng)絡是數(shù)字圖書館的存在基礎,數(shù)字圖書館依附于網(wǎng)絡而存在,其對內(nèi)的業(yè)務組織和對外的服務都是以網(wǎng)絡為載體,得益于網(wǎng)絡也受制于網(wǎng)絡,只有利用網(wǎng)絡至極限,才能發(fā)揮數(shù)字圖書館作用至極限?! ?shù)字圖書館內(nèi)部本身由局域網(wǎng)構(gòu)成,一般是高速主干聯(lián)接數(shù)臺服務器及工作站,外部通過數(shù)臺廣域網(wǎng)服務器面向浩瀚的國際互聯(lián)網(wǎng),今天是Internet,明天可能是Internet2?! ?.分布式管理 分布式管理是數(shù)字圖書館發(fā)展的高級階段,它意味著全球數(shù)字圖書館遵循統(tǒng)一的訪問協(xié)議之后,數(shù)字圖書館可以實現(xiàn) 聯(lián)邦檢索 ,全球數(shù)字圖書館將像現(xiàn)在的INTERNET聯(lián)接網(wǎng)站一樣,把全球的數(shù)字化資源聯(lián)為一體,聯(lián)接成為一個巨大的圖書館?! 》植际焦芾碇允菙?shù)字圖書館的基本要素,在于它強調(diào)標準協(xié)議的重要性,只有全球共同遵循TCP/IP協(xié)議,才有INTERNET的今天,數(shù)字圖書館技術(shù)還沒有這樣一個公認的標準協(xié)議,,因此技術(shù)標準的選擇和參與制訂,對每一個數(shù)字圖書館先驅(qū)者來說都是至關(guān)重要的?! 舻湫偷男畔⒒到y(tǒng) 1.文檔加工系統(tǒng)的組成 由三部分組成:信息化處理 本地閱讀 internet電子商務平臺 2.系統(tǒng)的特點:適應中國國情 圖像技術(shù) 形式:圖象/文本 特點:象形文字 簡繁多碼 版式的保存 原件的法律效應 ◆圖像壓縮及處理方式 通用圖像壓縮:CCITT G4和JPEG;黑白二值圖的壓縮:JBIG和JBIG2 進一步的壓縮技術(shù):小波變換;新的圖像壓縮標準:JPEG2000;圖像的優(yōu)化技術(shù):去污、去噪、糾偏等等;視頻動態(tài)壓縮:MPEG、MPEG2、MPEG4、MPEG7、H.261;音頻動態(tài)壓縮:MP3?! 粜畔⒌纳罴庸み^程:識別和檢索 加工系統(tǒng):各種非數(shù)字化對象的數(shù)字化處理,同時完成數(shù)據(jù)對象的索引(index)和置標(markup)處理; 查詢檢索系統(tǒng):通過基于SGML的搜索引擎,實現(xiàn)元數(shù)據(jù)檢索及內(nèi)容的全文檢索?! ?.文檔信息化處理流程 在向internet方式的信息傳輸?shù)倪^渡時,將傳統(tǒng)的紙媒介信息數(shù)據(jù)化是一項艱巨的任務,其中涉及到的掃描、壓縮、加密等一系列技術(shù)難關(guān)。 2.信息的入口:捷易拍 文件拍攝儀 拍攝速度(30-180頁/分鐘) 保持原件效果 圖像去噪處理 ◆圖書的格式 圖書文件的格式為按照PDF格式組織的圖像文件,所以可以利用PDF和Acrobat Reader的優(yōu)勢?! DF特點: 支持排版格式 支持對象定義 支持圖書發(fā)布控制 支持安全加密 在線瀏覽的優(yōu)化 圖文混排 ◆圖書的閱讀 閱讀平臺不僅提供圖書的顯示,還應能夠?qū)⑸鲜龅募夹g(shù)實現(xiàn)進行集成。選擇PDF的理由是Acrobat Reader具有以下特點: 支持圖文及多媒體對象 支持全文檢索 支持頁、目錄等管理 支持各種操作及控制 可以集成多種技術(shù) ◆系統(tǒng)結(jié)構(gòu)的開放性 1) 和已有系統(tǒng)的連接 聯(lián)機編目系統(tǒng) 查詢檢索系統(tǒng) 業(yè)務管理系統(tǒng) 2)各種技術(shù)的嵌入 OCR識別模塊 數(shù)字水印功能 加蓋時間戳 3)第三方功能的嵌入 ◆數(shù)字文檔的安全控制 要作到對出版物版權(quán)的保護,應結(jié)合最新的認證和加密技術(shù),對每一個用戶的下載圖書進行不同的加密?! ⌒畔踩骸 ≌J證 電子簽名(水?。┐嫒?quán)限 加密 操作權(quán)限控制:閱讀 修改 打印 下載 ◆數(shù)字文檔的版權(quán)保護:加密與綁定 本系統(tǒng)解決數(shù)據(jù)對象的流通、傳播和增值,以及安全和版權(quán)的保護等問題?! 粝到y(tǒng)應用 1.文檔信息化系統(tǒng)構(gòu)成了未來圖書的商務與服務模式 2.文檔信息化系統(tǒng)可用于圖書網(wǎng)站建設 電子商務平臺+多家出版社聯(lián)合/同盟=電子圖書銷售中心 3.數(shù)字圖書加工、銷售與圖書網(wǎng)站建設的一個全面解決方案 ◆文檔信息化系統(tǒng)在辦公自動化方面的應用 ○政府:公文、文件、檔案、材料 ○工商:企業(yè)檔案、申報材料、檢查記錄 ○稅務:企業(yè)情況、納稅登記、發(fā)票 ○銀行:企業(yè)及個人證件、印鑒、支票、單據(jù) ○司法:企業(yè)原始材料、卷宗、證詞、案例 ○文物:書畫、真跡、圖片、 ○出版:圖書、手稿 ○企業(yè):檔案 ◆提供的服務模式 ◆市場的預測 這是一個保守估計,依據(jù)是CNNIC1999年的調(diào)查: 1999年6月30日中國上網(wǎng)用戶400萬,12月30日上網(wǎng)用戶數(shù)890萬。半年的增長率是100%。 假設年增長率100%,1/4用戶在網(wǎng)上看書,1/8用戶在網(wǎng)上購買電子書。