fjrigjwwe9r0t_Info:InfoContent 未經(jīng)過(guò)規(guī)范化處理的出版資源,即使是以“數(shù)字化”形式存在,也只不過(guò)是以數(shù)字形式存儲(chǔ)的出版資源而已,這類資源很難在數(shù)字出版領(lǐng)域中成為可利用的資源并發(fā) 揮其應(yīng)有的價(jià)值。而目前許多傳統(tǒng)出版單位,正熱衷于將其所掌握的出版資源大規(guī)模地進(jìn)行數(shù)字化工作,而這種不按數(shù)字出版規(guī)范處理程序進(jìn)行的數(shù)據(jù)加工方式,只 能稱其為出版資源的數(shù)字化過(guò)程,而其產(chǎn)生的后果只能產(chǎn)生大量的數(shù)據(jù)垃圾,為數(shù)字化資源建設(shè)造成極大的浪費(fèi)。 那么,什么樣的資源才能真正成為數(shù)字化的出版資源呢?對(duì)照上面提出的問(wèn)題,我想數(shù)字化出版資源起碼要具備以下幾個(gè)基本要求: 一、 資源的可用性 可用性是指兩個(gè)方面,一是資源的版權(quán)有效性,即資源經(jīng)過(guò)數(shù)字化加工處理后,出版單位對(duì)其是否具有版權(quán)意義上的使用權(quán)。二是資源自身的價(jià)值,是否具有一次加工,多次復(fù)用價(jià)值。 1.版權(quán)的有效性 在傳統(tǒng)出版時(shí)代,出版單位獲得的大多是專用出版權(quán), 有的甚至只是非專用出版權(quán),而并沒(méi)有獲得改編權(quán)以及其他載體形式的出版權(quán),特別是對(duì)于數(shù)字出版最為重要的網(wǎng)絡(luò)傳播權(quán)。而這些法律上的授權(quán)問(wèn)題如果不能得到 真正解決,即使出版單位花費(fèi)大量人力、物力和精力將其作品數(shù)字化,卻可能面臨數(shù)字環(huán)境下運(yùn)營(yíng)的合法問(wèn)題而無(wú)法使用。為此,對(duì)具有一定價(jià)值且需要進(jìn)行數(shù)字化 的資源或已形成數(shù)字化的資源需要二次加工的資源,首先要進(jìn)行版權(quán)授權(quán)的認(rèn)證工作,未獲得有效許可的資源是不能進(jìn)行二次開(kāi)發(fā)的。 2.可復(fù)用性 并非所有的出版資源都具有可復(fù)用性,或者是利用復(fù)用性不強(qiáng)。在傳統(tǒng)出版資源中,復(fù)用性較強(qiáng)的資源有工具書(shū)、教材等長(zhǎng)銷類產(chǎn)品,其次是以提供數(shù)據(jù)分析和信息 服務(wù)類的數(shù)據(jù)庫(kù)產(chǎn)品,最后是經(jīng)典讀物以及瀏覽性讀物。對(duì)于不同的資源,其數(shù)據(jù)處理水平及加工要求也各有不同。 工具書(shū)、教材 這是數(shù)字化出版資源的核心,對(duì)這類資源要在完成同類資源 的大規(guī)模集成后,要進(jìn)行數(shù)據(jù)的深度標(biāo)引,并完成查重排歧,才具有可使用的價(jià)值。這也是加工難度最大一項(xiàng)工作,其中涉及如何利用計(jì)算機(jī)技術(shù)進(jìn)行數(shù)據(jù)挖掘、信 息整理和知識(shí)管理、知識(shí)服務(wù)等數(shù)字出版核心技術(shù)。 數(shù)據(jù)分析和信息服務(wù)類的數(shù)據(jù)庫(kù)產(chǎn)品 向面某一領(lǐng)域或特定讀者群的非工具 書(shū)或教材類的出版資源,其單一資源的可復(fù)用性較弱,但大規(guī)模集成后,可形成一定強(qiáng)度的資源庫(kù),通過(guò)積累和沉淀,可形成新形態(tài)的信息產(chǎn)品,如清華同方的資源 庫(kù),這類資源是通過(guò)大規(guī)模集成之后形成新的衍生性信息消費(fèi)產(chǎn)品,可滿足新的消費(fèi)需求,并促進(jìn)原來(lái)產(chǎn)品的發(fā)行與銷售。其可行性關(guān)鍵在于集成度和信息提取度。 并非一兩家傳統(tǒng)出版單位可實(shí)現(xiàn)的,一般來(lái)說(shuō),要形成行業(yè)集成才有可能形成有效的規(guī)模產(chǎn)品,支撐產(chǎn)業(yè)的數(shù)字閱讀需求。如在集團(tuán)層面上集成,則專題性的集成度 不足,難以形成有效消費(fèi)群。 在技術(shù)層面上,由于對(duì)內(nèi)容信息需求的多樣性和復(fù)雜性,其底層數(shù)據(jù)結(jié)構(gòu)及信息提取等問(wèn)題,需要大量數(shù)據(jù)庫(kù)和網(wǎng)絡(luò)信息處理的專業(yè)人才,因此,要在基于新的信息消費(fèi)產(chǎn)業(yè)鏈的基礎(chǔ)上,進(jìn)行跨媒體、跨部門、跨行業(yè)、跨領(lǐng)域的優(yōu)質(zhì)資源整合,才可取得成效。 經(jīng)典性讀物及大眾閱讀性讀物 這類出版物由于其瀏覽性、實(shí)效性強(qiáng)、典藏性和資源性相對(duì)較弱,因此,大多以在線發(fā)布,順序?yàn)g覽為主,能滿足公眾利用網(wǎng)絡(luò)或手機(jī)閱讀終端,實(shí)現(xiàn)情節(jié)性淺閱讀的基本需求。 二、 資源的可流通性 出版資源的流通性也要多不同的角度來(lái)看,一是數(shù)據(jù)自身的可流通性、二是載體的兼容性、三是內(nèi)容的需求性。 1.數(shù)據(jù)的可流通性 要達(dá)到在不同載體上一次加工多次利用的目的,首先要解決字符的規(guī)范性問(wèn)題。而國(guó)內(nèi)目前各出版單位所擁有的“數(shù)字化資源”,大多是基于GB18030的字符 集,這個(gè)字符集所收漢字263個(gè),難發(fā)滿足出版用字的需求。因此資源中存在大量非標(biāo)造字,不具有可流通性。要想提高資源的流通性,必須將資源構(gòu)架的的基礎(chǔ) 上,也就是超大字符集的基礎(chǔ)上,并實(shí)現(xiàn)現(xiàn)有資源用字符的五同問(wèn)題,即:文同字(同字異形的認(rèn)同))、字同形(同形異構(gòu)的認(rèn)同)、形同碼(同形異碼的認(rèn) 同),碼同位(同字異碼的碼位歸并),符同碼(各類符號(hào)系統(tǒng)在符號(hào)集中的同一性)。只有在超大字符集的基礎(chǔ)上,解決了五同問(wèn)題,數(shù)據(jù)才真正具有可流通性。 2.載體的可兼容性 要想出版資源在不同載體形式上發(fā)布,重點(diǎn)需要解決 不同媒體形態(tài)資源的存儲(chǔ)格式和精度問(wèn)題。媒體格式一定要采用國(guó)際通用標(biāo)準(zhǔn),如采用非國(guó)際標(biāo)準(zhǔn)的企業(yè)格式,將造成載體間兼容性的瓶頸,使得資源無(wú)法有效傳播 和利用。精度問(wèn)題也是數(shù)字化資源中存在的一個(gè)嚴(yán)重問(wèn)題,特別是圖片資源,往往由于前期采集精度不足,導(dǎo)致可用性大大降低,以至不可用。因此,對(duì)具有利用價(jià) 值的圖片資源,特別是珍貴資源,要按全張印刷的精度采集,并分層存儲(chǔ)。 3. 內(nèi)容的需求性 數(shù)字出版物的傳播方式是被動(dòng)傳播,即資源存儲(chǔ)在運(yùn)營(yíng)環(huán)境中是靜態(tài)的,如無(wú)用戶需求導(dǎo)致的閱讀點(diǎn)擊行為的產(chǎn)生,則根本不可能實(shí)現(xiàn)傳播。因此, 閱讀需求越少的內(nèi)容信息,越不具有可流通性,要提高資源的流通性,就要認(rèn)真解決在網(wǎng)絡(luò)環(huán)境下讀者需求的動(dòng)態(tài)采集和用戶需求的定性量化分析,只有解決了需求 描述和描述機(jī)制,才能真正做到按需定制,按需生產(chǎn)、按需加工、按需提供,才能真正提高資源的流通性和可用性。 三、可獲取性 由于數(shù)字環(huán)境下的資源是以靜態(tài)的形式存在,如何有效地將資源組織起來(lái)以 便于讀者的查詢和檢索,如何類聚地提供信息和內(nèi)容、如何基于用戶的認(rèn)智規(guī)律,拓展性地組織和關(guān)聯(lián)信息,并有效地利用多種媒體形態(tài),綜合藝術(shù)地動(dòng)態(tài)推送展示 內(nèi)容,是提高靜態(tài)內(nèi)容的動(dòng)態(tài)流動(dòng)性所必須解決的問(wèn)題。 四、可維護(hù)性 數(shù)字出版資源的特點(diǎn)之一是可不斷地對(duì)資源進(jìn)行動(dòng)態(tài)地更新維護(hù),以滿足和 響應(yīng)不同用戶群體的閱讀需求。因此,能否建立起一支強(qiáng)大的,具有強(qiáng)大的信息利用和處理能力的編輯隊(duì)伍,不斷對(duì)資源進(jìn)行更新和維護(hù),才是使資源具有生命力和 可持續(xù)展發(fā)生命力最為核心的問(wèn)題,一個(gè)資源如不能及時(shí)更新和補(bǔ)充,則需求就會(huì)枯竭,用戶就會(huì)消失,資源本身的價(jià)值就會(huì)下降甚至消亡。
|