導航:首頁 > 文檔加密 > pdf發展前景

pdf發展前景

發布時間:2023-12-10 03:11:23

⑴ 雙層pdf在地質資料數字化中的應用

郭慧錦 賈國鋒 馬飛飛 張茜

(全國地質資料館)

摘要 本文在描述雙層PDF及OCR技術特點及應用前景基礎上,探討了地質資料數字化圖文數據雙層PDF轉換的意義;提出了轉換方法的選擇,並詳細介紹了OCR數字加工系統,以及提高識別率的方法;最後提出了雙層PDF在地質資料館建設中的意義。

關鍵詞 雙層PDF OCR識別率

當前,地質資料館藏機構都在加緊開展數字化工作。截至2013年底,全國已有20多個省級資料館完成館藏資料的數字化工作,全國地質資料館的成果地質資料數字化工作也接近尾聲,所形成的海量數據已成為地質資料信息社會化服務重要數據資源。此類數字化數據是靜態的,有利於閱覽使用,但無法進行全文檢索,也不利於進一步分析處理。因此,在現有數據的基礎上,開展OCR識別,使之轉化成雙PDF文件,實現靜態向動態的轉變,建立全文資料庫,完成對地質資料的全文信息的檢索,成為地質資料館藏機構推進資料數字化工作。

1 關於雙層 PDF與OCR技術

雙層PDF是在掃描數據的基礎上通過OCR識別生成的可檢索的PDF文件,即上層是原始圖像,下層是識別結果,且位置上下一一對應。雙層PDF文件不僅可以100%保留原始版面效果,而且支持選擇、復制、檢索等功能,這樣的PDF文件最後可以存儲在光碟、硬碟或磁碟陣列中,並通過建立索引資料庫進行科學的管理。

OCR(Optical Character Recognition),即光學字元識別,是指電子設備(如掃描儀或數碼相機)檢查紙上列印的字元,通過檢測暗、亮的模式確定其形狀,然後用字元識別方法將形狀翻譯成計算機文字的過程。即對文本資料進行掃描,然後對圖像文件進行分析處理,獲取文字及版面信息的過程。隨著計算機網路飛速發展,信息電子化已經成為一個時代必然趨勢。文字作為信息中最重要、最集中的載體,其電子化進程顯得尤為重要。而OCR技術則是文字電子化過程中最重要的環節,它改變了傳統的紙介質資料輸入的概念。通過OCR技術,用戶可以將通過攝像機、掃描儀等光學輸入方式得到的報刊、書籍、文稿、表格等印刷品的圖像信息轉化為可以供計算機識別和處理的文本信息。因此,與傳統的手工錄入方式相比,OCR技術大大提高了人們進行資料存儲、檢索、加工的效率。

2 應用現狀

PDF正在世界各國政府、金融財務、法律、工程技術、醫療等諸多部門獲得廣泛的應用,並已成為政府、學術部門等單位標準的現代化公文格式規范,所以PDF電子格式文檔將是未來檔案部門收藏的主體。而雙層PDF的出現有效解決了識別成本和閱讀利用的矛盾,是一種較有潛力的資源格式。國外的OCR技術應用相對成熟,包括IBM、Motorola、HP和Microsoft等世界性大公司都陸續展開了這方面的研究,在他們的產品中綁定了OCR技術。

如今,OCR技術在我國的應用也極為廣泛。信息檢索技術研究,即雙層PDF檢索技術研究,中國「863」計劃在2008年以前已經開始對中文OCR、自動分詞、自動摘要、自動搜索、自動定位進行了統一測試評測。在此基礎上,國內逐步建立了以數字圖書館、數字檔案館、數字報刊、數字校園網等一系列數字化為基礎的實施案例,例如新聞出版總署、外聯部、共青團中央等機關文獻全文資料庫;《中國青年》75年、《新華文摘》20年等期刊全文資料庫。國家圖書館早在1999年就成立了「國家圖書館文獻數字化中心」,對各類館藏文獻進行數字化加工和OCR識別,在此基礎上形成書目型書庫、題錄型資料庫和全文型資料庫三大類,逐漸成為我國網上信息資源的中心樞紐。

隨著我國信息化建設全面普及,OCR技術的應用前景更加廣闊,數字圖書館、數字檔案館、數字資料館等概念的提出也使OCR在紙質檔案數字化過程中越來越發揮其獨特的作用,不僅節省了人力物力,更使檔案信息資源的利用價值達到最大化,能夠更好地服務於民。

3 數字化數據雙層PDF轉換的意義

3.1 是地質資料信息化建設的重要內容

隨著社會信息化程度的提高,人們對信息資源的依賴程度也越來越高,對高效率的檔案資源管理、檢索利用的需求也越來越迫切。數字化是信息化建設的重要內容,而信息化建設的核心是資源建設。資源建設包括三大任務:一是館藏紙質資料的掃描數字化與目錄資料庫建設;二是電子文件的歸檔與管理;三是全文資料庫和全文檢索體系建設。根據各資料館數字化工作進展,考慮到用戶的利用需求,若要得到真正文本形態的電子信息,使資料數字化工作更加有效,更加徹底,最大限度拓寬用戶利用面,就需要應用OCR技術進行掃描柵格文件的雙層PDF轉換,進而開展地質資料全文資料庫建設和全文檢索工作。

3.2 是地質資料實現全文檢索與全文資料庫建設的前提

實踐證明,基於雙層PDF文檔的全文檢索,有效地提高了查詢利用效率。它通過對檔案資料庫的數據和雙層PDF文檔的Text層建立索引,查詢時可以不訪問資料庫,有效減輕資料庫和系統的壓力。至少可以支持1000萬級的數據,毫秒級的查詢時間,每秒上千人的並發訪問,從而實現大容量、高速度的目標,並且可以適應Linux和Windows平台,支持多種資料庫介面。它具備通用搜索引擎的構架和功能,可以對用戶的輸入進行分詞,可以進行多關鍵字搜索、關鍵片語合搜索,用戶友好;同時能夠根據客戶的需求進行用戶的數據挖掘,提高檔案全文檢索系統的價值。

3.3 是現代化數據中心標准化建設的前提

建設現代化的數據中心首先要實現電子文件存儲結構標准化,即建立一個通用性強、應用廣泛的電子文件信息存儲和交換格式。基於PDF格式已經作為電子文件管理中電子文件長期保存格式的最新標准在國際上全面實施,且具有兼容性、原始記錄性強,安全控制策略完善等優點,是電子文件長期保存的最佳選擇。所以進行館藏數字化數據PDF轉換勢在必行。

4 雙層PDF轉換方法

4.1 目前常見的雙層PDF轉換方法

目前國內雙層PDF的轉換技術已經相對成熟,從現有技術條件下來看,大體可分為以下3種:

4.1.1 軟體轉換

由目前市場上較流行的 Adobe Acrobat、ABBYY FineReader12(中英文識別)、Readiris Corporate 12(英文識別率高)、Foxit Phantom 5(可以單獨顯示文本層)、清華文通TH-OCR XP8(識別率較高)、漢王文本王5800(版面識別較好,純中文識別率高)、尚書七號OCR等轉換程序,可以經OCR識別處理後直接生成雙層PDF文件,速度快,效率高。但識別率和紙質資料原件(如印刷方式、清晰度、紙張質量等)及操作人員技術水平成正比。如果紙質原件質量好,識別率相對就高;質量差,識別率就相對較低。

4.1.2 流程加工

根據相關技術要求,對圖像進行全新的OCR識別流程加工處理,重新生成PDF文件,具有文字正確率高、文字定位準確等特點。這種方式相當於全流程化製作雙層PDF文件,工作量大,耗時長,費用高。

4.1.3 識別重構

重新生成PDF文件,實現版面字體、字型大小、顏色的恢復和重構。文字正確率高,頁面清晰,但和原版圖差異較大,主要在圖書方面應用較多。

4.2 地質資料雙層PDF轉換

全國館於2011年開始在掃描數字化基礎上開展雙層PDF的轉換試驗工作,主要運用第一種方法進行軟體轉換,即經過軟體自動OCR處理後直接形成雙層PDF文件。由於地質資料不同於普通的文書檔案,紙張樣式和印刷方式多樣,手寫和老舊資料多,地層、數學等特殊符號多等特點,給OCR自動識別帶來了困難,單一的軟體識別並不能滿足全文檢索90%以上識別率的要求。

在轉換試驗基礎上我們得到以下結論:

1)地質資料本身多種多樣,實際的識別率主要受印刷質量、形成年代等因素影響,老舊資料、紙質質量差的資料識別率普遍較低;受執筆人書寫習慣及書寫清晰度的影響,手寫文檔的識別准確率一般在30%以下;油印文檔識別准確率一般在50%以下;列印、鉛印和膠印文檔識別率較高,一般能達90%以上。無論在哪種類型的文檔中,標點的識別率都很低,地層和數學符號及其他特殊符號的識別率幾乎為零。

2)目前識別技術無法達到100%識別,必須根據實際需求對照紙質檔案對初次識別結果進行人工校對才能滿足全文檢索需求。

3)地質資料掃描文件數量多、容量大,轉換速度受計算機反應速度影響,大批量轉換和識別需選擇高配置計算機,且批量轉換和人工識別耗時長,耗人工多,需專項經費支持開展工作。

4.3 OCR數字加工系統的引入與功能簡介

經過對目前國內雙層PDF轉換方法的對比,結合地質資料情況復雜的特點,以及數據測試結果研究,建議地質資料的雙層PDF轉換主要採用軟體識別和流程加工相結合的方法,即採用OCR數字加工系統,可以保證高效率、高質量地完成雙層PDF轉換。該系統主要包含以下幾個主要流程:

圖1 OCR數字加工系統示意圖

1)圖像處理。為提高識別率,對圖像進行「消藍去污」的處理,去掉圖像上影響識別率的噪音,如麻點、下劃線等,由圖像質量控製程序自動監測圖像處理質量。

2)版面分析。自動進行版面理解並定位,判別劃框區域是橫排文本區、豎排文本區、表格區還是圖像區,並對不同屬性的區域以不同顏色的線框標識出來。自動版面分析在後台運行,操作人員可在前台進行確認,必要時對自動版面分析結果加入手工干預。

3)識別。把文字圖像轉化為計算機文字內碼,可以識別印刷體和手寫體中文(包括簡體字和繁體字)、中英文混排文字、表格,識別出來的文字內碼可以是GB碼、BIG5碼、GBK碼或者Unicode碼。識別過程在後台運行。

4)縱向校對。具有很強的查錯糾錯能力,是將一個或若干個圖像中識別成同一個字的文字圖像列在一起顯示,並以突出顏色標出可疑字,便於操作員發現錯誤和修改。

5)橫向校對。是傳統的人工校對方法,操作員直接對比識別結果文本和圖像,以發現識別錯誤文字。系統自動調出文字對應的圖像,進行比對。同時,以醒目的顏色標出識別可信度不離的文字。

6)版面還原。將識別並修改好的文本還原成跟掃描文稿版面的布局一樣、可以供計算機閱讀和查詢檢索的RTF、PDF、HTML、SGML/XML格式的數字文檔。

7)數據入庫。版面還原數字文檔的保存。

4.4 提立OCR識別率的方法

利用OCR數字加工系統生成的雙層PDF,文本層差錯率最低可到萬分之一,可呈現原版底紋和色彩風貌,可進行全文檢索和復制引用,且檢索信息可准確定位到字元,便於快速查找目標信息。為了減輕橫向校對即人工校對工作量,提高工作效率,就要從根本上提高識別率。經過試驗,以下幾個方法可以提高柵格文件OCR識別率。

1)圖像色彩設定。雖然灰度或彩色模式可以最大限度還原紙質資料原貌,是我們掃描數字化的首選,但是這兩種色彩模式會增大影響識別率的背景噪音。若僅做文字識別及一般黑白插圖選取,建議可將掃描程序的圖像色彩設定設置為黑白,增大識別率。不過最終圖像色彩的設定還要按照各類具體工作的規范要求來設置。

2)解析度設置。我們都知道掃描解析度設置越低,掃描速度越快,但同時也導致圖像質量差,其文字識別准確率低。反之解析度高,掃描速度慢,但文字識別准確率高。但這又不是絕對的,因為解析度設置得太高後,紙張上的微小瑕疵也可能被認作標點符號或漢字等,文字識別准確率反而會有所降低。經反復測試,解析度設為300dpi,是掃描速度及文字識別准確率的最佳平衡點。

3)圖像處理。這里圖像處理是指掃描輸出圖像前的傾斜校正和去污等。傾斜校正是為了調整文字方向使之正向,這樣才能對OCR識別有所幫助。

雙層PDF轉換完成以後,在此基礎上可以實現資料管理系統與PDF文件的掛接,對資料數據內容及其元數據等相關信息建立聯系並形成數據包;然後通過調用全文資料庫原數據創建索引文件,最後實現全文檢索。通過全文資料庫及全文檢索的實現,得到高查全率和查准率,大幅度提高地質資料的利用價值,促進地質資料編研工作,為地質資料信息聚合的研究和深層次服務奠定了基礎。

參考文獻

[1]許呈辰.檔案數字化過程中OCR技術的應用[J].檔案管理,2011(1).

[2]徐永芳.OCR技術在檔案數字化過程中的應用[J].藝術科技,2011(2).

[3]張旋.OCR技術研究進展及前瞻[J].科學技術,2010(4).

[4]郭金光.雙層PDF技術及在檔案數字化中的應用[J].新觀察,2013(1).

[5]劉家真.文件保存格式與PDF文檔[J].檔案學研究,2002(2).

⑵ 《走向21世紀中國經濟的現狀、問題和前景》pdf下載在線閱讀,求百度網盤雲資源

《走向21世紀》(帕金斯)電子書網盤下載免費在線閱讀

資源鏈接:

鏈接:https://pan..com/s/1zWB7f74g9MLY77CbzfjJPQ

密碼:1aeh

書名:走向21世紀

作者:帕金斯

譯者:陳志標

出版社:江蘇人民出版社

出版年份:1992

頁數:296

內容簡介:

走向21世紀的中國經濟將面臨哪些重要的問題,其前景如何?應該如何理解中國的經濟體制?改革和發展對中國經濟的運行帶來了哪些深刻變化?本書收入美、澳、新加坡等國學者的論述,內容涉及中國經濟發展與改革的各個方面,並探討了市場化和發展戰略、計劃體制及城市化道路選擇等問題,為我們開闊視野,提供了多方位的借鑒。

⑶ 電子簽名行業有哪些企業,發展前景怎麼樣

原標題:2018年電子簽名行業發展現狀與市場競爭格局分析 頭部企業將占據更多份額

市場規模持續快速增長

電子簽名是指數據電文中以電子形式所含、所附用於識別簽名人身份並表明簽名人認可其中內容的數據。通俗點說,電子簽名就是通過密碼技術對電子文檔的電子形式的簽名,並非是書面簽名的數字圖像化。

近些年,我國電子商務和電子政務迅猛發展,由此帶來的網路認證和安全問題顯得日漸突出。由於缺乏統一的網上安全認證體系,解決網上交易出現的糾紛時,法律工作者調查取證、明辨是非顯得異常困難。

電子簽名的出現就是為解決電子商務和電子政務發展過程中的法律障礙,即電子文件的簽字蓋章問題。2004年8月,《中華人民共和國電子簽名法》通過並於次年4月1日起施行,該法首次賦予電子簽名與文本簽名同等的法律效力,明確了電子認證服務的市場准入制度,為網上信息傳遞和電子交易的安全提供了法律保障。



更多數據參考前瞻產業研究院發布的《中國電子認證服務業市場需求預測與投資戰略規劃分析報告》。

⑷ 電子書市場的發展歷程是怎麼樣的

從竹簡到絲帛,從線裝到裝訂,歷次閱讀革命始終沒有脫離書籍的本質。在互聯網時代,電子書將閱讀從紙張轉向了屏幕,由此帶來的變革大有顛覆傳統閱讀之勢。

用戶眼中的電子書

與2003年相比,2005年您購買圖書的數量?

您是否會以紙書價格的60%購買保真電子書?

您會選擇購買哪種電子書閱讀器(單選)?

擁有專用閱讀器後,您買紙書多還是電子書多?

您購買保真電子書的最主要原因(多選)?

如果您需要某本書,會從哪些渠道獲取(多選)?

有哪類圖書,您會更想閱讀電子書,而非紙書?

擁有閱讀器後,您喜歡怎樣購買電子書(單選)?

在互聯網時代,電子書、去網上書店買書、通過數字圖書館借書、手機上看書等新興事物已經為人們的閱讀打開了更多便捷之門。網上書店、電子書等新服務的出現給讀者帶來了怎樣的影響?傳統書店與網上書店到底有什麼不同之處?讀者閱讀和購買行為又有怎樣的偏好和趨向?

在《中國計算機報》聯合方正電子展開的「2006互聯網時代讀者閱讀情況調查」中,這些問題有了明確答案。此次調查隨機選擇2005年在傳統書店和網上購買一本書以上的讀者(14歲以上)進行問卷調查。從回收的4140份有效問卷顯示結果來看,不難得出這樣幾個重要結論。

解讀一:讀者未來會購買更多圖書

數據調查顯示,與2003年相比,有44%的讀者在2005年購買了更多圖書,有33%讀者的購買數量保持不變。絕大多數讀者購買圖書會保持不變或者增長,這樣的規模對所有出版商來說都是一個利好消息。這里調查的圖書購買,既包括傳統紙質圖書,也包括電子出版物。

解讀二:從互聯網獲取圖書的讀者過半數

讀者獲取圖書的首要渠道還是去圖書館借書,還有31%的讀者選擇購買圖書。在買書的時候有32%選擇了到網路書店去買紙質的圖書。其中,有個重要數據是網站讀書頻道的閱讀圖書數據增長22%,這也是讀書消費模式的改變,現在有越來越多的讀者選擇網上在線瀏覽。同時上網路書店買紙書、網上購買和借閱保真電子書、網路下載免費圖書等形式也得到讀者認可。目前,互聯網已經成為六成讀者獲取圖書的渠道。

解讀三:讀者真正購買的是書的內容

調查數據顯示,可以在電腦上閱讀、復制和粘貼成為讀者購買電子書的主要原因,這個結論說明了其實書的形態不再是最重要的,讀者願意去看和復制,是因為書的內容有價值,讀者真正購買的是書的內容。數據再次印證了消費者未來選擇電子書是一個必然趨勢,同時也可以看到工具書和休閑期刊佔有最大比例。

解讀四:專業閱讀器對讀者買書有促進作用

在專用閱讀器的購買對象方面,有38%的讀者傾向於購買經濟型閱讀器。同時,也有近三成讀者拒絕購買專用閱讀器,這對未來出版電子圖書如何選擇格式或出版印刷跨平台的兼容模式提出了新挑戰。

而擁有專用閱讀器後,有44%的讀者選擇到網上搜索各電子書網站進行下載,這預示著未來電子出版和網站合作將成為重要命題;傾向於到定點網站上下載的會員比例也接近三分之一。而在按張列印的調查中,有78%的讀者都不需要,列印成本較高可能是導致這一狀況的主要原因。

電子紙:未來的閱讀會這樣

為什麼人們還是習慣於白紙黑字的紙質閱讀?主要是因為紙質媒體在環境光下閱讀,實現了高亮度,同時反差也大,實現了高解析度,並且還能實現180度的視角。而且,紙張還有手持時可彎曲、文字不會很快消失等優點。所以很多人都有這樣的經歷,對於一些篇幅較長的文件要列印出來閱讀。

人們的習慣也意味著數字出版面臨的一大挑戰,就是需要有一個擁有紙質閱讀一樣舒適效果的閱讀器,然而液晶顯示屏卻是不能代替紙讀物的。從閱讀舒適度來看,電腦屏幕與紙張相比實在是差別很大:液晶屏需要用背景燈,長時間閱讀容易讓眼睛感覺疲勞;而電子書閱讀器通常使用反射型液晶屏,反差程度低,亮度上感覺不夠好。

電子紙就是解決以上矛盾的一種選擇,這種利用電子裝置顯示,而且具有像紙張一樣的高可視性的「電子紙張」能夠盡可能模擬傳統紙質的功能和閱讀體驗。與傳統紙張相比,電子紙最大的特點就是內容不固定,它是可以隨意存取、反復使用的。在電子紙上反復寫入信息有兩種方式,一種是手寫輸入,另一種是通過網路下載刷新內容。它比PDA更輕便,可隨意折疊;比筆記本電腦更便攜,操作也更簡單。只要帶一張電子紙,無論在什麼地方,都能像電腦上網那樣,通過網路下載、查閱大量信息。而且因為電子紙顯示幾乎和真的紙張一樣清晰穩定,也不會造成眼睛疲勞。

目前正在開發的電子紙張可單色顯示靜態圖像,其目標就是為了取代紙張顯示。電子紙背景的純白度和文字的清晰度非常高,對比度有的甚至超過了報紙。在易用性方面,電子紙也已經多少能夠彎曲了。為了迎合人們的閱讀習慣,電子紙甚至已經可以做得和真的紙張有差不多的薄厚和外觀。它具有超薄、像印刷物一樣的質感、關閉電源後仍保持顯示狀態的記憶特性,而且由於屬於不需背照燈的反射方式,因此不需要一直通電,也能將內容顯示得清清楚楚。

試想這樣一款新型電子紙閱讀器,不足半毫米厚,還能輕輕彎曲,平時可藏在手機內,要閱讀時拉出即可。而且它更大的優勢在於數字媒體容量大、便於檢索,這樣的使用前景是很誘人的。

目前實現電子紙的技術還採用電泳顯示,分別帶正電和負電的白色顆粒和黑色顆粒在透明液體中運動,通過不同電壓決定浮到表面的是白色或黑色顆粒。當環境光照射時,所有環境光都會被散射或反射回來。通過加大電壓,呈現墨水的感覺。這是簡單的黑白顯示器,能實現甚至超過傳統紙字的高解析度,而且解析度不是由材料本身決定的,是由後面驅動板決定的。

現在的電子紙技術正在從黑白走向彩色,實現可彎曲化,並使電子紙具備交互性。未來我們不僅可以看到隨身攜帶的電子報紙,可折疊的電子書、電子速記本等都將出現在我們的身邊。

黑白電子紙目前已經實現了產業化,並且擁有傳統紙媒體的特徵。2004年,飛利浦進行了驅動器的集成、系統等工作,並把相應成果在2004年推向市場。

目前的發展趨勢主要是電子閱讀的需求日益增長。人們獲取信息的需求以及要求增強了。電子紙閱讀器將會給人們生活帶來很大影響:閱讀材料隨時在身邊,及時收到最新報刊,像紙一樣舒適的閱讀,不需要帶很重的書包,下載方便……而且除了閱讀以外,還可以支持手寫。

電子紙技術的應用也會帶來很多社會影響,首先是降低紙張使用,減少樹木使用量;其次是發行運輸費用將大幅減少;第三,電子紙的放大功能也使它更適合老年人和殘疾人閱讀。

可以想像,數字化生活將會因為電子紙的普及翻開嶄新一頁。

讓電子紙更接近紙張

為了避免電子顯示方式的缺陷,也為了迎合人的閱讀習慣,電子紙必須具備三個條件:首先是文字便於閱讀,要讓人覺得是在純白的紙上閱讀,純白度越高背景越白文字就越清楚;其次是能夠實現關閉電源繼續顯示,因為真正閱讀的時候,可能會需要一個頁面保持一定的顯示時間;第三是顯示器的超輕薄和可折疊,使之接近於紙張。

要實現這些條件,科學家們認為,應該朝三個方向努力。一是實現現有顯示器的超輕薄和可折疊;二是使用列印機和提高紙張列印技術,例如目前正在研究在紙張上塗上特殊的液體,從而使之成為能夠多次改寫的紙張;三是提高能夠復制發光畫面信息的復制技術。

Apabi:未來的出版會這樣

本是「傳統出版+網路技術」產生了圖書網路出版,但二者卻並非是簡單疊加。網路技術對傳統出版的改造正在進行。作為產業鏈條上游環節的網路出版技術服務商,能提供的技術先進程度如何,直接決定其他環節的競爭力強弱。

2000年前後,隨著計算機與互聯網技術在各領域的廣泛應用,讀者對於網路閱讀以及從網上檢索圖書信息的需求日益顯著。同時,圖書館也開始有計劃地建設數字圖書館,利用電子資源為讀者提供服務。這一系列變化促動了出版社與IT技術提供商合作開展網路出版,中國的電子書產業開始萌生。

在隨後一年多里,方正依據國際OEB標准,成功研發了方正Apabi網路出版整體解決方案。目前,方正Apabi已成為領先的電子書傳播平台之一。這都建立在方正Apabi兩項核心技術基礎之上:CEB(版式文件)技術和DRM(數字版權保護)技術。

CEB(版式文件)處理技術能夠將各種格式的文件原版原式地轉化成統一格式,在轉換中真實地保持了原有文件中文字、圖表、公式、色彩等版式和信息,實現高保真的顯示效果。CEB格式數據量小,利於傳輸。CEB技術完全符合OEB標准。數字版權保護技術以一定的計算方法,實現對數字內容的保護,防止數字內容的非授權復制,最終用戶必須得到授權後才能使用數字內容。方正Apabi DRM對電子書、電子報紙、電子雜志、電子文檔等數字內容進行保護,實現數字內容的可控二次傳播,使數字內容使用過程可控、可跟蹤。

與此同時,出版社在向互聯網時代的內容服務提供商轉型的過程中,也在尋求與IT技術廠商合作,拓展網路出版。如高等教育出版社、機械工業出版社、清華大學出版社等。

方正Apabi因為擁有電子書出版傳播技術及平台,最終成為這些出版「大腕」的合作夥伴。方正通過協議形式獲得出版社的書面授權,並取得作者授權,保證了方正推出的每本Apabi電子書的「正版」。

作為網路時代的智能知識庫的數字圖書館,目前已經得到普遍應用。方正與出版社推出的電子書成為這些數字圖書館的重要數字資源。目前,北京大學圖書館、清華大學圖書館等全國520多家高校圖書館,首都圖書館、上海市圖書館等全國80%以上的省級圖書館及清華附中等1100多家中小學都在應用Apabi電子書或建成方正Apabi數字圖書館。

方正Apabi五大產品系列

1.方正Apabi製作出版軟體

方正阿帕比製作出版軟體,包括兩個部分,即阿帕比轉換軟體和阿帕比編輯軟體。前者是數據轉換工具,可以把用於印刷的電子文檔,轉換為可閱讀的電子書文件CEB。後者可以對CEB文件建立目錄連接,還可以製作eBook的元數據信息。

2.方正Apabi安全發行軟體

經過阿帕比製作出版軟體生成的CEB文件,可以提交到該軟體,自動對提交的CEB文件進行加密,保護電子書的版權,並管理相應元數據。

3.方正Apabi交易處理軟體

該軟體為網上書店提供eBook交易平台,網上書店可以通過該軟體得到eBook下載許可證,並發給讀者。

4.方正Apabi數字圖書系統

圖書館可以從出版社或發行者批量或單獨購買具有版權保護的eBook;讀者通過數字圖書館進行eBook的借、還書。

5.方正Apabi閱讀軟體

可以閱讀CEB、XEB、PDF、HTML、TXT和OEB等文件,實現了讀者購買的電子書與機器硬體的信息綁定。

互聯網:傳統書店的新商機

網路無處不在,其中蘊含著巨大商機,圖書批發和零售業也面臨著新發展。傳統圖書銷售業該如何利用好互聯網呢?我認為,就是要快速發展電子商務,藉助網路優勢來擴大銷售,搶佔新市場。

圖書零售要電子商務化

開拓網上交易,正成為一股不可阻擋的潮流,人們也正在逐步地接受這種網路營銷的模式。圖書電子商務網站的發展也是一種必然趨勢。圖書是最易實現電子商務的商品,作為圖書零售領域的電子商務網站,更是集易於推廣、易於被公眾所認知、貨品流轉快、資金易回籠等特點於一身,圖書的網路營銷發展前景非常看好。

然而在目前圖書類網站中,傳統書店所佔的份額可以說極其微小。非傳統書店的網站卻占據網上圖書銷售的大部分。在傳統書業里,各大書店也都在積極地籌建和運作自己的網上書店。但作為傳統書店,雖然對圖書經營非常熟悉,但在電子商務運作方面經驗不多,技術水平有限,很難有大的作為。

面對巨大商機,傳統書店的電子商務網站發展取決於兩方面因素,一是時間,二是投入。作為傳統書店,最大的優勢就是有實體店面、品種齊全、供貨渠道通暢以及物流配送體系的快速高效。而一些非傳統書店由於沒有實體依託,在信譽、備貨上存在著一定瓶頸,這正是給傳統書店的未來留下了發展機遇。

提高知名度 創造新商機

利用互聯網,傳統書店可以做很多事情。比如公布書店信息,塑造企業形象,提高公司的知名度;發布營銷活動、店面布局、地址、電話及路線;增進與讀者溝通互動,及時展開各種調查回饋;展示新品,引導讀者購買等。

以中關村圖書大廈為例,網站開通兩年時間,流量也迅速攀升。目前日頁面訪問量為4萬次,獨立IP訪問量近1萬個。統計結果顯示,上網購買的群體大多為白領和文化人士以及學生,這部分人群有上網習慣和購買力。

在充分利用網路資源的基礎上,去年中關村圖書大廈與北大方正電子合作,將店面導購的功能和在線閱讀引入網站,這樣不僅豐富了網站內容,同時將店內圖書利用方正網路展示給讀者。使讀者足不出戶就能查閱圖書,並有效引導讀者來店購買。

傳統書店充分利用互聯網資源,准確把握商業機會,吸引更多網民到店購書,迎回更多讀者是傳統書店立命的關鍵。

(中關村圖書大廈總經理孟凡洪)

電子書漫談

狹義電子書指的是手持閱讀設備,現在廣義上把數字化的紙書稱為ebook。

電子書給人們帶來很多新的體驗:首先是電子書可以提供詳細的索引和全文檢索功能,可以讓讀者快速、准確、輕松地找到所需部分;其次,電子書不僅保持紙書的原版原式,同時還可以附帶音頻、視頻等多媒體內容,增加更多體驗,提高學習效果;第三,每本電子書所佔的存儲空間很小,約為4M左右,一張DVD光碟就可以儲存近千本圖書,不僅節約了圖書館空間,而且方便用戶攜帶;第四,電子書內容不易遭到破壞,有利於資料的永久保存。

數字圖書館引發閱讀高潮

我們重視數字圖書館的發展,除了因為它代表先進技術之外,更重要的是它可以有針對地彌補所需。

回顧清華大學附屬中學的圖書館,從過去的一間圖書室發展到現在有多間獨立館舍。個人感覺最明顯的特點可以概括為一多、二老、三少。一多是指我們的舊書多;二老是指我們的人員知識結構老化,以及設備、館舍和電子設備比較老化;三少是指館舍少、資金少、人員數量少,多數館都是3~5人。而信息部門資金少則是遺留問題了,圖書館基本上是只有投入、沒有產出的部門。雖然這種情況目前經過各種評估已經得到一定改善,但並非一朝一夕能見效的,我們認為數字圖書館對我們改變現狀有一定幫助。

首先是電子圖書的價格比較低,從資金上可以彌補圖書館資金缺少的缺陷。其次是方正數字圖書館多數採用的是中圖法的分類,我們的工作人員就不用再重復工作,只要把購買拷貝就完成了,非常方便。再有就是拷貝的電子書佔用的是虛擬空間,不用佔用館舍的實際空間。任何一個圖書館也不能做到24小時開館,可是數字圖書館建成了,學生連接網路就可以使用我們的圖書館,這樣就利用數字圖書館擺脫了時間和地域的限制。

就清華附中來說,去年開通了數字圖書館,正式使用到現在有半年時間。我們在開通後發布了消息,指導學生使用。現在我們的熱門書的比例大概佔到了3%到4%,當時購買的是18000種,我們的副本是1本,預約次數是79人次、續借人數是74人次,這個在熱門書里佔到了10%。我們的登陸在線瀏覽的人次是4518次,下載是680多次,導航次數是11000多次,而這還只是在網上發布通知,沒有大規模宣傳。在使用中,我們發現這樣一種現象,每隔一兩個月在網上發布一次消息,每次發布都會引起一次使用小高潮,學生和家長就會前來咨詢。

我們下一步的打算是,與方正一起對老師和學生分別進行培訓,教師培訓還沒有開始,學生已經進行了一次小范圍的培訓。在每個班級我們都選出一名圖書委員,負責圖書館和學生之間的溝通,這一次我們就利用這個圖書委員對數字圖書的推廣工作進行了一下帶動,學生對使用數字圖書館熱情很高。我們同時也取得了學校其他部門的支持,比如我們同方正合作製作了應用短片,學校電教會不定期播放來加深學生印象。對於中小學來說,數字圖書館將來會是很有前途的一項工作。

電子書發展的四大趨勢

趨勢一:紙質書和電子書將多元並存

今天更多的電子書是在PC機、筆記本電腦上閱讀,而接下來移動電子書和手持設備將會迅速發展;隨著技術成熟,同時生產成本降低,有圖像甚至有動畫的多媒體電子書也將日漸流行。而按需印刷則和按頁列印仍然有著旺盛生命力,尤其是一些學術類書籍。

對於閱讀器來說,2006年是在中國發展的一個重要轉折點,在中國將至少有4款閱讀器步入實用,以解決屏幕閱讀不適的問題。這些閱讀器的共同特點是顯示閱讀質量接近紙質,外觀精美,同時價格段涵蓋了從1000元到6000元,能滿足不同層次的用戶需求。

趨勢二:圖書館和大眾市場互為促進

通過圖書館市場,培育了大量熟悉電子書的讀者。圖書館的最終讀者是大眾,不管是學生、老師,還是政府官員都是大眾,這樣一來大眾市場對電子書的了解增加,一定會逐漸啟動。反過來大眾讀者對電子書的強勁需求,又會成為圖書館建設電子書的動力,圖書館和大眾市場將互為促進。

趨勢三:出版社推進網路出版

成立專職機構推進網路出版機制的出版社日漸增多。據統計,基本形成網路出版機制的出版社在2003年是6家,2005年為45家,預計2006年會達到80家,2007年將達到180家。

在推進機制建設中,有三個核心要素:專職部門或人員負責;制訂年度出版計劃,包括數量、出版時間、預期收益;與社內考核機制掛鉤。在這三項當中,專職的部門和人員負責是核心要素。

趨勢四:e紙一體化

「e書亦書」,這是書業定位於內容服務提供商的自然結論。在具體產品開發和經營中,電子書和紙書如果一體化運作會產生新的商機。針對「e紙一體化」的趨勢,以電子書和互聯網為技術的「圖書營銷聯盟」日前宣告成立。聯盟定位就是由北大方正Apabi與全國知名出版社、書店和網站共同打造立體化的圖書信息網路,旨在幫助讀者在任何時間和地點方便地獲取圖書。

電子書這樣讀

電子書閱讀的終端設備很多,比如圖中的筆記本電腦、PDA、智能手機等等。

PC和筆記本電腦的優勢在於存儲容量大和內容更新方便。但弱勢也顯而易見,它不具備良好的便攜性,用戶很難實時閱讀。

PDA和智能手機也可以在輔助辦公之餘閱讀電子書,軟體下載也比較豐富,如鼎鼎大名的 iSilo for Pocket PC、eReader等等。只是因為尺寸受限,閱讀也只能偶爾為之。

掌上游戲機PSP和性能強大的超便攜電腦則因其超大屏幕尺寸和不錯的電池續航能力,也成為了閱讀電子書的一項選擇。

手持閱讀器則是在專攻電子書閱讀的終端設備,它凸現了許多紙質圖書沒有的優點,能夠搜索,可以下載、更換圖書內容;還使得電子書脫離電腦,真正成為能隨身攜帶、自由移動的「書」。

⑸ 簡述印刷的演變和發展趨勢

印刷科技發展趨勢

資料來源:《中華印刷科技學會會訊》第65期 主講者:陳政雄

--------------------------------------------------------------------------------

數位、資訊與智慧,徹底改變了印刷傳播及生產方式,我們不僅要在本位上求更快、更好及更有效率的生產,如何融入其他傳播媒體,將文字圖形與影像資訊做更廣泛應用,在多元媒體領域創造更多價值,使精緻印刷資訊檔,成為業務和傳播作業的重要一環。印刷媒材可能縮減但絕不會消失,因為人類對視覺感官永遠有需求,印刷技術插足高科技生產,今天也絕非到頂點,未來將有更多地方會應用到,只是我們如何去面對、因應而已。然而,在今年參展的廠商基本資料試著以XML、PostScript File結合Database的概念,單一輸入資訊檔(One input)並以多元化輸出(Many output)為應用。

一、自動設計與更順暢生產流程

電腦硬體和軟體快速進步,顯現在記憶容量和計算速度已有十倍、百倍成長,重覆性動作只要記下程序和變化量數,電腦便能模擬人的指令創作,如去背、加陰影、換底圖,只要有樣張及動作過程,電腦軟體人工智慧便能因應操作,不必每次都要人工一再操作,既快捷又省人工,而且沒有個人技術高低差別。電腦在語言輸入、OCR位元組辨識上,將會到達人類智能程度,只要人看懂的就可輸入,大幅降低輸入的負擔。影像擷取設備從數位相機、手機到掃描機、錄影機,來源更方便多元,智慧型翻譯,將使世界村的知識及資訊交流更頻繁、更無障礙,增加了印刷及傳播機會。PDF、XML等跨平台、跨媒體的檔案格式發展下,對傳播流程使用及自動生產助益很大。使用排程式自動化生產,一定會達到省力化,有時更達無人化生產地步。

二、網路應用使印刷傳播方式和技術改變

由於網路頻寬改善、加上檔案壓縮技術進步,檔案格式的限制減少,更快速方便的企業內部網路傳訊及外部網際網路應用下,目前承作小檔的網路合版印刷,將變成無遠弗屆的遠距打樣和遠距分散印刷。應用網路科技大幅改變印刷市場和生態,將來出版社倉庫只要一點點,只有伺服器出版物檔案及販售機制為主,利用鎖碼科技由指定印刷單位依需印刷及列印,或在各自客戶列印完了後檔案自動隱去,在這個時候,印刷業將只承製頁面檔案及管理這些資訊,印刷及列印是當地使用或遠方傳檔小量輸出的工作。業務人員不用帶型錄在世界展場跑,只要在當地列印,使用者付買書的權利金,回家自己輸出或委由專門店列印裝訂。

三、單一資訊檔多元化輸出應用

輸入來源有鍵盤、語音、數位板、數位相機、掃描器及電腦創作的文字、圖形(Computer Graphic)、影像及語音資訊,整合成解析度高可做大尺寸畫面的印刷用檔案,所以,除了印刷品及大海報之外,其他網頁、CD電子媒體都可以繼續使用這些頁面檔案,但這些電子檔的細致性,往往不如印刷媒體,因此印刷業須體認,自己是頁面資訊原創者、管理者地位,才有較大生存空間。

四、平版印刷的變革

平印是最廣泛應用的版式,正在處於走下坡的狀態,但基於效率、品質和成本,平印仍是在包裝、出版及商業印刷短、中、長版主要版式。CTP廣泛應用,使在成本和工程上有利,DI機上製版,跨越印前、印刷甚至加工階段。未來在奈米科技下,免用水一般PS版的單流體印刷,使平印品質成本更有競爭力,印刷濃度、色相的改善,使簡單的設備技術便能把平印應用自如,達到以前未有品質水準。CIP4將使印刷准備時間減少、印刷色彩再現更准確。在包裝和鐵皮印刷方面,有一種超壓縮氣墊橡皮布,可印1.5mm厚瓦楞紙,而不再需裱紙應用。套對已使用數位追蹤控制,未來的供水和供墨自動偵測回饋補償,將使平印機品質有更邏輯化演繹控制。

數位控制伺服馬達廣泛使用後,包括平印機的構造和控制將更簡便,伺服馬達不只在印刷單元或單一 筒驅動上取代曲柄、凸輪做應變彈性往復動作,更符合速度及印刷變化,在印刷機設計、製造及使用更簡單,而檢查維修更方便。若印壓減輕,印刷機結構將更輕薄短小。印刷機將追求更快的工作更換速度,而非印刷機絕對速度,除非是大型輪轉印報機、或商用輪轉機才有必要。

平印機的連線加工將更重要,能大幅提高生產附加值,包括原有上光、消光、全面使用陶瓷微穴輥供液,取代輥筒間隙及壓力的調量式,另外應環保要求,可脫墨回收的上光方式和能溶解分散的紙張回收才能符合標准。使用薄板型軋刀在平印機上做模切加工,是很有附加價值的加工。流水號、條碼、噴墨連線等可變印紋加工,打破平印固定印版的框架。菊四開小型機仍有強固小量多樣市場價值,尤其CTP的小尺寸高速製版、聚酯版基材低價位,顯現這類機器的靈活性。

五、凹版和柔版的消長

由於環保訴求,薄膜或合成皮等材料必須改用水性墨印刷,所以凹版的電子雕刻及成熟溶劑型油墨,也要改用腐蝕型較平淺的墨穴比較有利,因此,電子凹版 筒成像,以腐蝕凹陷才可能因應水性墨的印刷。柔版對水性墨的適應力較高,但印墨仍必須改善才能生產好的印刷品質,加上, CDI直接印版成像樹脂版或雷射燒灼成像,使柔版在工程縮短及成本降低下,可能逐步取代凹版在薄膜及合成材料印刷地位。在商標、表格及精緻瓦楞紙印刷方面,仍有發展空間,像銀行、信用卡、勞健保通知,都會有印刷彩色廣告頁,因此平印和柔印將有不同程度替代性。柔版對小量多樣在成本及彈性較佳,「無軸化」不論在凹版及柔版都是重要方向,尤其窄幅柔版有十種以上連線上光、裱膜、模切、網印及其他加工可能性,像刮刮樂彩券的多種加工,應用更寬。但凹版在寬幅兩公尺以上超大型、超高速雜志、文化及大量塑膠印刷較占優勢,如美國R.R.多納利公司就仍將大型化雜志印刷定位在凹版印刷,主要是其在薄紙印刷高濃度、高光澤及高品質再現上,連商用輪轉平印也趕不上。

六、網印精度和使用廣度增加

網版在彩色印刷已可使用175線技術,網點再現及濃度更勝平印,所以應用在很多個性化手機、電子用品,十分討好。另一方面,套印精度在5μ以下的電子產品如電路板、LCD-TFT數位相機零件等,也考驗網版印刷機的重復精度和再現印紋准確性。大型海報、旗幟印刷方面,國外採用多色機中間連結UV紫外線乾燥系統,使工作一氣呵成,大幅提升生產能力,但除大量海報及薄板印刷之外,小批量海報多使用巨型噴墨列印,將100張以下的市場取代,主要是工程短不用製版及上機,而且可用平台式噴墨在凹凸厚材料上,和網版印刷一競短長。網印機的自動化生產體系,是最急迫需求,因為電子廠高效率的要求是網印機廠研發重點。網版製版使用噴墨直接成像,仍未取代底片製版方式。

七、可變印紋列印 是發展最快部份

色粉、噴墨及電子印墨,是無版可變印紋列印三種主要方式。色粉為海德堡、全錄、HP、EPSON、Xeikon、IBM、Nipson、Oce'等公司所使用,每小時6000 張A4列印能力、1200dpi的精細輸出,可以全面或局部改變印紋,設置成本上可隨需要有很大的伸縮性,未來會在更低廉更快速上努力,以便爭取較大數量的列印工作,而且印紋光澤性、厚度也和平版相似,很難用肉眼分辨平印或色粉列印,但在前置檔案處理作業上有待加強,且尺寸最大隻有500×700mm,對用慣菊全平印的人仍然需要更大尺寸。將來色粉列印的印墨會更精細及色澤濃度會更改善。

電子印墨有Indigo及ToyoInk Elcosy兩種方式,Indigo在速度上達到每小時8000份A4列印能力,另一方面可以用淡色輔助的網點法列印,加裱膜上光達到相片品質。卷裝式Omnuis商標列印方式,做各種變化內容、連續號碼及顏色變化號碼防偽功能,將來在尺寸(尤其寬幅)增大,若達28寸(720mm)就可列印菊全印件以因應短版需求,不過目前仍困在速度慢、成本高的高價市場,無法普及。ToyoInk Elcosy列印是電磁作用(使水性印墨凝結附著)列印方式,機寬達600mm,速度每分達350英尺(105公尺),成本可以較低、材料適應力很強,研發至今5、6年仍未商用化。

噴墨列印是相當成熟實用技術,不論熱泡沫及壓電方式都不分軒輊,大小尺寸從相片到超大海報,甚至高速全噴墨表格列印生產,微針點已達4800dpi解析力,大海報也有360dpi可近看的解析力,使用UV乾燥的噴墨列印,在耐光性、耐候性及附著力三方面都很優秀,是大海報,不吸墨表面及厚重石板、鋼板、木板等材質的重要列印方式。

在寬幅1公尺上下的列印機,印刷業使用做打樣工作已十分普及,未來在海報生產、大型婚紗相片列印都有市場,尤其專輯印刷後頁畫檔、大尺寸列印布展,仍有相當大市場空間。Scitex的高速列印頭在電腦報表紙印刷後的可變資訊列印方面,已有十分成熟市場。而印刷機形成高速列印彩色全變化內容印件,寬幅在22寸(550mm)、速度達到每分鍾150公尺,有360dpi解析,未來一定更精緻而且速度更加提升。在過去十年,噴墨頭的能力已有一千倍以上進展,未來使用半導體製程噴墨頭一定是更大尺寸及精緻化,這是可以預期。

使用相位可重復變化顯現的電子紙、電子印墨,有一天可以成為書本方式,每次重復載入不同資訊而沒有廢紙產生,就如教室中那塊白板可由不同老師寫上不同資訊。它的小粒子內成份,因感應不同的極性,而形成顯色或消色效果,只要一次重新整合就成一張「白紙」,在環保上十分具有意義,印刷界就成了頁面資訊提供者。在商品、庫房、告示板可使用這樣的標紙,隨時改變價格或內容,不用重寫十分方便。

八、安全及防偽印刷

由於印刷設備和技術全面提升,傳統四色彩印商標、包裝及說明書已沒有防偽效果,必須用六色、七色高傳真彩印才會有所不同,另外,使用雷射全息黏標或燙金,也有它一定效果,但魔道消長,不久可能又要找更精細干涉波防偽圖案才可。凹版印刷成本高,也有它一定防偽效果,所以色澤濃、精細雕刻紋路,在高科技下有深一層防偽功效。壓紋、浮水印技術雖然古老,也是有效方法,像郵票齒孔由每一個模具達數百萬元所沖制,想模仿也不容易。總之,在成本不用加太高、仿製的人又不易模仿下,最重要的是不用工具一般人用眼光就能分辨才是防偽重點,但出來新技術方法,在使用一段時間之內就會被模仿,這是時時要更新的防偽重點。

九、印刷市場變化及因應

印刷業由原來生產製造業變為資訊傳播、包裝應用及工業應用加值產業,如何因應社會、市場和加值鏈破壞,市場往往由盛極而衰,利潤從有變無,如果固守原有范圍勢必血本無歸。二十年前出生率和現在相比只剩一半不到,教科書產業因就學兒童大幅降低,加上政府採取開放卻緊控價格的雞肋效應,原本豐厚市場也只剩少數幾家在苦撐。

如何在新的市場找到有利基的生產項目,如做別人做不到的設計、加工、立體印刷、變化體等仍有發展空間,UV紫外線在塑膠板上的印刷,有些外銷工作一年就有一百多萬美金業務,類似LCD-TFT彩色濾鏡印刷、更大厚度瓦楞紙直接平版彩色印刷,免印墨干涉波影像再現等,在市場的價值稀有和精緻化,所以要多方找尋,甚至開發新技術在市場上應用。因為利基市場時時在變化和更新,所以要能克服技術難關,做好服務工作,並掌握自身「核心技能」提升及應用,更重要的,在關鍵時刻要導入新設備及技術,以在市場上取得先機,才是創造利潤永續發展要件。

閱讀全文

與pdf發展前景相關的資料

熱點內容
linux禁止訪問某個ip 瀏覽:597
雲伺服器添加多個主機 瀏覽:285
linux設置lang 瀏覽:439
怎麼把pdf圖紙轉換成cad 瀏覽:16
伺服器掃雷怎麼辦 瀏覽:295
米哈游聖遺物掉落演算法 瀏覽:202
伺服器禁止mac地址訪問 瀏覽:982
南昌社保app如何下載 瀏覽:197
如何編譯輸出分數 瀏覽:799
雷電模擬器無法連接伺服器怎麼辦 瀏覽:745
學習唱歌應該用什麼app 瀏覽:594
封面選擇演算法 瀏覽:631
合並pdf文件mac 瀏覽:269
快點app在哪裡放歌 瀏覽:833
tftp上傳文件命令 瀏覽:587
新時代交互英語軟體伺服器地址 瀏覽:782
安卓傳數據到已激活蘋果怎麼傳 瀏覽:973
化妝pdf 瀏覽:137
編程語言專業難學嗎 瀏覽:492
酷狗的dns伺服器是什麼 瀏覽:752