1. 如何將html頁面轉成pdf
1安裝Adobe Acrobat後會默認在IE瀏覽器中添加PDF工具欄。
該工具可以方便的將網頁轉化成PDF文檔,或者添加入已有的PDF文檔,Adobe PDF Explorer工具欄則可以在IE的收藏夾界面內管理window內的HTML文檔與PDF文檔的轉化。
2、安裝單獨的pdf虛擬列印機(pdffactory、ultra pdf等),通過網頁的列印功能轉換。
3使用客戶端軟體HTML2PDF_Pilot。
HTML2PDF_Pilot的截面如上圖,很簡潔。
如果只是要完成最簡單的工作只需如箭頭所示,點擊上方的添加按鈕添加HTML文檔然後點擊轉換,稍等既可以完成一個HTML文檔的轉化工作。
兩種方法的比較
靈活性:
PDF工具欄的方式相比客戶端的方式要靈活許多。
在使用的過程中發現HTML2PDF_Pilot不能通過URL(網址)直接轉化PDF文檔,而工具欄只需在瀏覽的過程隨意使用。
功能:在功能的環節上,客戶端方式的HTML2PDF_Pilot就明顯要比PDF工具欄要強大許多
工具欄只提供了最基本的保存和添加入已有文檔的功能,而HTML2PDF_Pilot則提供了更為豐富的選項。
另外,如果需要批量轉化網頁文件的話,工具欄的方式也無法提供對應的功能。
其實還是有很多可以選擇的方式,比如把網頁轉化為WORD的文件格式然後通過WPS軟體來轉化文檔等,只要能靈活運用,html文件轉PDF是非常簡單的事情。
2. 怎麼用php在HTML中生成PDF文件
FPDF是一個允許使用純PHP生成PDF文檔的PHP類,換句話說,沒有使用PDFlib 函數庫。FPDF中的F代表免費和自由:你可以在任何情況下使用,並且支持自定義,來滿足你特定的需求,特點:
1、可以選擇單元、頁面格式和邊距
2、可以管理頁眉和頁腳
3、自動分頁
4、自動換行和文本對齊
5、支持圖片(JPEG,PNG,gif)
6、色彩豐富,支持鏈接
順便也介紹一些可以直接從HTML生成PDF的函數庫。
DomPDF
domPDF將HTML轉換為PDF。DomPDF遵循CSS2.1的HTML布局,它是用PHP編寫的渲染引擎。DomPDF以樣式為主導:它會下載並讀取外鏈樣式表,內聯樣式和HTML元素的style屬性值。並且還支持大部分的HTML可見屬性。
特點:
1、處理大部分CSS2.1和少許CSS3屬性,包括@import, @media & @page 規則
2、支持大部分HTML 4.1的可見屬性
3、支持外部樣式表,包括本地或者http/ftp鏈接的(通過fopen-wrappers)
4、支持復雜的表結構,包括行和列的span,separate & collapsed border models和獨立的cell樣式
5、支持圖片(gif, png, bmp & jpeg)
6、不依賴於其他的PDF函數庫
TCPDF
TCPDF也可以用於生成PDF文檔,並且它是一個開源的PHP類庫。
TCPDF項目開始於2002年,現在已經被成千上萬的人自由使用。TCPDF is a Free Libre Open Source Software (FLOSS).
特點:
1、基本功能不依賴於其他PDF函數庫
2、標准頁面格式、支持頁面格式自定義、邊距自定義和單元計量
3、支持UTF-8編碼和文字方向從右到左的語言。
4、支持TrueTypeUnicode, OpenTypeUnicode, TrueType, OpenType, Type1 and CID-0等字體
5、支持字體子集,並提供方法發布一些XHTML + CSS code, Javascript and Forms
6、支持圖片和圖形的轉換
7、支持頁面壓縮(需要php-zlib擴展)
8、自動管理頁眉和頁腳
3. Python寫爬蟲都用到什麼庫
Python爬蟲,全稱Python網路爬蟲,是一種按照一定的規則,自動地抓取萬維網信息的程序或腳本,主要用於抓取證券交易數據、天氣數據、網站用戶數據和圖片數據等,Python為支持網路爬蟲正常功能實現,內置了大量的庫,主要有幾種類型。下面本篇文章就來給大家介紹。
一、Python爬蟲網路庫
Python爬蟲網路庫主要包括:urllib、requests、grab、pycurl、urllib3、httplib2、RoboBrowser、MechanicalSoup、mechanize、socket、Unirest for Python、hyper、PySocks、treq以及aiohttp等。
二、Python網路爬蟲框架
Python網路爬蟲框架主要包括:grab、scrapy、pyspider、cola、portia、restkit以及demiurge等。
三、HTML/XML解析器?
●lxml:C語言編寫高效HTML/ XML處理庫。支持XPath。
●cssselect:解析DOM樹和CSS選擇器。
●pyquery:解析DOM樹和jQuery選擇器。
●BeautifulSoup:低效HTML/ XML處理庫,純Python實現。
●html5lib:根據WHATWG規范生成HTML/ XML文檔的DOM。該規范被用在現在所有的瀏覽器上。
●feedparser:解析RSS/ATOM feeds。
●MarkupSafe:為XML/HTML/XHTML提供了安全轉義的字元串。
●xmltodict:一個可以讓你在處理XML時感覺像在處理JSON一樣的Python模塊。
●xhtml2pdf:將HTML/CSS轉換為PDF。
●untangle:輕松實現將XML文件轉換為Python對象。
四、文本處理
用於解析和操作簡單文本的庫。
●difflib:(Python標准庫)幫助進行差異化比較。
●Levenshtein:快速計算Levenshtein距離和字元串相似度。
●fuzzywuzzy:模糊字元串匹配。
●esmre:正則表達式加速器。
●ftfy:自動整理Unicode文本,減少碎片化。
五、特定格式文件處理
解析和處理特定文本格式的庫。
●tablib:一個把數據導出為XLS、CSV、JSON、YAML等格式的模塊。
●textract:從各種文件中提取文本,比如 Word、PowerPoint、PDF等。
●messytables:解析混亂的表格數據的工具。
●rows:一個常用數據介面,支持的格式很多(目前支持CSV,HTML,XLS,TXT:將來還會提供更多!)。
4. 初學前端有什麼推薦的書籍
初學者入門書籍:
中文電子書
深入淺出htmlpdf中文版
魅麗的網頁設計
Web程序設計(第5版)完整版
HTML&XHTML權威指南(英文+中文版)
Web編程入門經典:HTML、XHTML和CSS(第2版)
CSS商業網站布局之道(朱印宏著)
HTML與CSS入門經典(第7版)
EricMeyer談CSS(卷1)
EricMeyer談CSS(卷2)
無懈可擊的Web設計
XHTML實例精解
XHTML技術內幕
HTML簡明教程中文PDF版
DynamicHTML權威指南第3版
XML基礎教程入門、DOM、AJAX與FLASH(SasJacobs[美]著)
網頁視覺設計案例教程
英文原文電子書
DiveIntoHTML5
HTML5.and.CSS3:DevelopwithTomorrow'sStandardsToday
HTML5StepbyStep
BeginningHTMLwithCSSandXHTML
BeginningCSSWebDevelopment從入門到精通
CSSWebDevelopment從入門到精通
HTML,XHTML,andCSS-VisualQuickstartGuide第六版
深入淺出HTML(英文版)
Transcending.CSS(英文版)
完美HTML設計-使用CSS不用Table(第二版)
HTML,XHTML,andCSSBible,5thEdition
CSS禪意花園(高級CSS開發)
O'ReillyCSS:TheDefinitiveGuide第三版(CSS權威指南)
(5thEdition)
HTML5andCSS3:DevelopwithTomorrow'sStandardsToday
WroxWebStandardsProgrammer'sReference
SpringintoHTMLandCSS
HTML&XHTML-TheCompleteReference第四版
XHTMLMovingtowardXML
MasteringIntegratedHTMLandCSS
BuildyourOwnWebSite-TheRightWayUsingHTMLandCSS
HeadFirstHTMLwithCSS&XHTML
TheCSSAnthology(第三版)
TheCSSAnthology(第二版)
TeachYourselfHTMLin10Minutes第四版
UltimateHTMLReference
高級進階電子書:
中文電子書
HTML5高級程序設計(完整版)
css3_for_web_designers
CSS精粹(第3版)
CSSWeb設計高級教程第2版
大巧不工-WEB前端設計修煉之道
博客園精華集Web標准之道
編寫高質量代碼-Web前端開發修煉之道(完整版)
變幻之美——Div+CSS網頁布局揭秘(案例實戰篇)
Web導航設計
Web表單設計:點石成金的藝術
精通XHTML程序設計高級編程
徹底設計研究CSS
CSS時尚編程百例
英文原文電子書
Don'tMakeMeThink!
ProfessionalCSS:第二版
TheBookofCSS3:ADeveloper』sGuidetotheFutureofWebDesign
AccessibleXHTMLandCSSWebSites:Problem-Design-Solution
HowtoDoEverythingWithHTML
O'ReillyCSSCookbook
ABookApartCSS3ForWebDesigners
SpeedUpYourSite:WebSiteOptimization
O
BeginningCSS:
TheUltimateCSSReference
WroxCSSInstantResults
CSSMastery:AdvancedWebStandardsSolutions
CreatingCoolWebSiteswithHTML,XHTML,andCSS
BeginningHTMLwithCSSandXHTML:ModernGuideandReference
AccessibleXHTMLandCSSWebSites
O'ReillyCSSTheMissingManual
WileyCreatingWebSitesBible
ProCSSforHighTrafficWebsites
HTMLManualofStyle4th
O'ReillyHTML5:UpandRunning
StunningCSS3:Aproject-basedguidetothelatestinCSS
CanvasPocketReference:ScriptedGraphicsforHTML5
Apress.Pro.HTML5.Programming.Sep.2010
ProCSSTechniques
W3C官方手冊:
CSS完全參考手冊3.0
xHTML完全參考手冊5合1W3C官方權威手冊
HTML4.01規范-W3C官方HTML權威指南
HTML4.0參考手冊CHM
W3CHTML3.2規范
CSS2權威W3C官方參考手冊CHM
css手冊2.03.0
5. Python編程網頁爬蟲工具集介紹
【導語】對於一個軟體工程開發項目來說,一定是從獲取數據開始的。不管文本怎麼處理,機器學習和數據發掘,都需求數據,除了通過一些途徑購買或許下載的專業數據外,常常需求咱們自己著手爬數據,爬蟲就顯得格外重要,那麼Python編程網頁爬蟲東西集有哪些呢?下面就來給大家一一介紹一下。
1、 Beautiful Soup
客觀的說,Beautifu Soup不完滿是一套爬蟲東西,需求協作urllib運用,而是一套HTML / XML數據分析,清洗和獲取東西。
2、Scrapy
Scrapy相Scrapy, a fast high-level screen scraping and web crawling framework
for
Python.信不少同學都有耳聞,課程圖譜中的許多課程都是依託Scrapy抓去的,這方面的介紹文章有許多,引薦大牛pluskid早年的一篇文章:《Scrapy
輕松定製網路爬蟲》,歷久彌新。
3、 Python-Goose
Goose最早是用Java寫得,後來用Scala重寫,是一個Scala項目。Python-Goose用Python重寫,依靠了Beautiful
Soup。給定一個文章的URL, 獲取文章的標題和內容很便利,用起來非常nice。
以上就是Python編程網頁爬蟲工具集介紹,希望對於進行Python編程的大家能有所幫助,當然Python編程學習不止需要進行工具學習,還有很多的編程知識,也需要好好學起來哦,加油!
6. 初學前端有什麼推薦的書籍
一、《Web前端開發最佳實踐》
這本書是前端開發領域的經典之作,是一本扎實前端基本功,規范我們前端代碼的實踐性書籍。本書主要講解了HTML、CSS、Javascript以及移動端開發的最佳實踐方案,能夠對缺乏良好指導的開發者產生很大的幫助。通過閱讀本書我們可以掌握如何編寫高可讀性、高維護性、高性能的HTML、CSS以及Javascript。
二、《CSS那些事兒》
內容介紹:《CSS那些事兒》是2009年電子工業出版社出版的圖書,作者是林小志。該書通過對CSS技巧實例進行講解,淺入深地分析了CSS相關知識。
通過頁面中的文字、圖片、表格、表單等常見元素的處理及各種頁面布局方式的使用,使讀者能深入了解到如何在頁面中更好地運用CSS布局。尤其是在頁面布局的部分中,全面分析了多種布局方式,著重分解了兩列等高和三列等高的幾種方式,並相應說明了等高布局的優缺點。
八、高性能網站建設指南
內容介紹:《高性能網站建設指南》結合Web2.0以來Web開發領域的最新形勢和特點,介紹了網站性能問題的現狀、產生的原因,以及改善或解決性能問題的原則、技術技巧和最佳實踐。重點關注網頁的行為特徵,闡釋優化Ajax、CSS、JavaScript、Flash和圖片處理等要素的技術,全面涵蓋瀏覽器端性能問題的方方面面。