pythonwordlinux_請問怎麼學習Python

⑴ 如何在 Linux 上使用 python 讀取 word 文件信息

第一步：獲取doc文件的xml組成文件

import zipfiledef get_word_xml(docx_filename):
with open(docx_filename) as f:
zip = zipfile.ZipFile(f)
xml_content = zip.read('word/document.xml')
return xml_content

第二步：解析xml為樹形數據結構
from lxml import etreedef get_xml_tree(xml_string):
return etree.fromstring(xml_string)

第三步：讀取word內容：
def _itertext(self, my_etree):
"""Iterator to go through xml tree's text nodes"""
for node in my_etree.iter(tag=etree.Element):
if self._check_element_is(node, 't'):
yield (node, node.text)def _check_element_is(self, element, type_char):
word_schema = '99999'
return element.tag == '{%s}%s' % (word_schema,type_char)

⑵ 如何在 Linux 上使用 Python 讀取 word 文件信息

首先下載安裝win32com
from win32com import client as wc
word = wc.Dispatch('Word.Application')
doc = word.Documents.Open('c:/test')
doc.SaveAs('c:/test.text', 2)
doc.Close()
word.Quit()

這種方式產生的text文檔，不能用python用普通的r方式讀取，為了讓python可以用r方式讀取，應當寫成

doc.SaveAs('c:/test', 4)

注意：系統執行完成後，會自動產生文件後綴txt（雖然沒有指明後綴）。
在xp系統下面，應當
open(r'c:\text','r')
wdFormatDocument = 0
wdFormatDocument97 = 0
wdFormatDocumentDefault = 16
wdFormatDOSText = 4
wdFormatDOSTextLineBreaks = 5
wdFormatEncodedText = 7
wdFormatFilteredHTML = 10
wdFormatFlatXML = 19
wdFormatFlatXMLMacroEnabled = 20
wdFormatFlatXMLTemplate = 21
= 22
wdFormatHTML = 8
wdFormatPDF = 17
wdFormatRTF = 6
wdFormatTemplate = 1
wdFormatTemplate97 = 1
wdFormatText = 2
wdFormatTextLineBreaks = 3
wdFormatUnicodeText = 7
wdFormatWebArchive = 9
wdFormatXML = 11
wdFormatXMLDocument = 12
= 13
wdFormatXMLTemplate = 14
= 15
wdFormatXPS = 18

照著字面意思應該能對應到相應的文件格式，如果你是office 2003可能支持不了這么多格式。word文件轉html有兩種格式可選wdFormatHTML、wdFormatFilteredHTML（對應數字 8、10），區別是如果是wdFormatHTML格式的話，word文件裡面的公式等ole對象將會存儲成wmf格式，而選用 wdFormatFilteredHTML的話公式圖片將存儲為gif格式，而且目測可以看出用wdFormatFilteredHTML生成的HTML 明顯比wdFormatHTML要干凈許多。
當然你也可以用任意一種語言通過com來調用office API，比如PHP.
from win32com import client as wc
word = wc.Dispatch('Word.Application')
doc = word.Documents.Open(r'c:/test1.doc')
doc.SaveAs('c:/test1.text', 4)
doc.Close()
import re
strings=open(r'c:\test1.text','r').read()
result=re.findall('\(\s*[A-D]\s*\)|\(\xa1*[A-D]\xa1*\)|\（\s*[A-D]\s*\）|\（\xa1*[A-D]\xa1*\）',strings)
chan=re.sub('\(\s*[A-D]\s*\)|\(\xa1*[A-D]\xa1*\)|\（\s*[A-D]\s*\）|\（\xa1*[A-D]\xa1*\）','()',strings)
question=open(r'c:\question','a+')
question.write(chan)
question.close()
answer=open(r'c:\answeronly','a+')
for i,a in enumerate(result):
m=re.search('[A-D]',a)
answer.write(str(i+1)+' '+m.group()+'\n')
answer.close()
chan=re.sub(r'\xa3\xa8\s*[A-D]\s*\xa3\xa9','()',strings)
#不要()，容易引起歧義。

⑶ 請問怎麼學習Python

分享Python學習路線：

第一階段：Python基礎與Linux資料庫

這是Python的入門階段，也是幫助零基礎學員打好基礎的重要階段。你需要掌握Python基本語法規則及變數、邏輯控制、內置數據結構、文件操作、高級函數、模塊、常用標准庫模板、函數、異常處理、mysql使用、協程等知識點。

學習目標：掌握Python的基本語法，具備基礎的編程能力；掌握Linux基本操作命令，掌握MySQL進階內容，完成銀行自動提款機系統實戰、英漢詞典、歌詞解析器等項目。

第二階段：web全棧

這一部分主要學習web前端相關技術，你需要掌握html、cssJavaScript、JQuery、Bootstrap、web開發基礎、Vue、FIask Views、FIask模板、資料庫操作、FIask配置等知識。

學習目標：掌握web前端技術內容，掌握web後端框架，熟練使用FIask、Tornado、Django，可以完成數據監控後台的項目。

第三階段：數據分析+人工智慧

這部分主要是學習爬蟲相關的知識點，你需要掌握數據抓取、數據提取、數據存儲、爬蟲並發、動態網頁抓取、scrapy框架、分布式爬蟲、爬蟲攻防、數據結構、演算法等知識。

學習目標：可以掌握爬蟲、數據採集，數據機構與演算法進階和人工智慧技術。可以完成爬蟲攻防、圖片馬賽克、電影推薦系統、地震預測、人工智慧項目等階段項目。

第四階段：高級進階

這是Python高級知識點，你需要學習項目開發流程、部署、高並發、性能調優、Go語言基礎、區塊鏈入門等內容。

學習目標：可以掌握自動化運維與區塊鏈開發技術，可以完成自動化運維項目、區塊鏈等項目。

按照上面的Python學習路線圖學習完後，你基本上就可以成為一名合格的Python開發工程師。當然，想要快速成為企業競聘的精英人才，你需要有好的老師指導，還要有較多的項目積累實戰經驗。

對於Python開發有興趣的小夥伴們，不妨先從看看Python開發教程開始入門！B站上有很多的Python教學視頻，從基礎到高級的都有，還挺不錯的，知識點講的很細致，還有完整版的學習路線圖。也可以自己去看看，下載學習試試。

熱點內容

目送pdf 發布：2025-09-19 18:05:44 瀏覽：359

pdf如何只讀文件發布：2025-09-19 18:05:07 瀏覽：477

2019基金從業教材pdf 發布：2025-09-19 18:04:31 瀏覽：963

mvc的編程思想發布：2025-09-19 18:00:05 瀏覽：710

北京機架式伺服器雲空間發布：2025-09-19 17:57:38 瀏覽：553

電腦裝了svn伺服器是什麼發布：2025-09-19 17:56:17 瀏覽：407

多媒體壓縮和編碼發布：2025-09-19 17:42:42 瀏覽：878

php仿百度搜索發布：2025-09-19 17:38:09 瀏覽：362

單片機做混響發布：2025-09-19 17:28:33 瀏覽：101

下雨了程序員笑話發布：2025-09-19 17:26:02 瀏覽：489

程序員交通卡哪家好發布：2025-09-19 17:15:25 瀏覽：815

液體能壓縮嗎發布：2025-09-19 16:42:02 瀏覽：972

程序員穿特步相親受拒發布：2025-09-19 16:31:13 瀏覽：424

我的世界命令方塊獲得超強裝備發布：2025-09-19 16:10:11 瀏覽：426

單片機專項實訓知識總結發布：2025-09-19 16:09:12 瀏覽：466

sublimecss壓縮發布：2025-09-19 15:12:53 瀏覽：131

瀏覽器下載的app刪除了怎麼找回發布：2025-09-19 14:56:19 瀏覽：781

朋友圈解壓文字軟體發布：2025-09-19 14:55:32 瀏覽：925

keil5編程32單片機發布：2025-09-19 14:26:07 瀏覽：643

pdf文件截取發布：2025-09-19 14:21:26 瀏覽：166

導航:首頁 > 操作系統 > pythonwordlinux