解析掌握PHP導(dǎo)出Word文檔原理

2010-10-19 10:17:24來源:作者:

  PHP語言可以被我們用來實(shí)現(xiàn)很多功能。比如在網(wǎng)站建設(shè)中,我們經(jīng)常會用到網(wǎng)頁導(dǎo)出數(shù)據(jù)的情況。今天就為大家介紹有關(guān)PHP導(dǎo)出Word文檔的原理。

  PHP語言可以被我們用來實(shí)現(xiàn)很多功能。比如在網(wǎng)站建設(shè)中,我們經(jīng)常會用到網(wǎng)頁導(dǎo)出數(shù)據(jù)的情況。今天就為大家介紹有關(guān)PHP導(dǎo)出Word文檔的原理。

  一般,有2種方法可以導(dǎo)出doc文檔,一種是使用com,并且作為php的一個(gè)擴(kuò)展庫安裝到服務(wù)器上,然后創(chuàng)建一個(gè)com,調(diào)用它的方法。安裝過office的服務(wù)器可以調(diào)用一個(gè)叫word.application的com,可以生成word文檔,不過這種方式我不推薦,因?yàn)閳?zhí)行效率比較低(我測試了一下,在執(zhí)行代碼的時(shí)候,服務(wù)器會真的去打開一個(gè)word客戶端)。理想的com應(yīng)該是沒有界面的,在后臺進(jìn)行數(shù)據(jù)轉(zhuǎn)換,這樣效果會比較好,但是這些擴(kuò)展一般需要收費(fèi)。

  第2種方法,就是用PHP導(dǎo)出Word文檔內(nèi)容直接寫入一個(gè)后綴為doc的文件中即可。使用這種方法不需要依賴第三方擴(kuò)展,而且執(zhí)行效率較高。

  word本身的功能還是很強(qiáng)大的,它可以打開html格式的文件,并且能夠保留格式,即使后綴為doc,它也能識別正常打開。這就為我們提供了方便。但是有一個(gè)問題,html格式的文件中的圖片只有一個(gè)地址,真正的圖片是保存在其他地方的,也就是說,如果將HTML格式寫入doc中,那么doc 中將不能包含圖片。那我們?nèi)绾蝿?chuàng)建包含圖片的doc文檔呢?我們可以使用和html很接近的mht格式。

  mht格式和html很類似,只不過在mht格式中,外部鏈接進(jìn)來的文件,比如圖片、Javascript、CSS會被base64進(jìn)行編碼存儲。因此,單個(gè)mht文件就可以保存一個(gè)網(wǎng)頁中的所有資源,當(dāng)然,相比html,它的尺寸也會比較大。

  mht格式能被word識別嗎?我將一個(gè)網(wǎng)頁保存成mht,然后修改后綴名為doc,再用word打開,OK,word也可以識別mht文件,并且可以顯示圖片。

  好了,既然doc可以識別mht,下面就是考慮如何將圖片放入mht了。由于html代碼中的圖片的地址都是寫在img標(biāo)簽的src屬性中,因此,只要提取html代碼中的src屬性值,就可以獲得圖片地址。當(dāng)然,有可能您獲取到的是相對路徑,沒關(guān)系,加上URL的前綴,改成絕對路徑就可以了。有了圖片地址,我們就可以通過file_get_content函數(shù)獲取到圖片文件的具體內(nèi)容,然后調(diào)用base64_encode函數(shù)將文件內(nèi)容編碼成 base64編碼,最后插入到mht文件的合適位置即可。

  最后,我們有兩種PHP導(dǎo)出Word文檔方法將文件發(fā)送給客戶端,一種是先在服務(wù)器端生成一個(gè)doc文檔,然后將這個(gè)doc文檔的地址記錄下來,最后,通過header("location:xx.doc");就可以讓客戶端下載這個(gè)doc。還有一種是直接發(fā)送html請求,修改HTML協(xié)議的header部分,將它的content-type設(shè)置為application/doc,將content-disposition設(shè)置為 attachment,后面跟上文件名,發(fā)送完html協(xié)議以后,直接將文件內(nèi)容發(fā)送給客戶端,也可以讓客戶端下載到這個(gè)doc文檔。

關(guān)鍵詞:PHP