用PHP換個思路讀取WORD內容
專案:問卷
需求:WORD 匯入問卷
背景:運營那裡有幾百個 WORD 格式問卷,如果去後臺手動錄入,無疑工作量很大,希望能直接匯入。
心情:接到需求之後五味雜陳,因為以前做過 excel 匯入,而且有現成的外掛,程式碼也是一搜尋一堆。
word 匯入無疑涉及到了知識盲點,但是需求就在那裡,又懟不過產品同學!只能硬著頭皮上了。
難點:word 不好讀取內容,內容讀出來不好結構化。
解決問題思路:
先讀取 WORD, 再說怎麼結構化。
讀取 WORD:
一開始想著用 PHPWORD, 畢竟 PHPOFFICE 這麼成熟的外掛應該可以直接讀取到 WORD 內容吧。
然而現實很骨感,找遍了文件並沒有找到直接讀取到 WORD 內容的方法。PHPWORD 只提供了把 WORD 轉換成 HTML,TDF 的方法。
轉換思路:
既然不能讀取 WORD, 那我可以讀取 HTML, 只需要把 WORD 轉換成 HTML 就可以了,然後讀取 HTML 內容就行。
程式碼:
<?php namespace AppConsoleCommands; use IlluminateConsoleCommand; use PhpOfficePhpSpreadsheetReaderHtml; use PhpOfficePhpWordReaderWord2007; class Test extends Command { /** * The name and signature of the console command. * * @var string */ protected $signature = 'word'; /** * The console command description. * * @var string */ protected $description = 'word'; /** * Create a new command instance. * * @return void */ public function __construct() { parent::__construct(); } /** * Execute the console command. * * @return int */ public function handle(Word2007 $word) { //WORD轉換HTML $result=$word->load(storage_path('測試.docx')); $write=new PhpOfficePhpWordWriterHTML($result); $write->save(storage_path().'/測試.html'); //讀取HTML內容 $document=new DOMDocument(); $document->loadHTML(file_get_contents(storage_path('測試.html'))); $html=simplexml_import_dom($document); dd((array)$html->body); } }
開始測試:新建 測試.docx
測試.docx 內容:
執行指令碼:
php artisan word
結果:
以上就是用PHP換個思路讀取WORD內容的詳細內容,更多請關注php中文網其它相關文章!
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/4548/viewspace-2827324/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- PHP 讀取 WORD 內容PHP
- PHP讀取WORD內容PHP
- php將內容轉為wordPHP
- php 讀取excel中的內容到mysql 資料庫PHPExcelMySql資料庫
- 用 ABAP 讀取本地文字檔案內容試讀版
- 批次word文件內容查詢替換的方法
- php獲取xml檔案內容PHPXML
- 用linux shell逐行讀取文字檔案內容Linux
- js 讀取 input file 的內容JS
- mybatis讀取properties檔案內容MyBatis
- php mysqli query 查詢資料庫後讀取內容的方法PHPMySql資料庫
- PHP獲取HTTP body內容的方法PHPHTTP
- PHP 爬蟲爬取社群文章內容PHP爬蟲
- 多次讀取 HttpServletRequest 中 body 內容HTTPServlet
- zt 運用 Range 物件處理 Word 文件內容物件
- kettle 實用小功能(二),讀取一個目錄下文字檔案的內容
- java檔案相關(檔案追加內容、檔案內容清空、檔案內容讀取)Java
- word教程|用自定義屬性功能管理 Word 文件中的待定內容
- EasyExcel 輕鬆靈活讀取Excel內容Excel
- Python-使用openpyxl讀取excel內容PythonExcel
- 用php讀取elf結構PHP
- php文章內容替換為內鏈,有助於SEO優化PHP優化
- php獲取網頁內容的三種方法PHP網頁
- PHP獲取目錄中的全部內容RecursiveDirectoryIteratorPHP
- 讀取resources中properties檔案內容範例
- Java讀取本地檔案內容並輸出Java
- 使用CInternetSession和CHttpFile讀取網頁內容SessionHTTP網頁
- php獲取遠端檔案內容的函式PHP函式
- 用python寫一個指令碼,讀取srt檔案中的內容,並列印出重複的內容,且將不重複的內容儲存到新檔案中Python指令碼
- Spring Boot 讀取配置內容的三種方式Spring Boot
- JavaScript讀取文字檔案內容程式碼例項JavaScript
- PB讀取Excel檔案內容的方法(轉帖)Excel
- ThinkPHP6.0 內容匯出 Word 案例PHP
- vite vue-cli 讀取檔案原始內容 使用base64內容的檔案ViteVue
- handlebars.js 用 <br>替換掉 內容的換行符JS
- vim內替換檔案內容
- JavaScript讀取本地檔案內容(相容低版本IE)JavaScript
- ajax讀取檔案中內容的程式碼例項