記憶體中html原始碼用IHTMLDocument2進行DOM方式解析

farcall發表於2011-04-01

準備開發一款站群系統,不過不準備用webbrowser 因為webbrowser 會下載整個網頁 甚至圖片,而這並非我所需要的,我只是需要其html程式碼即可  而winnet穩定性又不高,所以最終選擇了winnet的升級版winhttp

不過winhttp讀取到原始碼之後解析是個大問題,本來打算用正規表示式,不過我並不擅長,而且需要處理的問題非常多,網上倒是有幾個html解析原始碼 諸如htmlcxx 但是我最終還是放棄了  選擇用IHTMLDocument2 進行解析,因為這畢竟之前操作過,更熟悉一些,相容性方面也不存在什麼問題, 不過之前使用IHTMLDocument2 是因為開發BHO或有webbrowser控制元件的MFC程式 他們都有doc載體,在consle程式中還沒有操作過,經過一番google 終於寫出了可用的程式碼

 

相關文章