jsoup:一款使用Java語言開發的HTML解析器
jsoup 是一個用於處理真實世界的HTML的Java庫。
它提供了一個非常方便的API來提取和運算元據,使用最好的DOM,CSS和類似jquery的方法。jsoup 實現了 WHATWG HTML5 規範,並將 HTML 解析為與現代瀏覽器相同的 DOM。
- 從URL,檔案或字串中刮取和解析HTML
- 使用DOM遍歷或CSS選擇器查詢和提取資料
- 操縱HTML元素,屬性和文字
- 清除使用者提交的內容與安全的白名單,以防止XSS攻擊
- 輸出整齊的HTML
jsoup被設計用來處理在站外發現的各種HTML;從原始和驗證,到無效標籤湯;jsoup將建立一個合理的解析樹。
jsoup 有一個不足之處就是不支援JS。
相關文章
- jsoup Java HTML解析器:使用選擇器語法來查詢元素JSJavaHTML
- 使用java的HTML解析器 jsoup來防止XSS攻擊JavaHTMLJS
- Java中使用Jsoup解析HTML表格教程JavaJSHTML
- JAVA 解析html 型別字串(使用jsoup)JavaHTML型別字串JS
- 使用Python語言編寫簡單的HTML5語法解析器PythonHTML
- Java爬蟲系列三:使用Jsoup解析HTMLJava爬蟲JSHTML
- 【Java】Jsoup 解析HTML報告JavaJSHTML
- Jsoup教程,jsoup開發指南,jsoup中文使用手冊,jsoup中文文件JS
- C語言編譯器開發之旅(二):解析器C語言編譯
- java的跨開發語言功能Java
- Java開發之路—java語言概述Java
- Java爬蟲利器HTML解析工具-JsoupJava爬蟲HTMLJS
- 使用Jsoup解析Html == TextView顯示html圖片的方法JSHTMLTextView
- 【開發語言】PHP、Java、C語言的編譯執行過程PHPJavaC語言編譯
- java開發系統核心:使用C語言開發系統應用程式JavaC語言
- web開發語言的選擇:PHP or JAVA薦WebPHPJava
- 微信開發必備工具 php和java開發語言PHPJava
- 國人開發的程式語言-“明”語言
- Java 語言概述與開發環境(1)Java開發環境
- Java 語言概述與開發環境(2)Java開發環境
- 使用 Kotlin 語言開發 NeoForge 模組Kotlin
- java開發C語言編譯器:為C語言提供API呼叫JavaC語言編譯API
- Go 語言實現解析器翻譯Go
- 使用golang+antlr4構建一個自己的語言解析器(二)Golang
- 使用有限狀態自動機實現C語言的宣告解析器C語言
- 【語言】Java 日期 API 的使用技巧JavaAPI
- jsoup物件的使用JS物件
- App 開發語言APP
- 開發一款屬於自己的程式語言 聽起來是不是很酷?
- java和.net 雙語言開發框架,開源的PaaS平臺Java框架
- Java語言特點及開發工具JDK(轉)JavaJDK
- 使用go語言開發hive匯出工具GoHive
- 使用Go語言開發短地址服務Go
- HTML語法大全_html語言語法大全(必看)HTML
- Oracle8i中使用Java語言來開發儲存過程OracleJava儲存過程
- 解析-HTML 解析器HTML
- Google 開源了世界上最準確的語言解析器 Parsey McParsefaceGo
- Android開發基礎07-掌握Java語言AndroidJava