java去除HTML標籤
/**
* 過濾html標籤
* @param htmlStr
* @return
*/
public synchronized static String delHTMLTag(String htmlStr){
String regEx_script="<script[^>]*?>[\\s\\S]*?<\\/script>"; //定義script的正規表示式
String regEx_style="<style[^>]*?>[\\s\\S]*?<\\/style>"; //定義style的正規表示式
String regEx_html="<[^>]+>"; //定義HTML標籤的正規表示式
Pattern p_script=Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);
Matcher m_script=p_script.matcher(htmlStr);
htmlStr=m_script.replaceAll(""); //過濾script標籤
Pattern p_style=Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);
Matcher m_style=p_style.matcher(htmlStr);
htmlStr=m_style.replaceAll(""); //過濾style標籤
Pattern p_html=Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);
Matcher m_html=p_html.matcher(htmlStr);
htmlStr=m_html.replaceAll(""); //過濾html標籤
return htmlStr.trim(); //返回文字字串
}
相關文章
- python去除html標籤PythonHTML
- oracle clob欄位去除html標籤OracleHTML
- java去除xml檔案中的標籤JavaXML
- 利用正規表示式去除所有html標籤,只保留文字HTML
- HTML <a> 標籤HTML
- HTML 標籤HTML
- HTML 標籤HTML
- html標籤HTML
- HTML標籤(基本標籤的使用)HTML
- HTML <var> 標籤HTML
- HTML <canvas> 標籤HTMLCanvas
- HTML <article> 標籤HTML
- HTML <section> 標籤HTML
- HTML <main> 標籤HTMLAI
- HTML <time> 標籤HTML
- html標籤整理HTML
- HTML <footer> 標籤HTML
- HTML <nav> 標籤HTML
- HTML <body>標籤HTML
- HTML <meta>標籤HTML
- html基本標籤HTML
- HTML <iframe>標籤HTML
- HTML <span>標籤HTML
- HTML 常用標籤HTML
- HTML常用標籤HTML
- HTML <div>標籤HTML
- html標籤使用HTML
- HTML標籤(1)HTML
- html列表標籤HTML
- HTML標籤(2)HTML
- HTML標籤(3)HTML
- html meta標籤HTML
- HTML DOCTYPE 標籤HTML
- html排版標籤HTML
- 01 HTML標籤HTML
- 前端html:標籤前端HTML
- html中常用的標籤-表格標籤HTML
- HTML標記之a標籤HTML