/**
* 去除内容中的所有html标签
*/
public class DelTagsUtil {
public String delHtmlTags(String htmlStr){
//定义Script的正则表达式
String scriptRegex = "<script[^>]*?>[\\s\\S]*?<\\/script>";
//定义Style的正则表达式,用于去除style样式
String styleRegex = "<style[^>]*?>[\\s\\S]*?<\\/style>";
//定义html标签的正则表达式,用于去除标签,只提取文字
String htmlRegex = "<[^>]+>";
//定义空格,回车,还行符,制表符的正则表达式
String spaceRegex = "\\s*|\t|\r|\n";
//过滤Script标签
htmlStr = htmlStr.replaceAll(scriptRegex,"");
//过滤style标签
htmlStr = htmlStr.replaceAll(styleRegex,"");
//过滤html标签
htmlStr = htmlStr.replaceAll(htmlRegex,"");
//过滤空格等
htmlStr = htmlStr.replaceAll(spaceRegex,"");
System.out.println(htmlStr);
return htmlStr;
}
public static void main(String[] args) {
String infos = "<内容>";
DelTagsUtil delTagsUtil = new DelTagsUtil();
delTagsUtil.delHtmlTags(infos);
}
}
过滤掉内容中的html标签
原创
©著作权归作者所有:来自51CTO博客作者夜越圆啊的原创作品,请联系作者获取转载授权,否则将追究法律责任
提问和评论都可以,用心的回复会被更多人看到
评论
发布评论
相关文章