登录
注册
写文章
发现
工具
java获取Html文本中的img标签下src中的内容
_3t3lfz KEKfID
编辑文章
java获取Html文本中的img标签下src中的内容
asfx站长
2020.10.20 07:30:00
阅读
771
```java /** * 从html中解析img的src字段值,且剔除重复的 * @param htmlStr * @return */ public static List<String> getImgFromHtml(String htmlStr){ if(StringUtils.isBlank(htmlStr)) return null; List<String> pics = new ArrayList<>(); String img = null; Pattern p_image; Matcher m_image; String regEx_img = "<img.*src\\s*=\\s*(.*?)[^>]*?>"; p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE); m_image = p_image.matcher(htmlStr); Map<String, String> map = new HashMap<>(); while (m_image.find()) { // 得到<img />数据 img = m_image.group(); // 匹配<img>中的src数据 Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img); while (m.find()) { String imgUrl = m.group(1); if(map.get(imgUrl) == null){ pics.add(imgUrl); map.put(imgUrl, imgUrl); } } } return pics; } ```
我的主页
退出