java获取富文本里的图片链接并原地替换

1541年前java技术701

背景:将图文一键群发至多个微信公众号时,需要将富文本里的图片链接并原地替换成当前公众号用户的图片链接。

直接上代码:

/***
     * 获取富文本里的图片链接
     * @param htmlStr
     * @return
     */
    public static List<String> getImgStr(String htmlStr) {
        List<String> list = new ArrayList<>();
        String img = "";
        Pattern p_image;
        Matcher m_image;
        // String regEx_img = "<img.*src=(.*?)[^>]*?>"; //图片链接地址
        String regEx_img = "<img.*src\\s*=\\s*(.*?)[^>]*?>";
        p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE);
        m_image = p_image.matcher(htmlStr);
        while (m_image.find()) {
            // 得到<img />数据
            img = m_image.group();
            // 匹配<img>中的src数据
            Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img);
            while (m.find()) {
                list.add(m.group(1));
            }
        }
        return list;
    }

    public static void main(String[] args) {
        String htmlStr = "<p>一闪一闪亮晶晶,<img src=\"http://www.xx.com/2022/12/09/bNJ3gk2q6zWdqdu_20221209152446A001.png\">满天都是小星星<img src=\"http://www.xxx.cn/images/12345678.jpeg\"></p>";

        List list=getImgStr(htmlStr);
        for (Object a:list){
            System.out.println(a.toString());
            htmlStr = htmlStr.replace(a.toString(),"11");
        };
        System.out.println(list);
        System.out.println(htmlStr);
    }


相关文章

HashMap中的Object(value值)以int类型取出

 根据jdk的情况使用  int value= (Integer) ((HashMap<String, Object>) object1).get("...

使用Myeclipse 8.5开发基于JAX-WS的Web service实例

使用Myeclipse 8.5开发基于JAX-WS的Web service实例

 本文为Web service 开发入门篇,主要介绍在Myeclipse 8.5环境下开发Web service的服务程序和客户端程序的基本流程。 在Weblogic 11g...

java实现将“yyyy-MM-dd”格式字符串转化成“yyyy年MM月dd日”格式

可写入工具类,直接调用即可:public static String getChinaDate(String str) {        try { ...

get方式调用http接口   Header赋参数值

get方式调用http接口 Header赋参数值

   /**      195.     * 发送...

java实现用ffmpeg 获取视频时长

首先需要引入ffmpeg.exe调用 int time = ConvertM3U8.getVideoTime(downloadPath);方法: st...

The content of elements must consist of well-formed character data or markup

 XML 元素必须遵循以下命名规则:1.名称可以含字母、数字以及其他的字符 (尤其是 你的内容是否包含了"< "或 ">&quo...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。