正则表达式 \\\\,百度文库爬虫最终版
1184 2023-05-23 10:57
"\\\\"字符串中,两个反斜杠被解释为一个反斜杠,再作为正则表达式, \\ 则被正则表达式引擎解释为 \,所以在正则表达式中需要使用四个反斜杠表示"\"
url_list = re.findall(r'(https:\\\\/\\\\/wkretype.bdimg.com.*?\d+)\\"', content)
替换成
url_list = re.findall(r'(https://wkretype.bdimg.com.*?\d+)"', content)
即可保存ppt中的所有图片
全部评论