如下所示:
p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #这样采集html时出错,采集不到数据,正则中.是不能匹配
换行符,改成如下:
p1 = r'(?<=<div class="ds_cr">)([sS]*?)(?=<div id="pageurl">)' # 这是我们写的正则表达式规则
相关推荐:《Python基础教程》
[sS]
s
匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ fnrtv]。
S
匹配任何非空白字符。等价于[^ fnrtv]。