|
5精币
这个是我写的正则的代码:<a target="_blank" href="[\s\S]*?">([\s\S]*?)<[\s\S]*?网页视图[\s\S]*?href="([\s\S]*?)"
这个是需要被正则的文本 需要正则的文本.txt (151.16 KB, 下载次数: 1)
现在只能匹配9个出来,一共是10个,缺少的是第二个,问题出现在第一个上面,第一个由于网页源码内没有网页视图这几个字,而正则[\s\S]*?这个代表的意思是跳过所有代码,所以正则自动匹配到第二个的网页视图上面,我现在想不到还有什么办法呢个解决这个问题了。
看不懂上面这句话,看这里,比如: 1- 2-0 3-0 4-0 这是一段我想匹配的文本
我想匹配出 2和0 3和0 4和0
正则代码如下,
(.*?)-(.*?)
但是匹配的结果是这样的
1
2
03
04
这样的匹配的结果就不是我想要的数据了,我想要的是2-0 3-0 4-0 请问怎么利用正则解决这个问题啊
<a target="_blank" h="ID=SERP,5147.2">第二届全国离子液体与绿色过程学术会议征文模板</a></h2></div></div><div class="b_caption"><p>2011-7-14 · (用于硫醚选择氧化的烷基功能化<strong>离子液体</strong>杂多酸盐催化剂的制备和性能 赵萍萍,张明珏,王 军 南京工业大学 化学与化工学院,材料化学工程国家重点实验室 ...</p><div class="b_attribution"><cite>www.gs.fudan.edu.cn/_upload/article/08/50/38f84837451bb4...</cite> · <a target="_blank" h="ID=SERP,5151.1">网页视图</a></div></div></li><li class="b_algo"><div class="b_title"><div class="b_imagePair square_mi"><div class="inner"><a class="sb_fav" target="_blank"
上面这个就是单个需要正则的代码,主要取出“第二届全国离子液体与绿色过程学术会议征文模板” 和 “http://spxy.zjgsu.edu.cn/UploadFiles/20090403122617398.doc”
这两个
|
|