开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 2141|回复: 13
收起左侧

[已解决] 正则表达匹配到的文本 怎么只导入不重复的文本到超级列表框

 关闭 [复制链接]
结帖率:60% (3/5)
发表于 2013-12-24 15:19:17 | 显示全部楼层 |阅读模式   广东省深圳市
5精币
.版本 2
.支持库 json
.支持库 iext

    返回文本1 = 编码转换_Utf8转ansi (http.取字节集 ())
    处理事件 ()
    Sleep (到整数 (编辑框5.内容))
    正则.创建 (#文本正则, 返回文本1, 真, 真, 真)


    .计次循环首 (正则.取匹配数量 (), 次数)
        临时表项 = 超级列表框1.插入表项 (, , , , , )
        超级列表框1.置标题 (临时表项, 0, 正则.取子匹配文本 (次数, 1))
        处理事件 ()
    .计次循环尾 ()

    .计次循环首 (正则.取匹配数量 (), 次数)
        返回文本3 = 返回文本3 + 正则.取子匹配文本 (次数, 1) + #换行符
        写到文件 (取运行目录 () + “\成功的公司名.txt”, 到字节集 (返回文本3))
    .计次循环尾 ()

运行发现 重复数据还是继续一直不停的提取

最佳答案

查看完整内容

就这样吧,你应该能看懂。。。

求助知识:请将问题描述清楚,最好把你有问题的源码打包上传上来,这样更方便大家帮助你。
友情提醒:本版被采纳的主题可在 申请荣誉值 帖子申请荣誉值,获得 3点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
结帖率:100% (6/6)
发表于 2013-12-24 15:19:18 | 显示全部楼层   江西省南昌市
例子.zip (1.59 KB, 下载次数: 41)

点评

你这个是先产生了数据然后比对 我的 意思是最好是这种 数据第一次从网站采集到超级列表框时时保存到本地 自动循环第二次采集 重复过滤的信息   广东省深圳市  发表于 2013-12-24 16:11

评分

参与人数 1荣誉 +3 收起 理由
笨潴 + 3 热心帮助他人,荣誉+3,希望继续努力(*^__^*) 嘻嘻

查看全部评分

回复

使用道具 举报

结帖率:100% (6/6)
发表于 2013-12-24 15:25:43 | 显示全部楼层   江西省南昌市
.计次循环首 (正则.取匹配数量 (), 次数)
        返回文本3 = 返回文本3 + 正则.取子匹配文本 (次数, 1) + #换行符
        
    .计次循环尾 ()

写到文件 (取运行目录 () + “\成功的公司名.txt”, 到字节集 (返回文本3))

写到文件可以放在循环外面,只要写出一次就ok了,你开始的时候已经将返回文本3累加了

至于你说的文本数据重复问题,应该指的是你的原始数据里面就有重复(我猜的),你用下精易模块的里面的数组去重复。。。。具体你看命令注释就ok了
回复

使用道具 举报

结帖率:100% (3/3)

签到天数: 16 天

发表于 2013-12-24 15:39:29 | 显示全部楼层   广东省揭阳市
你是要将 超级列表框的数据写到本地? 那直接计次循环超级列表框的项目数就好啦,就可以不要用匹配了
回复

使用道具 举报

结帖率:60% (3/5)
 楼主| 发表于 2013-12-24 15:39:56 | 显示全部楼层   广东省深圳市
烂好人 发表于 2013-12-24 15:25
.计次循环首 (正则.取匹配数量 (), 次数)
        返回文本3 = 返回文本3 + 正则.取子匹配文本 (次数, 1 ...

返回文本1 = 编码转换_Utf8转ansi (http.取字节集 ()) 是不停采集 数据返回源码  如果跳出 就不采集数据了
回复

使用道具 举报

结帖率:60% (3/5)
 楼主| 发表于 2013-12-24 15:45:20 | 显示全部楼层   广东省深圳市
冰点 发表于 2013-12-24 15:39
你是要将 超级列表框的数据写到本地? 那直接计次循环超级列表框的项目数就好啦,就可以不要用匹配了

不是 是通过不停采集网站 返回的数据    返回文本1 = 编码转换_Utf8转ansi (http.取字节集 ())   返回源码  怎么过滤重复采集
回复

使用道具 举报

结帖率:100% (6/6)
发表于 2013-12-24 15:45:39 | 显示全部楼层   江西省南昌市
我懂你的意思了,你一直在采集数据,保存也是时时保存?你在加入超级列表框的时候循环判断一次 是否已经存在应该就行了,在你每次加入的时候和已经存在的一一对比一次
回复

使用道具 举报

结帖率:60% (3/5)
 楼主| 发表于 2013-12-24 15:48:28 | 显示全部楼层   广东省深圳市
烂好人 发表于 2013-12-24 15:45
我懂你的意思了,你一直在采集数据,保存也是时时保存?你在加入超级列表框的时候循环判断一次 是否已经存 ...

是这样的  但不知道怎么写 才能表达你说的那样意思

点评

那麻烦烂好人了哈   广东省深圳市  发表于 2013-12-24 15:57
等我给你写个例子   江西省南昌市  发表于 2013-12-24 15:52
回复

使用道具 举报

结帖率:100% (3/3)

签到天数: 16 天

发表于 2013-12-24 15:53:58 | 显示全部楼层   广东省揭阳市
烂好人 说的对,因为你是通过超级列表作为中转的,所以在加入的时候,就判断是否数据重复,重复就不加入到 超级列表框就可以,然后,你就只管保存 超级列表框中不重复的数据啦

点评

版版跟好人说的 是我想表达意思 可以是我就不知道代码 怎么写   广东省深圳市  发表于 2013-12-24 16:04
回复

使用道具 举报

结帖率:100% (3/3)

签到天数: 16 天

发表于 2013-12-24 16:12:00 | 显示全部楼层   广东省揭阳市
好像又比烂好人慢了,,我的话,例子就没了。 告诉你方法吧 - -,往超级列表框添加数据的时候,用  超级列表框1.查找表项()  命令先查找一下,找到了就会返回 大于 -1 的 整数,就不添加进去,没找到,就返回-1,这个就添加进去。就是这样了。。 至于及时保存,方法就很多了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表