开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 1241|回复: 12
收起左侧

[已解决] txt文本,查找指定文本所在行内容

 关闭 [复制链接]
结帖率:96% (47/49)
发表于 2023-1-5 12:09:09 | 显示全部楼层 |阅读模式   贵州省黔南布依族苗族自治州
100精币
1. txt文本内容为100万行不重复数据,格式类似:
[HTML] 纯文本查看 复制代码
西瓜水果
苹果水果
香蕉水果
茄子蔬菜
梨子水果
...


2. 输入某个关键字,cha询txt文本,输出该关键字所在的行全部内容。如输入"香蕉",cha询后输出"香蕉水果"。

3. 已经尝试加载文本后分割数组计次循环判断cha询、文本_取文本所在行等,效率都不太行。请教各位大佬,帮忙指点下。


补充内容 (2023-1-5 12:45):
目前已有用快速文本对象的方法,百万行数据cha询1秒内,不知道还有没有更优解。

补充内容 (2023-1-5 13:26):
目前用快速字节集cha询,百万行108MB文件大小只需要150毫秒,还有没有更快的

最佳答案

查看完整内容

[e=0] .版本 2 .支持库 commobj .支持库 spec .程序集 窗口程序集_启动窗口 .程序集变量 ksw, 快速字节集对象 .子程序 _编辑框1_内容被改变 .局部变量 a, 整数型 .局部变量 b1, 整数型 .局部变量 b2, 整数型 .局部变量 q, 整数型, 静态 .局部变量 c, 快速字节集对象 .局部变量 b3, 字节集 .局部变量 i1, 整数型 q = 取启动时间 () 列表框1.清空 () .判断循环首 (i1 < 30) a = ksw.寻找字节集 (到字节集 (编辑框1.内容), ...

回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳

本帖被以下淘专辑推荐:

签到天数: 14 天

发表于 2023-1-5 12:09:10 | 显示全部楼层   广西壮族自治区柳州市
  
窗口程序集名保 留  保 留备 注
窗口程序集_启动窗口   
变量名类 型数组备 注
ksw快速字节集对象  

子程序名返回值类型公开备 注
_编辑框1_内容被改变  
变量名类 型静态数组备 注
a整数型 
b1整数型 
b2整数型 
q整数型 
c快速字节集对象 
b3字节集 
i1整数型 
q = 取启动时间 ()
列表框1.清空 ()
判断循环首 (i1 < 30)
a = ksw.寻找字节集 (到字节集 (编辑框1.内容), a + 1)
判断 (a ≠ -1)
b1 = ksw.倒找字节集 ({ 13, 10 }, a) + 2
b2 = ksw.寻找字节集 ({ 13, 10 }, a)
b3 = ksw.取字节集 (b1, b2 - b1)
如果真 (c.寻找字节集 ({ 13, 10 } + b3 + { 13, 10 }, ) = -1)
c.添加 ( #换行符, b3, #换行符 )
列表框1.加入项目 (到文本 (b3), )
i1 = i1 + 1

跳出循环 ()

判断循环尾 ()
调试输出 (取启动时间 () - q)
子程序名返回值类型公开备 注
__启动窗口_创建完毕  
ksw.从文件读 (“V:\s.txt”)
调试输出 (ksw.取长度 () ÷ 求次方 (1024, 2), “MB”)
ksw.添加 ( #换行符 )
ksw.插入 (1, #换行符 )
子程序名返回值类型公开备 注
_列表框1_列表项被选择  
变量名类 型静态数组备 注
a整数型 
a = 列表框1.现行选中项
如果真 (a > -1)
编辑框1.内容 = 列表框1.取项目文本 (a)


i支持库列表   支持库注释   
commobj通用对象支持库
spec特殊功能支持库



快速字节集比快速文本更快

点评

厉害,字节集确实比文本快好几倍,我文本有108MB,cha询只需150毫秒。   贵州省黔南布依族苗族自治州  发表于 2023-1-5 13:24
好的我试试看谢谢   贵州省黔南布依族苗族自治州  发表于 2023-1-5 13:15

评分

参与人数 1荣誉 +1 收起 理由
笨潴 + 1 热心帮助他人,荣誉+1,希望继续努力(*^__^*) 嘻嘻!

查看全部评分

回复

使用道具 举报

结帖率:97% (36/37)

签到天数: 1 天

发表于 2023-1-5 12:10:56 | 显示全部楼层   江西省南昌市
文本_取文本所在行(好像有这个命令)
回复

使用道具 举报

结帖率:96% (47/49)
 楼主| 发表于 2023-1-5 12:17:40 | 显示全部楼层   贵州省黔南布依族苗族自治州
StarAdmire 发表于 2023-1-5 12:10
文本_取文本所在行(好像有这个命令)

嗯嗯,这个测试过了,cha询一次需要十几秒,时间有点长。
回复

使用道具 举报

签到天数: 14 天

发表于 2023-1-5 12:32:51 | 显示全部楼层   广西壮族自治区柳州市
BZBTSLE3BF5HONT92J.png

  
窗口程序集名保 留  保 留备 注
窗口程序集_启动窗口   
变量名类 型数组备 注
ksw快速文本对象  

子程序名返回值类型公开备 注
_编辑框1_内容被改变  
变量名类 型静态数组备 注
a整数型 
b1整数型 
b2整数型 
q整数型 
c快速文本对象 
b3文本型 
i1整数型 
如果真 (取启动时间 () - q < 99)
返回 ()
q = 取启动时间 ()
列表框1.清空 ()
判断循环首 (i1 < 30)
a = ksw.寻找文本 (编辑框1.内容, a + 1, )
判断 (a ≠ -1)
b1 = ksw.倒找文本 ( #换行符, a, ) + 2
b2 = ksw.寻找文本 ( #换行符, a, )
b3 = ksw.取文本 (b1, b2 - b1)
如果真 (c.寻找文本 ( #换行符 + b3 + #换行符, , ) = -1)
c.添加 ( #换行符 + b3 + #换行符 )
列表框1.加入项目 (b3, )
i1 = i1 + 1

跳出循环 ()

判断循环尾 ()
子程序名返回值类型公开备 注
__启动窗口_创建完毕  
ksw.从文件读 (“V:\s字母20w.txt处理后.txt”)
调试输出 (ksw.取长度 () ÷ 求次方 (1024, 2), “MB”)
ksw.添加 ( #换行符 )
ksw.插入 (1, #换行符 )
子程序名返回值类型公开备 注
_列表框1_列表项被选择  
变量名类 型静态数组备 注
a整数型 
a = 列表框1.现行选中项
如果真 (a > -1)
编辑框1.内容 = 列表框1.取项目文本 (a)


i支持库列表   支持库注释   
commobj通用对象支持库
spec特殊功能支持库



补充内容 (2023-1-5 12:35):
4.7MB ,二十万行 ,开机三分钟机械硬盘的七年前的笔记本老电脑

点评

非常感谢分享,我测试看下   贵州省黔南布依族苗族自治州  发表于 2023-1-5 12:36
回复

使用道具 举报

结帖率:96% (47/49)
 楼主| 发表于 2023-1-5 12:35:20 | 显示全部楼层   贵州省黔南布依族苗族自治州
通过论坛搜索,找到该贴16楼大佬分享的源码,测试了cha询一次时间800毫秒左右。
  
窗口程序集名保 留  保 留备 注
窗口程序集_启动窗口   
变量名类 型数组备 注
快速文本对象快速文本对象  

子程序名返回值类型公开备 注
_按钮_cha询文本_被单击  
cha询文本 (编辑框1.内容)
子程序名返回值类型公开备 注
cha询文本  
参数名类 型参考可空数组备 注
搜索内容文本型
变量名类 型静态数组备 注
n整数型 
开始位置整数型 
结束位置整数型 
开始整数型 
结束整数型 
行内容文本型 
开始 = 取启动时间 ()
循环判断首 ()
n = 快速文本对象.寻找文本 (搜索内容, n + 1, )
如果 (n ≠ -1)
开始位置 = 快速文本对象.倒找文本 ( #换行符, n, ) + 1
结束位置 = 快速文本对象.寻找文本 ( #换行符, n, )
行内容 = 快速文本对象.取文本 (开始位置, 结束位置 - 开始位置)
跳出循环 ()

循环判断尾 (n ≠ -1)
结束 = 取启动时间 ()
调试输出 (搜索内容, 行内容, 结束 - 开始)
子程序名返回值类型公开备 注
_按钮_读取文本_被单击  
读取文本 ()
子程序名返回值类型公开备 注
读取文本  
快速文本对象.从文件读 (取运行目录 ()“\tpall.txt”)


i支持库列表   支持库注释   
commobj通用对象支持库
spec特殊功能支持库

回复

使用道具 举报

结帖率:96% (47/49)
 楼主| 发表于 2023-1-5 12:42:23 | 显示全部楼层   贵州省黔南布依族苗族自治州
真冬 发表于 2023-1-5 12:32
[e=0]
.版本 2
.支持库 commobj

看了代码也是用快速文本对象的cha询,不知道还有没有更快的方法,再等等看没有更优解的话给您设最佳答案,谢谢。
回复

使用道具 举报

结帖率:75% (12/16)

签到天数: 6 天

发表于 2023-1-5 12:58:20 | 显示全部楼层   江西省赣州市
看是不是你要的

寻找行文本.e

871.13 KB, 下载次数: 22

7K5H_DAVZXD8ZWO2T7VD.png
回复

使用道具 举报

签到天数: 1 天

发表于 2023-1-5 13:35:48 | 显示全部楼层   广东省深圳市
  
子程序名返回值类型公开备 注
_按钮1_被单击  
变量名类 型静态数组备 注
bin字节集 
i整数型 
i2整数型 
i3整数型 
q整数型 
bin = 读入文件 (“C:\Users\Airuan\Desktop\MyQQ v3.0.6\config\Aisy插件\wiki数据.txt”)到字节集 ( #换行符“测试测试测试你好你好哈”#换行符 )  ' 这是文件尾部 如果 在其他位置速度更快
q = 取启动时间 ()
i = 寻找字节集 (bin, 到字节集 (“你好你好哈”), )
i2 = 寻找字节集 (bin, { 13, 10 }, i)
i3 = 倒找字节集 (bin, { 13, 10 }, i2) + 2
调试输出 (到文本 (取字节集中间 (bin, i3, i2 - i3)))


i支持库列表   支持库注释   
spec特殊功能支持库

回复

使用道具 举报

结帖率:100% (12/12)
发表于 2023-1-5 14:22:23 | 显示全部楼层   浙江省舟山市
字节集应该是最快的了

补充内容 (2023-1-5 14:31):
再快一些好像要用到线程了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 诚聘英才| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 800073686,邮箱:800073686@b.qq.com
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表