|
发表于 2022-10-22 14:07:53
|
显示全部楼层
广西壮族自治区崇左市
想要效率就不能用易语言提供的文本处理命令, 需要自己实现, 子文本替换这个功能单个替换还行, 替换多个的话, 效率就严重低下
给你个思路, 能不能实现就看你了
1. 先预先分配替换后的文本需要的尺寸, 这个尺寸只能大概的计算, 在使用的过程中每次拷贝数据过去都需要判断尺寸是否足够存放, 不够就重新分配
比如把 a 替换成 b, 那就根据b的长度减去a的长度的差量 乘以一个可能替换的次数, 这样就得出一个差值
或者嫌麻烦就直接原文本尺寸 * 2, 不计算
2. 逐个字节循环需要替换的文本, 128以下一个字节增加, 128或128以上两个字节增加
循环内就判断所有需要替换的文本, 这里需要按指针来操作, 不然文本比较用易语言的话, 需要转换文本, 这个影响效率
使用c系列的文本比较函数, strncmp() 比较N个字符
3. 如果循环到的这个字节不需要匹配, 那就把这个字节拷贝到你申请的缓冲区内
如果循环匹配到这个字节需要替换, 那就把替换的文本拷贝到你申请的缓冲区内
每次拷贝数据都需要判断缓冲区是否足够存放, 不够就需要重新分配空间
4. 循环走完后, 你的缓冲区就是替换好的结果, 基本没有多少次内存申请和释放的操作
加入是1万个字节的文本, 需要替换100个文本, 最差的情况就是, 10000 * 100 次循环, 就是每次被替换的文本都是数组里的第100个
如果是易语言的子文本替换, 他内部怎么实现我也不清楚, 不知道会分配多少次内存
但是 xxx = 子文本替换() 至少会有一次申请内存和释放内存, 如果是100个文本需要替换, 那循环一次就需要申请100次内存+释放100次内存所以, 我这个方案就是减少申请内存和释放内存的操作, 循环次数应该也算是有优化
伪代码
欲分配内存 = 申请内存()
索引 = 0 ' 文本指针索引, 当前处理哪个字节, 这里按从0开始处理, 这个只是个伪代码
判断循环(文本指针[索引] != 0)
{
计次循环(替换的数组)
{
如果相等 strncmp
替换成 = 记录要替换成什么文本的文本指针
跳出循环
}
判断内存是否够存放()
判断 替换成 != 0
拷贝内存(欲分配内存 + n, 替换成) 这个欲分配内存需要跳转指针位置, 每次加入指针都增加加入的尺寸, 这里就简单演示一下
否则
拷贝内存(欲分配内存 + n, 文本指针[索引])
索引 = 索引+1 '继续下一个字节循环
}
|
|