开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 1941|回复: 8
收起左侧

[已解决] 如何对10MB的文本文件进行排序,去重复等操作

 关闭 [复制链接]
结帖率:100% (6/6)
发表于 2017-7-13 16:02:32 | 显示全部楼层 |阅读模式   天津市天津市
300精币
有一个10+MB的文本文件,如何快速的对其进行处理?

格式是这样的
1234   gojlikuaiy
2234   8maojky
3234   7尊咯啵
56290    坡口

以每行为单位,通过前面数字进行判断,相同的去掉只留下一个。根据数字的大小对每行重新排序。(数字长度是长整数)

我应该怎么做? 因为文件比较大,效率也是问题

最佳答案


回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳
结帖率:91% (140/154)

签到天数: 26 天

发表于 2017-7-13 16:02:33 | 显示全部楼层   广东省潮州市
  1. .版本 2
  2. .支持库 commobj
  3. .支持库 spec

  4. .局部变量 快速文本, 快速文本对象
  5. .局部变量 文本组1, 文本型, , "0"
  6. .局部变量 i
  7. .局部变量 文本组2, 文本型, , "0"
  8. .局部变量 文本组3, 文本型, , "0"
  9. .局部变量 g, 文本型, , "0"
  10. .局部变量 临时文本, 文本型
  11. .局部变量 j, 整数型
  12. .局部变量 最小, 整数型

  13. 快速文本.从文件读 (“你的文件路径”)
  14. 调试输出 (“原文本”, 编辑框1.内容)


  15. ' 快速文本.从文件读 (“文件路径”)
  16. 文本组1 = 快速文本.分割文本 (#换行符, )
  17. .判断循环首 (取数组成员数 (文本组1) ≠ 0)
  18.     最小 = 0
  19.     清除数组 (文本组2)
  20.     清除数组 (文本组3)
  21.     .计次循环首 (取数组成员数 (文本组1), i)
  22.         快速文本.置文本 (文本组1 [i])
  23.         文本组2 = 快速文本.分割文本 (“   ”, )
  24.         .如果 (取数组成员数 (文本组2) = 2)
  25.             .如果真 (到整数 (文本组2 [1]) < 最小 或 最小 = 0)
  26.                 最小 = 到整数 (文本组2 [1])
  27.                 临时文本 = 文本组1 [i]
  28.                 j = i
  29.             .如果真结束

  30.         .否则
  31.             信息框 (“错误”, 0, )
  32.         .如果结束

  33.     .计次循环尾 ()

  34.     .如果 (取数组成员数 (g) ≠ 0)
  35.         快速文本.置文本 (临时文本)
  36.         文本组2 = 快速文本.分割文本 (“   ”, )
  37.         快速文本.置文本 (g [取数组成员数 (g)])
  38.         文本组3 = 快速文本.分割文本 (“   ”, )
  39.         .如果真 (文本组2 [2] ≠ 文本组3 [2])
  40.             加入成员 (g, 临时文本)
  41.         .如果真结束

  42.     .否则
  43.         加入成员 (g, 临时文本)
  44.     .如果结束

  45.     删除成员 (文本组1, j, 1)
  46. .判断循环尾 ()

  47. 调试输出 (“后文本”, g)
复制代码

评分

参与人数 1荣誉 +1 收起 理由
笨潴 + 1 热心帮助他人,荣誉+1,希望继续努力(*^__^*) 嘻嘻!

查看全部评分

回复

使用道具 举报

结帖率:100% (20/20)
发表于 2017-7-13 16:05:13 | 显示全部楼层   柬埔寨
还不如把文本上传看看
回复

使用道具 举报

结帖率:100% (3/3)

签到天数: 27 天

发表于 2017-7-13 17:03:47 | 显示全部楼层   江苏省苏州市
用快速文本对象去处理,会快一点吧
回复

使用道具 举报

结帖率:91% (140/154)

签到天数: 26 天

发表于 2017-7-13 18:00:48 | 显示全部楼层   广东省潮州市
开始运行被调试程序
* “原文本” | “1234   gojlikuaiy
3234   7尊咯啵
56290    坡口
56290    坡口
2234   8maojky
1234   45645654”
* “后文本” | 数组:5{“1234   gojlikuaiy”,“1234   45645654”,“2234   8maojky”,“3234   7尊咯啵”,“56290    坡口”}
被调试易程序运行完毕
回复

使用道具 举报

结帖率:100% (6/6)

签到天数: 8 天

 楼主| 发表于 2017-7-13 18:42:38 | 显示全部楼层   天津市天津市

你确定当要处理的内容达到上万条的时候,这样写没问题?
回复

使用道具 举报

结帖率:100% (1/1)

签到天数: 1 天

发表于 2017-7-13 18:46:17 | 显示全部楼层   上海市上海市
文本发出来看看啊
回复

使用道具 举报

结帖率:91% (140/154)

签到天数: 26 天

发表于 2017-7-13 18:54:57 | 显示全部楼层   广东省潮州市
qq1347522182 发表于 2017-7-13 18:42
你确定当要处理的内容达到上万条的时候,这样写没问题?

你自己测试一下啊  你文本又不发出来
回复

使用道具 举报

结帖率:100% (6/6)

签到天数: 8 天

 楼主| 发表于 2017-7-13 19:18:04 | 显示全部楼层   天津市天津市
小淡 发表于 2017-7-13 18:54
你自己测试一下啊  你文本又不发出来

神TM要文本,算了算了,自己写吧。此贴终结
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 诚聘英才| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 800073686,邮箱:800073686@b.qq.com
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表