开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 918|回复: 9
收起左侧

[易语言] 大文本平均分割小文本

[复制链接]
结帖率:49% (20/41)
发表于 2020-12-12 21:47:40 | 显示全部楼层 |阅读模式   广东省广州市
100精币
做个小工具碰到难题,有几个csv文件,单个文件大概6m-8m,10几w行,怎么读取到文件文本,通过以行为单位的方式平均分割成指定数量的文本变量


回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳
结帖率:98% (127/130)

签到天数: 4 天

发表于 2020-12-12 21:56:58 | 显示全部楼层   天津市天津市
先分割啊,分割后 取数组成员,假如10万行 分5个文本 每个文本2万行就行了吧 就是取数组中对应的行
回复

使用道具 举报

结帖率:99% (121/122)

签到天数: 25 天

发表于 2020-12-12 21:57:36 | 显示全部楼层   贵州省贵阳市
同求,
我弄的最简单的。。
十万行就慢的一批。。同求同求同求。有答案,@我一下子。。~
回复

使用道具 举报

结帖率:100% (7/7)

签到天数: 26 天

发表于 2020-12-12 22:00:33 | 显示全部楼层   广东省云浮市
大概思路就是通过文件大小来平均分。
假如你有一个10M的csv文件,然后想要分成5分,则可以打开文件,读文本行,进行分割,每读取&写出100行就判断一下已经写出的文件大小,如果超过2M了就打开下一个文件进行下一轮分割。
优点:不需要知道大文本有多少行,易于实现
缺点:没有办法精准按照行数来分割
回复

使用道具 举报

签到天数: 1 天

发表于 2020-12-12 22:00:54 | 显示全部楼层   广西壮族自治区南宁市
寻找换行符,跳过N次,再截取,要用文件读写的方式
回复

使用道具 举报

结帖率:0% (0/4)

签到天数: 2 天

发表于 2020-12-12 22:27:24 | 显示全部楼层   广东省深圳市
下载一个 emeditor 快的很 自带这个功能
回复

使用道具 举报

签到天数: 1 天

发表于 2020-12-13 00:00:50 | 显示全部楼层   广西壮族自治区南宁市
搞了一个,帖子审核中 https://bbs.125.la/thread-14655799-1-1.html
回复

使用道具 举报

结帖率:90% (19/21)

签到天数: 22 天

发表于 2020-12-13 01:42:31 | 显示全部楼层   四川省绵阳市
  
子程序名返回值类型公开备 注
分割  
变量名类 型静态数组备 注
dd快速文本对象 
数目整数型 
ff文本型0
平分份数整数型 
局_计次整数型 
aa快速文本对象 
取数目整数型 
局_计次_份数整数型 
a整数型 
bb整数型 
bb = 取启动时间 ()
dd.从文件读 (取特定目录 (3)“1210.txt”)
ff = dd.分割文本 ( #换行符, )
数目 = 取数组成员数 (ff)
' 数目 = 20000
调试输出 (“数目”到文本 (数目))
如果真 (数目 ≥ 50000)
平分份数 = 2
取数目 = 到整数 (数目 ÷ 平分份数)
计次循环首 (平分份数, 局_计次_份数)
调试输出 (aa.清除文本 ())
调试输出 (“局_计次_份数”到文本 (局_计次_份数))
如果真 (局_计次_份数 = 1)
a = 1

如果真 (局_计次_份数 = 2)
取数目 = 数目 - 取数目
a = 取数目
调试输出 (“取数目”到文本 (取数目))
计次循环首 (取数目, )
aa.添加 (ff [a]#换行符 )
a = a + 1
计次循环尾 ()
aa.写到文件 (取特定目录 (3)到文本 (取数目)“.txt”)
计次循环尾 ()
bb = 取启动时间 () - bb
调试输出 (bb)


i支持库列表   支持库注释   
commobj通用对象支持库
shell操作系统界面功能支持库
spec特殊功能支持库


* “数目342633”
* 真
* “局_计次_份数1”
* “取数目171316”
* 真
* “局_计次_份数2”
* “取数目171317”
* “时间813”

回复

使用道具 举报

签到天数: 1 天

发表于 2020-12-13 10:41:27 | 显示全部楼层   广西壮族自治区南宁市
xiaoyu1986 发表于 2020-12-12 21:57
同求,
我弄的最简单的。。
十万行就慢的一批。。同求同求同求。有答案,@我一下子。。~

https://bbs.125.la/thread-14655799-1-1.html

评分

参与人数 1好评 +1 精币 +5 收起 理由
xiaoyu1986 + 1 + 5 看着不错啊,抽空试试。。~感谢感谢~

查看全部评分

回复

使用道具 举报

结帖率:79% (15/19)
发表于 2020-12-13 15:23:46 | 显示全部楼层   北京市北京市
xiaoyu1986 发表于 2020-12-12 21:57
同求,
我弄的最简单的。。
十万行就慢的一批。。同求同求同求。有答案,@我一下子。。~

借用MySQL数据库可以,也可以用快速文本
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 诚聘英才| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 800073686,邮箱:800073686@b.qq.com
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表