开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 232|回复: 16
收起左侧

[易语言] 本地数据库号码查重问题求助

[复制链接]
结帖率:75% (33/44)
发表于 2025-1-5 12:32:52 | 显示全部楼层 |阅读模式   江苏省盐城市
90精币
就是我有100万条数据再数据库里,我导入一万条数据去cha询这一万条在数据库中哪些重复的,再把不重复的导入到数据库里去,    数据库里的数据再全部导出来.我应该怎么弄.我用edb数据库这样需要一小时.
谁可以给我个例子.mysql或者sqlite都可以.主要就是要快.能做到几十秒之内完成么?


回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳

签到天数: 7 天

发表于 2025-1-5 12:36:39 | 显示全部楼层   湖南省郴州市
回复

使用道具 举报

结帖率:100% (1/1)

签到天数: 14 天

发表于 2025-1-5 12:37:46 | 显示全部楼层   河北省石家庄市
用AI试了试,主要是弄好索引,或者可以先创时候cha询表里是否有这个数据,然后再插入

-- 创建索引
CREATE INDEX idx_main_data ON main_table(column_name);

-- 创建临时表并导入数据
CREATE TEMPORARY TABLE temp_table (
    column_name datatype,
    ...
);
LOAD DATA INFILE 'path/to/your/file.csv' INTO TABLE temp_table
FIELDS TERMINATED BY ',' ENCLOSED BY '"'
LINES TERMINATED BY '\n'
IGNORE 1 ROWS;

-- cha询不重复的数据
INSERT INTO main_table (column_name, ...)
SELECT t.column_name, ...
FROM temp_table t
LEFT JOIN main_table m ON t.column_name = m.column_name
WHERE m.column_name IS NULL;

-- 导出主表中的所有数据
SELECT * FROM main_table INTO OUTFILE 'path/to/your/output.csv'
FIELDS TERMINATED BY ',' ENCLOSED BY '"'
LINES TERMINATED BY '\n';
回复

使用道具 举报

结帖率:75% (33/44)
 楼主| 发表于 2025-1-5 12:42:04 | 显示全部楼层   江苏省盐城市
shenmia 发表于 2025-1-5 12:37
用AI试了试,主要是弄好索引,或者可以先创时候cha询表里是否有这个数据,然后再插入

-- 创建索引

ai的没用 试过
回复

使用道具 举报

结帖率:43% (3/7)

签到天数: 13 天

发表于 2025-1-5 12:43:39 | 显示全部楼层   江西省九江市
思路
在mysql数据库表中设置好字段唯一约束
使用mysql命令行导入数据源,这样数据就是被去重的

如果整个数据占用空间小的话 可以用Redis

点评

这种方法可行   安徽省宿州市  发表于 2025-1-5 13:01
回复

使用道具 举报

结帖率:75% (33/44)
 楼主| 发表于 2025-1-5 13:26:18 | 显示全部楼层   江苏省盐城市
永痕 发表于 2025-1-5 12:43
思路
在mysql数据库表中设置好字段唯一约束
使用mysql命令行导入数据源,这样数据就是被去重的

可以给个例子吗
回复

使用道具 举报

结帖率:100% (3/3)

签到天数: 19 天

发表于 2025-1-5 13:39:59 | 显示全部楼层   福建省莆田市
给数据库加索引,搜索加入很快的,导出比较耗时
回复

使用道具 举报

结帖率:100% (25/25)

签到天数: 2 天

发表于 2025-1-5 13:51:50 | 显示全部楼层   江苏省南京市
先把数据库里面的导出到文本,然后用文本搜索去查重,大概3分钟能搞定,我现在就是这样操作的
回复

使用道具 举报

结帖率:75% (33/44)
 楼主| 发表于 2025-1-5 14:00:03 | 显示全部楼层   江苏省盐城市
chenboss 发表于 2025-1-5 13:39
给数据库加索引,搜索加入很快的,导出比较耗时

麻烦给个例子
回复

使用道具 举报

结帖率:100% (3/3)

签到天数: 19 天

发表于 2025-1-5 15:12:53 | 显示全部楼层   福建省莆田市
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表