mysql导入时怎么去重,mysql数据库怎么去重

java 批量插入mysql 怎么去重

在代码中先用hashset装载数据，这样就自动去重了因为set是不允许重复的，然后在批量插入到数据库中就行了。

创新互联建站成立与2013年，先为呼图壁等服务建站，呼图壁等地企业，进行企业商务咨询服务。为呼图壁企业网站制作PC+手机+微官网三网同步一站式服务解决您的所有建站问题。

MYSQL里有五百万数据，但大多是重复的，真实的就180万，于是想怎样把这些重复的数据搞出来，在网上找了一圈，好多是用NOT IN这样的代码，这样效率很低，自己琢磨组合了一下，找到一个高效的处理方式，用这个方式，五百万数据，十来分钟就全部去除重复了，请各位参考。

第一步：从500万数据表data_content_152里提取出不重复的字段SFZHM对应的ID字段到TMP3表

1 create table tmp3 as select min(id) as col1 from data_content_152 group by SFZHM;

第二步：创建新表RES

1234 CREATE TABLE `res` (`id` int(11),`sfz` char(20)) ENGINE=MyISAM;

第三步：把TMP3表ID对应到data_content_152里需要提取的数据添加到RES表的SFZ字段

1 INSERT INTO res (sfz) SELECT sfzhm FROM data_content_152,tmp3 where data_content_152.id=tmp3.col1

至此，就在MYSQL里实现了，给数据表data_content_152完全删除重复数据，把去重复后的数据导入到RES表。

利用group by

代码如下：

SELECT * FROM(

select * from customer where user=(

SELECT source_user from customer WHERE user='admin') UNION ALL select * from customer where user=(

select source_user from customer where user=(

SELECT source_user from customer WHERE user='admin')) union ALL select * from customer where user=(

select source_user from customer where user=(

SELECT source_user from customer WHERE user='admin'))) UNION ALL select * from customer where source_user=(/*我的上线的上线的user*/

select user from customer where user=(

select source_user from customer where user=(

SELECT source_user from customer WHERE user='admin'))) union all select * from customer where source_user=(/*我的上线的上线的上线user*/

select user from customer where user=(

select source_user from customer where user=(

SELECT source_user from customer WHERE user='admin'))))) as alias group by user;

不建议直接删除，养成良好的习惯（删除更麻烦），以下是将去重后的数据转移到另一张表代码：

Insert into 表名（列名）select distinct 列名 from 表名

你可以按照去重的思路，删除重复数据

delete from zhszty_ebook

where id not in(

select * from (select max(id) from zhszty_ebook group by url

) as tmp);------------mysql有个特性，对于表进行修改，删除操作，子查询不能和外层的查询的表一样，所以在加个select就可以了。其他数据库按照楼上的那个是没问题的

当前名称：mysql导入时怎么去重,mysql数据库怎么去重
URL分享：http://cdxtjz.cn/article/phcoip.html