mysql 批量更新多条记录的不同值的性能分析

发布时间:2019-12-14编辑:脚本学堂
本文介绍下,mysql批量更新多条记录的不同值的实现方法,包括update,replace into等的详细用法, 有需要的朋友参考下。

一,mysql批量更新
mysql更新语句,更新一条数据的某个字段:
UPDATE mytable SET myfield = 'value' WHERE other_field = 'other_value';

更新同一字段为同一个值,修改下where即可:
UPDATE mytable SET myfield = 'value' WHERE other_field in ('other_values');
 
注意:
‘other_values' 是一个逗号(,)分隔的字符串,如:1,2,3

更新多条数据为不同的值,很多同学可能会这样写:
 

复制代码 代码示例:
foreach ($display_order as $id => $ordinal) {
    $sql = "UPDATE categories SET display_order = $ordinal WHERE id = $id";
    mysql_query($sql);
}

即是循环一条一条的更新记录。一条记录update一次,这样性能很差,也很容易造成阻塞。
那么能不能一条sql语句实现批量更新呢?
mysql并没有提供直接的方法来实现批量更新,这里我们可以用点小技巧加以实现。
例子:
 

复制代码 代码示例:
UPDATE mytable
    SET myfield = CASE id
        WHEN 1 THEN 'value'
        WHEN 2 THEN 'value'
        WHEN 3 THEN 'value'
    END
WHERE id IN (1,2,3)

这里使用了case when 这个小技巧来实现批量更新。
例子:
 

复制代码 代码示例:
UPDATE categories
    SET display_order = CASE id
        WHEN 1 THEN 3
        WHEN 2 THEN 4
        WHEN 3 THEN 5
    END
WHERE id IN (1,2,3)

代码说明:
更新display_order 字段,如果id=1 则display_order 的值为3,如果id=2 则 display_order 的值为4,如果id=3 则 display_order 的值为5。
即是将条件语句写在了一起。
这里的where部分不影响代码的执行,但是会提高sql执行的效率。确保sql语句仅执行需要修改的行数,这里只有3条数据进行更新,而where子句确保只有3行数据执行。
如果更新多个值的话,只需要稍加修改:
 

复制代码 代码示例:
UPDATE categories
    SET display_order = CASE id
        WHEN 1 THEN 3
        WHEN 2 THEN 4
        WHEN 3 THEN 5
    END,
    title = CASE id
        WHEN 1 THEN 'New Title 1'
        WHEN 2 THEN 'New Title 2'
        WHEN 3 THEN 'New Title 3'
    END
WHERE id IN (1,2,3)

到这里,已经完成一条mysql语句更新多条记录了。

但是要在业务中运用,需要结合服务端语言,这里以php为例,构造这条mysql语句:
 

复制代码 代码示例:
$display_order = array(
    1 => 4,
    2 => 1,
    3 => 2,
    4 => 3,
    5 => 9,
    6 => 5,
    7 => 8,
    8 => 9
);
$ids = implode(',', array_keys($display_order));
$sql = "UPDATE categories SET display_order = CASE id ";
foreach ($display_order as $id => $ordinal) {
    $sql .= sprintf("WHEN %d THEN %d ", $id, $ordinal);
}
$sql .= "END WHERE id IN ($ids)";
echo $sql;

这个例子,有8条记录进行更新。

一,mysql批量更新的性能分析
当使用上万条记录利用mysql批量更新,发现使用最原始的批量update发现性能很差。

这里分享三种提升mysql批量更新性能的办法:
1、批量update,一条记录update一次,性能很差
update test_tbl set dr='2' where id=1;
2、replace into 或者insert into ...on duplicate key update
replace into test_tbl (id,dr) values (1,'2'),(2,'3'),...(x,'y');
或使用:
insert into test_tbl (id,dr) values  (1,'2'),(2,'3'),...(x,'y') on duplicate key update dr=values(dr);
3、创建临时表,先更新临时表,然后从临时表中update
 

复制代码 代码示例:
create temporary table tmp(id int(4) primary key,dr varchar(50));
insert into tmp values  (0,'gone'), (1,'xx'),...(m,'yy');
update test_tbl, tmp set test_tbl.dr=tmp.dr where test_tbl.id=tmp.id;

注意:这种方法需要用户有temporary 表的create 权限。

以下是上述方法update 100000条数据的性能测试结果:
逐条update
 

real    0m15.557s
user    0m1.684s
sys    0m1.372s
replace into
real    0m1.394s
user    0m0.060s
sys    0m0.012s
insert into on duplicate key update
real    0m1.474s
user    0m0.052s
sys    0m0.008s
create temporary table and update:
real    0m0.643s
user    0m0.064s
sys    0m0.004s

测试结果说明:
 

测试当时使用replace into性能较好。
replace into  和insert into on duplicate key update的不同在于:
replace into 操作本质是对重复的记录先delete 后insert,如果更新的字段不全会将缺失的字段置为缺省值
insert into 则是只update重复记录,不会改变其它字段。