如何提高mysql和sqlserver中一系列大型更新的速度?

jxct1oxe  于 2021-06-21  发布在  Mysql
关注(0)|答案(1)|浏览(208)

我有一个应用程序,我正在用java编写简单的sql,所以这里没有自定义的mysql或sql server—它可能必须在这两个服务器上运行。一个数据持久化操作必须从数据库中获取数据,将其与已提交的数据进行比较,然后相应地插入、更新或删除。
通过成批处理jdbc调用,我大大提高了操作的性能。
所以我的插入-我只是打电话给 Statement.addBatch() 方法,jdbc驱动程序创建

INSERT INTO data (parentId, seriesDate, valueDate, value) 
    VALUES (a,b,c,d),(a,b,e,f),(a,b,g,h)... etc

删除-我只是用

DELETE FROM data WHERE parentId = a AND seriesDate = b;

我可以重新插入(最好采用另一种方法,编写一个大的long

DELETE FROM data WHERE (parentId = 1 AND seriesDate = b) 
    OR (parentId = 2 AND seriesDate = c) 
    OR (parentId = 3 AND seriesDate = d)  ...

但这不是问题所在,我的主要问题是更新速度很慢-是插入速度的两倍
我有1000个单独的陈述:

UPDATE data SET value = 4 
    WHERE parentId = 1 AND seriesDate = '' AND valueDate = '';

在sql server中,更新和插入一样快,但在mysql中,我看到它的运行速度慢了10倍。
我希望我忘记了一些相互兼容的方法,或者错过了一些需要调整的jdbc连接配置,可能是与我在每个批中放置的项目数量有关。
[更新2018-05-17]这是请求的ddl-不幸的是,我还不能更改它,因此任何涉及架构更改的建议都不会有帮助,至少今年不会:(

CREATE TABLE data (
  parentId INT UNSIGNED NOT NULL,
  seriesDate DATE NOT NULL,
  valueDate DATE NOT NULL,
  value FLOAT NOT NULL,
  versionstamp INT UNSIGNED NOT NULL DEFAULT 1,
  createdDate DATETIME DEFAULT CURRENT_TIMESTAMP,
  last_modified DATETIME DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
  CONSTRAINT pk_data PRIMARY KEY (parentId, seriesDate, valueDate),
  CONSTRAINT fk_data_forecastid FOREIGN KEY (parentId)
    REFERENCES forecast (id)
) MAX_ROWS 222111000;

CREATE TRIGGER trg_data_update BEFORE UPDATE ON data
  FOR EACH ROW SET NEW.versionstamp = OLD.versionstamp + 1;

CREATE INDEX ix_data_seriesdate ON `data` (seriesDate);

插入:

INSERT INTO `data` (`parentId`, `valueDate`, `value`, `seriesDate`)
    VALUES (52031,'2010-04-20',1.12344,'2013-01-10')

EXPLAIN PLAN:
id: 1
select_type: INSERT
table: data
partitions:
type: ALL
possible_keys: PRIMARY,ix_data_seriesdate

以及更新:

UPDATE `data` SET `value` = -2367.0
    WHERE `parentId` = 52005 AND `seriesDate` = '2018-04-20' AND `valueDate` = '2000-02-11'

EXPLAIN PLAN:
id: 1
select_type: UPDATE
table: data
partitions: 
type: range
possible_keys: PRIMARY,ix_data_seriesdate
key: PRIMARY
key_len: 10
ref: const,const,const
rows: 1
filtered: 100
Extra: Using where

然后删除:

DELETE FROM `data` WHERE `parentId` = 52030 AND `seriesDate` = '2018-04-20'

EXPLAIN PLAN:
id: 1
select_type: DELETE
table: data
partitions: 
type: range
possible_keys: PRIMARY,ix_data_seriesdate
key: PRIMARY
key_len: 7
ref: const,const
rows: 1
filtered: 100
Extra: Using where

仅供参考2字段自动更新- last_modifiedON UPDATE 条款和 versionstamp 触发(同样,我不能放弃这个功能)。

7jmck4yq

7jmck4yq1#

改进update语句的方法:
使用辅助表(可以“批量”更新)
检查不必要的触发器
改进索引(对于where子句)
olap或oltp中间人临时表(它们允许一批更新)
例如

CREATE TABLE #TempData ( 
  parentId INT UNSIGNED NOT NULL,
  seriesDate DATE NOT NULL,
  valueDate DATE NOT NULL,
  value FLOAT NOT NULL
);

INSERT INTO #TempData ( parentId, seriesDate, valueDate, value ) VALUES ( .... ), ( .... ), ( .... );

UPDATE
  data
SET
  value = #TempData.value
FROM
  #TempData
WHERE
  data.parentId = #TempData.parentId AND
  data.seriesDate = #TempData.seriesDate AND
  data.valueDate = #TempData.valueDate;

相关问题