ruby-on-rails 批量销毁所有在轨道活动记录

products_count = Product.count

# Determine how many batches need to be run
number_of_iterations = (products_count.to_f / 1000).ceil

(1..number_of_iterations).each do |i|
  Product.limit(1000).delete_all
end

当处理大量的数据时，最好是批量删除。如果在单个事务中删除的行超过5，000行，则数据库将锁定。这意味着在事务期间，任何其他正在运行的进程都无法访问整个表。这可能意味着一些严重的问题，为您的网站的用户，而一个错误正在发生。

赞(0）回复(0）举报 2023-10-21

nkkqxpd93#

虽然in_batches很方便，但请记住，它掩盖了一些可能影响您的细节。
对于10，000条记录，有10，020个查询：

10个查询，每个查询提取1000个整数
10个查询（1000个绑定变量），每个查询选择1000条产品记录
10，000次查询，每次删除1条记录

所以每个id从db到ruby，再到db到ruby，然后再回到db。
一个相对简单的优化是让in_batches为您获取记录，然后手动销毁它们。这可能只少了10个查询，但这些查询要小得多，只向服务器发送10，020个整数（而之前是20，020个）：

Product.in_batches(of: 1000, load: true) { |records| records.each(&:destroy) }

现在，10，000条记录需要10，010个查询：

10个查询，每个查询获取1000条记录（带有2个绑定变量）
10，000次查询删除1条记录

由于delete_all返回删除的记录数，因此您不需要预先计算记录数。你只需要循环，直到它没有更多的记录要删除。您将向服务器发送10个绑定变量，但不获取任何变量。您还将从数据库中获取0条记录和10个整数：

while(Product.limit(1000).delete_all == 1000) ; end
# OR
while(Product.limit(1000).delete_all > 0) ; end

10个带有1个绑定变量的查询，每个查询返回1个整数。

我在这里举两个例子。第一种方法检测部分批处理并中止。第二种方法需要再运行一次删除查询（这将删除0条记录）。有时候让这段代码不知道批处理大小会更方便，所以我包含了第二个例子。
现在，您确实说您有一个关联的第二个表，这将阻碍delete_all解决方案。
如果您愿意专门为关联编码，并且关联不是STI，那么您可以手动删除两者。我在这里使用了Product.all，但是如果需要的话，您可以包含一个where()类型的范围。如果它是多态的，则需要添加:product_type => Product.polymorphic_name。

Variant.where(:product_id => Product.all.select(:id)).delete_all
Product.all.delete_all

另外，请注意，我使用的是select(:id)，而不是上面的pluck(:id)。select将创建一个子查询，pluck将返回并发送所有产品ID。（不是你想要的）

赞(0）回复(0）举报 2023-10-21

我来回答

ruby-on-rails 批量销毁所有在轨道活动记录

3条答案

相关问题

热门标签

最新问答