如何提高Azure数据工厂中的复制活动吞吐量

dxxyhpgq  于 2022-11-17  发布在  其他
关注(0)|答案(2)|浏览(154)

我有一个从parquet到azure sql的多个复制活动(23)的管道。我遇到了低复制吞吐量(23 kb/s)。有什么方法可以改善这个问题吗?
集成运行时是Azure,而不是自托管IR。

yks3o0rb

yks3o0rb1#

数据集成单元(DIU)是表示Azure数据工厂和Synapse管道中单个单元的能力的度量。能力是CPU、内存和网络资源分配的组合。DIU仅适用于Azure集成运行时。DIU不适用于自托管的集成运行时。
更多详情:https://learn.microsoft.com/en-us/azure/data-factory/copy-activity-performance

cgh8pdjw

cgh8pdjw2#

与另一个答案一样,增加DIU是增加复制活动吞吐量的主要方法。
您可以尝试不同的DIU设置来调整复制活动,并查看获得的性能。完成此操作后,我已经确定了复制的最大DIU。使用两倍数量的DIU每小时的成本是两倍,但速度是两倍,因此并不昂贵。
如果增加DIU并不能提高你的性能,那可能与你的“源”和“接收器”的设置有关。你的parquet文件的“源”是什么?你的azure sql接收器能处理所有的写操作吗?

相关问题