我有一个从parquet到azure sql的多个复制活动(23)的管道。我遇到了低复制吞吐量(23 kb/s)。有什么方法可以改善这个问题吗?集成运行时是Azure,而不是自托管IR。
yks3o0rb1#
数据集成单元(DIU)是表示Azure数据工厂和Synapse管道中单个单元的能力的度量。能力是CPU、内存和网络资源分配的组合。DIU仅适用于Azure集成运行时。DIU不适用于自托管的集成运行时。更多详情:https://learn.microsoft.com/en-us/azure/data-factory/copy-activity-performance
cgh8pdjw2#
与另一个答案一样,增加DIU是增加复制活动吞吐量的主要方法。您可以尝试不同的DIU设置来调整复制活动,并查看获得的性能。完成此操作后,我已经确定了复制的最大DIU。使用两倍数量的DIU每小时的成本是两倍,但速度是两倍,因此并不昂贵。如果增加DIU并不能提高你的性能,那可能与你的“源”和“接收器”的设置有关。你的parquet文件的“源”是什么?你的azure sql接收器能处理所有的写操作吗?
2条答案
按热度按时间yks3o0rb1#
数据集成单元(DIU)是表示Azure数据工厂和Synapse管道中单个单元的能力的度量。能力是CPU、内存和网络资源分配的组合。DIU仅适用于Azure集成运行时。DIU不适用于自托管的集成运行时。
更多详情:https://learn.microsoft.com/en-us/azure/data-factory/copy-activity-performance
cgh8pdjw2#
与另一个答案一样,增加DIU是增加复制活动吞吐量的主要方法。
您可以尝试不同的DIU设置来调整复制活动,并查看获得的性能。完成此操作后,我已经确定了复制的最大DIU。使用两倍数量的DIU每小时的成本是两倍,但速度是两倍,因此并不昂贵。
如果增加DIU并不能提高你的性能,那可能与你的“源”和“接收器”的设置有关。你的parquet文件的“源”是什么?你的azure sql接收器能处理所有的写操作吗?