如何使复制数据更快地工作并具有更好的性能(Azure Synapse)

t30tvxxf  于 2023-01-27  发布在  其他
关注(0)|答案(1)|浏览(86)

一点背景:我的Azure Synapse管道向REST API发出GET请求,以便以Parquet文件格式将数据导入数据湖(ADLSGen 2)。
我希望每小时向API索取一次数据,以取得前一小时的资料,我亦曾考虑将触发器设定为每半小时一次,以取得前30分钟的数据。
问题是:这个最后的GET请求和复制数据调试花了不到20分钟的时间。2使用的DUI设置为“自动”,即使我在活动设置中手动设置为8,它也等于4。
我想知道是否有任何有用的建议,使复制数据活动的工作速度更快,无论成本可能是(我真的很想了解它,如果你认为它相关)。
先谢了!
马泰奥

k5ifujac

k5ifujac1#

您需要检查哪个部分运行缓慢。您可以单击眼镜图标查看复制数据的详细信息。如果延迟是“到第一个字节的时间”或“从源阅读”,则问题出在REST API端。如果延迟是“写入接收器”,则问题可能出在写入数据湖。如果问题出在API端,请尝试联系提供商。如果适用,另一个选项是是使用一些复制数据活动,每个活动将复制一部分数据。如果问题是在数据湖上,您应该检查接收端的设置。

相关问题