我尝试使用azure-mgmt-datafactory
SDK以编程方式更新数据集。我可以连接到DataFactory,列出数据集并将其更新到adf_publish/live模式。但是,我希望先连接到我的GIT分支并进行更新。以下是示例代码
from azure.identity import ClientSecretCredential
from azure.mgmt.datafactory import DataFactoryManagementClient
from azure.mgmt.datafactory.models import *
import time
subscription_id = 'xxxxx'
credentials = ClientSecretCredential(
tenant_id='xxxx',
client_id='xxxx',
client_secret='xxxx'
)
adf_client = DataFactoryManagementClient(credentials, subscription_id)
# How to connect to my branch?
response = adf_client.datasets.get('xxxxxx',
'adf-xxx',
'DS_DEV_OP_XXX')
# This is giving the dataset not from my branch
print(response.as_dict())
你能告诉我如何连接到我的GIT分支吗?
先谢了。
1条答案
按热度按时间ugmeyewa1#
选项1:
在Azure-mgmt-datafactory SDK中没有连接到特定Git分支的直接方法。但是,您可以使用datasets类的get方法从数据工厂获取数据集。资源组名称、数据工厂名称、和数据集名称是get方法所需的三个参数。您正在从数据工厂adf检索数据集DS DEV OP XXX-xxx。数据集的最新版本(可能不是来自Git分支)是使用get方法获取的。您必须首先 checkout 本地存储库中的分支才能从特定Git分支检索数据集,然后必须访问数据工厂。
备选案文:2
我们将使用Azure DevOps。如果您使用GitHub,流程将是相同的。
转到Azure数据工厂Studio-〉管理-〉Git配置-〉配置
选择存储库类型:Azure动态目录服务器“抗心律失常药物名称”
给予所有必要的详细信息,如项目名称、回购名称、分支等。
现在,我们可以检查所有数据,如数据集,数据流,linkedService等。转到Azure数据工厂工作室。选择“作者”。
1.现在我们看到默认情况下选择了“dev”分支。
1.如果我们在一个特性分支中进行新的开发。单击“新建分支”。我们可以通过这种方式保存我们未完成的开发。要记住,为了在测试管道后将代码返回到“开发”分支,我们必须“创建拉取请求”,这一点至关重要
1.我们的修改都可以“Published”,这样,新的修改将变为“live”,“dev”分支中的管道将被推入“adf publish dev”分支。