用于DataFactory指向特定GIT分支的Azure Python SDK

ubof19bj  于 2023-03-03  发布在  Git
关注(0)|答案(1)|浏览(119)

我尝试使用azure-mgmt-datafactory SDK以编程方式更新数据集。我可以连接到DataFactory,列出数据集并将其更新到adf_publish/live模式。但是,我希望先连接到我的GIT分支并进行更新。以下是示例代码

from azure.identity import ClientSecretCredential
from azure.mgmt.datafactory import DataFactoryManagementClient
from azure.mgmt.datafactory.models import *
import time

subscription_id = 'xxxxx'

credentials = ClientSecretCredential(
    tenant_id='xxxx',
    client_id='xxxx',
    client_secret='xxxx'
)

adf_client = DataFactoryManagementClient(credentials, subscription_id)

# How to connect to my branch?
response = adf_client.datasets.get('xxxxxx',
                        'adf-xxx',
                        'DS_DEV_OP_XXX')

# This is giving the dataset not from my branch
print(response.as_dict())

你能告诉我如何连接到我的GIT分支吗?
先谢了。

ugmeyewa

ugmeyewa1#

选项1:

在Azure-mgmt-datafactory SDK中没有连接到特定Git分支的直接方法。但是,您可以使用datasets类的get方法从数据工厂获取数据集。资源组名称、数据工厂名称、和数据集名称是get方法所需的三个参数。您正在从数据工厂adf检索数据集DS DEV OP XXX-xxx。数据集的最新版本(可能不是来自Git分支)是使用get方法获取的。您必须首先 checkout 本地存储库中的分支才能从特定Git分支检索数据集,然后必须访问数据工厂。

备选案文:2

我们将使用Azure DevOps。如果您使用GitHub,流程将是相同的。

转到Azure数据工厂Studio-〉管理-〉Git配置-〉配置

选择存储库类型:Azure动态目录服务器“抗心律失常药物名称”

给予所有必要的详细信息,如项目名称、回购名称、分支等。

现在,我们可以检查所有数据,如数据集,数据流,linkedService等。转到Azure数据工厂工作室。选择“作者”。
1.现在我们看到默认情况下选择了“dev”分支。
1.如果我们在一个特性分支中进行新的开发。单击“新建分支”。我们可以通过这种方式保存我们未完成的开发。要记住,为了在测试管道后将代码返回到“开发”分支,我们必须“创建拉取请求”,这一点至关重要
1.我们的修改都可以“Published”,这样,新的修改将变为“live”,“dev”分支中的管道将被推入“adf publish dev”分支。

相关问题