我正在使用azure数据工厂解析一个.dat文件。每一行都由字符串'TASK'分隔。
试123 ~ 946任务34 T * 89 YT 56任务36890* 5 T67任务365* 890 PT 6 *5678当我做一个数据预览时,每次有一个字符'T'时都会显示一个单独的行。有没有一种方法可以使用一个带有字符串值的行索引?在上面的例子中,我需要三个单独的行,以字符串'TASK'开头
wko9yo5t1#
对于复制活动,用于分隔文件中的行的单个字符或“\r\n”。
**图像参考:**ADF中分隔文本属性的MS文档。
只能使用单个字符作为行序号。这就是为什么,即使TASK被指定为n,它也将T作为定界符。你不能读这文件与定界符为TASK使用复制活动.这可以通过Map低转换活动来实现。下面是步骤,
TASK
T
使用源数据集进行Source转换。给予行\n和列,。之所以选择这些分隔符,是因为这些分隔符不是数据的一部分。
\n
,
采用派生列变换,然后给予列的表达式为split(Column_1,'TASK')。
split(Column_1,'TASK')
这将使数组的值从column1数据。
column1
unroll by
flatten转换输出:
1条答案
按热度按时间wko9yo5t1#
对于复制活动,用于分隔文件中的行的单个字符或“\r\n”。
**图像参考:**ADF中分隔文本属性的MS文档。
只能使用单个字符作为行序号。这就是为什么,即使
TASK
被指定为n,它也将T
作为定界符。你不能读这文件与定界符为TASK
使用复制活动.这可以通过Map低转换活动来实现。下面是步骤,使用源数据集进行Source转换。给予行
\n
和列,
。之所以选择这些分隔符,是因为这些分隔符不是数据的一部分。采用派生列变换,然后给予列的表达式为
split(Column_1,'TASK')
。这将使数组的值从
column1
数据。unroll by
的值作为column1
数组。flatten转换输出: