azure ADF：data set行分隔符多个字符

shstlldc 于 2023-10-22 发布在其他

关注(0)|答案(1)|浏览(99)

我正在使用azure数据工厂解析一个.dat文件。
每一行都由字符串'TASK'分隔。

示例

试123 ~ 946任务34 T * 89 YT 56任务36890* 5 T67任务365* 890 PT 6 *5678
当我做一个数据预览时，每次有一个字符'T'时都会显示一个单独的行。有没有一种方法可以使用一个带有字符串值的行索引？
在上面的例子中，我需要三个单独的行，以字符串'TASK'开头

来源：https://stackoverflow.com/questions/77261923/adf-data-set-row-deliminater-multiple-characters

1条答案

按热度按时间

对于复制活动，用于分隔文件中的行的单个字符或“\r\n”。

**图像参考：**ADF中分隔文本属性的MS文档。

只能使用单个字符作为行序号。这就是为什么，即使TASK被指定为n，它也将T作为定界符。你不能读这文件与定界符为TASK使用复制活动.这可以通过Map低转换活动来实现。下面是步骤，

使用源数据集进行Source转换。给予行\n和列,。之所以选择这些分隔符，是因为这些分隔符不是数据的一部分。
采用派生列变换，然后给予列的表达式为split(Column_1,'TASK')。

这将使数组的值从column1数据。

进行flatten变换，然后给予unroll by的值作为column1数组。

flatten转换输出：

赞(0）回复(0）举报 2023-10-22

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 3个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 3个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 3个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 3个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 3个月前