我有一个数据框,其中包含以下列
Name Company generic name generic name R&D Number (DC-) R&D Number (A) type
A AB 53654 5767 1111 3333 a
C CD 56767 56667
我想创建这个数据框的一个子集,并通过用','聚合值来将列与模式组合起来
所需输出为:
Name Company generic name R&D Number
A AB 53654, 5767 1111, 3333
C CD 56767 56667
我发现有一种基于正则表达式过滤列的方法,如下面的df.filter(regex =("R & D Number. *"))
但是有没有一种方法可以与其他列连接,并通过','连接值以获得最终输出。任何帮助都非常感谢
1条答案
按热度按时间7cjasjjr1#
您可以通过删除尾部的
(xx)
部分(如果需要,可以调整确切的逻辑),然后在列上删除groupby
来聚合值,从而规范化名称:或者使用双重
transpose
技巧:输出:
可复制输入: