给定以下数据框架,一个与一些交易数据有关,一个与一些分类规则有关:
data = {'Transaction_description': ['sfdsjk fsjfdkj;f sfsdf RESTARANT', 'fsdk ;kjf;lskf;m gjkf NL111111111111 klkfdlo', 'golf kjnfksdn DE111111111112 fkdkk', 'jhfjd jhfj Jumbo jhf'], 'Amount': [-20, -21, -30, 10]}
Transactions = pd.DataFrame(data)
data = {
'Priority': [1, 1, 2, 2, 3, 3],
'Type': ['IBAN', 'IBAN', 'Company', 'Company', 'Keyword','Keyword'],
'Value': ['NL111111111111', 'DE111111111112', 'AMAZON', 'JUMBO','Restaurant','Golf'],
'Priority': [1, 1, 2, 2, 3, 3],
'Description': ['', '', '', '','',''],
'MappingCode': ['A1', 'A2', 'B1', 'B2','B1','B2']
}
Categorization = pd.DataFrame(data)
我想根据[Priority]对所有[Transaction_description]进行分类,搜索
(1) IBAN
(2) Company
(3) keyword.
哪一个是获得以下预期结果的最佳原因:
data = {
'Transaction_description': ['sfdsjk fsjfdkj;f sfsdf RESTARANT', 'fsdk ;kjf;lskf;m gjkf NL111111111111 klkfdlo', 'golf kjnfksdn DE111111111112 fkdkk', 'jhfjd jhfj Jumbo jhf'],
'Amount': [-20, -21, -30, 10],
'MappingCode': ['B1','A1','A2','B2']
}
TransactionsClassified = pd.DataFrame(data)
谢谢你,海伯里
1条答案
按热度按时间velaa5lx1#
您的数据有点非结构化,这使得它有点困难。
np.where()
来完成此操作。列表的顺序将决定分类的顺序。您的代码可能如下所示: