我有下面的代码,我从csv文件读取数据,然后操纵一些数据,我想把修改后的数据到一个数据框。我想把它添加到字典,但我不知道我应该如何真正做到这一点。
我使用以下CSV数据文件作为数据源:
"17",20.2147418139502,20,20,20.8652568117822
"6",19.9412500131875,13,19,20.4982216893409
"4",16.3402085164562,6,18,16.729284141648
"11",15.9562389152125,11,17,16.4769352577916
"19",13.2889788383618,12,16,13.8285694613856
"15",11.7133173411712,1,15,11.7133173411712
我忽略了csv数据集的第一列。
重新计算后,我的数据如下所示(请参见下面的代码以了解数据操作):
15.9562389152125 11 12.0 16.4769352577916 16.4958295382
13.2889788383618 12 13.0 13.8285694613856 13.8459505145
11.7133173411712 1 2.0 11.7133173411712 11.863832339
9.68207331560552 14 15.0 10.2551373334446 10.2701189451
9.56895540188998 19 20.0 10.2083322023664 10.2194703997
7.30124705657363 2 3.0 7.45176205440562 7.53980768393
6.83169608190656 5 6.0 7.18118108407457 7.2207717071
6.40446470770985 4 5.0 6.70549470337383 6.75394970988
然后按第4列、第3列和第5列反向排序。
然后我在第5列的基础上在末尾添加一个rank列,如下所示。
15.9562389152125 11 12.0 16.4769352577916 16.4958295382 1
13.2889788383618 12 13.0 13.8285694613856 13.8459505145 2
11.7133173411712 1 2.0 11.7133173411712 11.863832339 3
9.68207331560552 14 15.0 10.2551373334446 10.2701189451 4
9.56895540188998 19 20.0 10.2083322023664 10.2194703997 5
7.30124705657363 2 3.0 7.45176205440562 7.53980768393 6
6.83169608190656 5 6.0 7.18118108407457 7.2207717071 7
6.40446470770985 4 5.0 6.70549470337383 6.75394970988 8
我不确定要使用什么样的数据结构来实现这一点。
我试过下面的代码:
def increaseQuantityByOne(self, fileLocation):
rows = csv.reader(open(fileLocation))
rows.next()
print "PricePercentage\t" + "OldQuantity\t" + "newQuantity\t" + "oldCompScore\t" + "newCompScore"
priceCompValue = []
priceCompRank = []
newPriceCompValue = []
newPriceCompRank = []
for row in rows:
newQuantity = float(row[2]) + 1.0
newCompetitiveScore = float(row[1]) + float(math.log(float(newQuantity), 100))
print row[1] + "\t", str(row[2])+"\t", str(newQuantity) + "\t", str(row[4]) + "\t", newCompetitiveScore
priceCompValue.append(float(row[4]))
priceCompRank.append(int(row[3]))
newPriceCompValue.append(newCompetitiveScore)
priceCompValue.sort(reverse=True)
priceCompRank.sort(reverse=True)
newPriceCompValue.sort(reverse=True)
for item in priceCompValue:
print item
for item in priceCompRank:
print item
for item in newPriceCompValue:
print item
2条答案
按热度按时间vatpfxk51#
假设您的数据位于与此脚本相同的目录中的csv文件(名为
data.csv
)中:这将生成一个列表列表,如下所示:
我希望这能让你开始。
9wbgstp72#
我不知道你想做什么,但我用python numpy的表和排序类型的东西。
Link http://docs.scipy.org/doc/numpy/reference/generated/numpy.lexsort.html#numpy.lexsort
基干