我想做一些 pivot
一些数据。就像跟在后面一样。
>>> df = pd.DataFrame({'foo': ['one', 'one', 'one', 'two', 'two',
... 'two'],
... 'bar': ['A', 'B', 'C', 'A', 'B', 'C'],
... 'baz': [1, 2, 3, 4, 5, 6],
... 'zoo': ['x', 'y', 'z', 'q', 'w', 't']})
>>> df
foo bar baz zoo
0 one A 1 x
1 one B 2 y
2 one C 3 z
3 two A 4 q
4 two B 5 w
5 two C 6 t
>>> df.pivot(index='foo', columns='bar', values='baz')
bar A B C
foo
one 1 2 3
two 4 5 6
我知道海豚能做什么 pivot
在sql中。
dateValue=2007.08.01
num=500
syms = (exec count(*) from taq
where
date = dateValue,
time between 09:30:00 : 15:59:59,
0<bid, bid<ofr, ofr<bid*1.2
group by symbol order by count desc).symbol[0:num]
priceMatrix = exec avg(bid + ofr)/2.0 as price from taq
where
date = dateValue, Symbol in syms,
0<bid, bid<ofr, ofr<bid*1.2,
time between 09:30:00 : 15:59:59
pivot by time.minute() as minute, Symbol
但怎么办呢 pivot
在clickhouse?我应该使用客户端api来获取数据吗?但是有太多的行,处理太多的行太困难了。如果我不能使用 pandas
,如何实施 pivot
操作容易吗?
1条答案
按热度按时间0kjbasz61#
这是初步的实施,可以帮助您开始。
评论:
不支持行中的“孔”(每列应包含值)
所有列的类型转换为公共类型(字符串)
引入了ordernum字段。它是结果中源列的顺序号(例如,“bar”-第二列)
结果表示为一行一列的数组类型。数组项的顺序由ordernum定义。
准备测试数据:
数据透视模拟: