我花了三天的时间研究这个问题,并试图找出答案,但没有运气。现在我正在考虑一天一天将数据加载到一个新表中(这会花费很长时间,我真的不想这样做)。
我有一个表格,里面有一个网站的浏览量。它位于一个配置单元表中,我用hue访问数据。它具有不同的用户id、会话id、日期和页面。我们每天在大约30个不同的页面上获得大约1600万的浏览量。
我正在尝试创建一个页面视图计数、独立用户计数和7天滚动独立用户计数。因此,一天中的不同用户和该天之前一周的不同用户。下面的例子。
我试过使用partitionby语句,但没有成功。我曾经尝试将表连接到它本身以及将它连接到一个date\u维度表,但是对于一个每天有1600万行的表,hue最终挂起并且永远无法完成查询
这是我仅有的一天的代码,但我需要将其扩展为去年的全部代码,而不是一天一天地将数据输入一个新表。显然需要替换硬编码日期。
SELECT '2019-04-07' AS Temp_Date
, t.pageview
, COUNT (DISTINCT CASE WHEN t.dates = '2019-04-07' THEN User_ID END) AS Users
, COUNT (DISTINCT User_ID) AS 7Day_Users
, COUNT (CASE WHEN t.dates = '2019-04-07' THEN User_ID END) AS Views
, COUNT (*) AS 7Day_Views
FROM(
SELECT pageview
, User_ID
, Date
FROM ar3.t59_4_1
WHERE Date BETWEEN '2019-04-01' AND '2019-04-07'
) t
GROUP BY '2019-04-07'
,t.pageview
当前代码的示例结果表:
Temp_Date pageview Users 7Day_users Views 7Day_views
2019-04-07 Home 5467 28754 8765 51624
2019-04-07 About 150 548 324 3429
2019-04-07 Store 26345 128754 33247 354324
2019-04-07 Blog 856 28754 8765 54324
2019-04-07 FAQ 32 187 65 478
实际结果要长得多。预期的结果是每天都这样。
Temp_Date pageview Users 7Day_users Views 7Day_views
2019-04-07 Home 5467 28754 8765 51624
2019-04-07 About 150 548 324 3429
2019-04-07 Store 26345 128754 33247 354324
2019-04-07 Blog 856 28754 8765 54324
2019-04-07 FAQ 32 187 65 478
2019-04-06 Home 5467 28754 8765 51624
2019-04-06 About 150 548 324 3429
2019-04-06 Store 26345 128754 33247 354324
2019-04-06 Blog 856 28754 8765 54324
2019-04-06 FAQ 32 187 65 478
2019-04-05 Home 5467 28754 8765 51624
2019-04-05 About 150 548 324 3429
2019-04-05 Store 26345 128754 33247 354324
2019-04-05 Blog 856 28754 8765 54324
2019-04-05 FAQ 32 187 65 478
2019-04-04 Home 5467 28754 8765 51624
2019-04-04 About 150 548 324 3429
2019-04-04 Store 26345 128754 33247 354324
2019-04-04 Blog 856 28754 8765 54324
2019-04-04 FAQ 32 187 65 478
...etc. (continues for all days in past 12 months)
暂无答案!
目前还没有任何答案,快来回答吧!