python 在分区表上分析来自Google Play商店的BigQuery中的应用程序数据

iszxjhcz  于 2023-06-28  发布在  Python
关注(0)|答案(1)|浏览(95)

我能够通过传输服务将我的Google Play商店数据连接到大查询。现在我有很多关于我的应用程序的数据。
我已经做了sentiment analysis and topic modelling
但它仍然有关于评级、安装和崩溃的数据(应用程序版本、设备、操作系统版本、运营商、国家/地区、语言等)`
我想合并这些不同的表,可以在下面的截图和分析数据。

例如,开始,我想分析p_Crashes_device_PS,它有列

**Filed name**     **Type**  
Date                 DATE   
Package_Name       STRING               
Device             STRING               
Daily_Crashes     INTEGER               
Daily_ANRs        INTEGER
SELECT
  EXTRACT(YEAR FROM Date) AS Year,
  EXTRACT(MONTH FROM Date) AS Month,
  REGEXP_EXTRACT(Device, r'^(\w+)') AS Device,
  SUM(Daily_Crashes) AS Total_Crashes,
  SUM(Daily_ANRs) AS Total_ANRs
FROM
 `abc.google_playstore.p_Crashes_device_PS`
GROUP BY
  Year, Month, Device
ORDER BY
  Year, Month, Device

现在我可以看到一台设备发生了大部分的崩溃,但我缺少的是如何将这些数据与其他表连接起来,以确定出了什么问题,以及在哪个国家/语言/操作系统/应用程序/运营商等
令我惊讶的是,我找不到一篇文章来帮助我理解这些Play Store数据集表并在big query/python中分析这些数据。
我做错什么了吗?Google应用程序有数据分析,但它涉及比较不同的应用程序等与单个应用程序及其特定数据无关。
如果有人能把我推向正确的方向,我会非常高兴,在那里我可以找到这个分析。谢谢你

46scxncf

46scxncf1#

可以使用JOIN子句根据两个或多个表之间的相关列合并它们。例如,如果要将p_Crashes_device_PS表与另一个包含应用版本信息的表联接,则可以使用以下查询:
SELECT * FROMabc.google_playstore.p_Crashes_device_PSAS crashes JOINabc.google_playstore.app_version_PSAS versions ON crashes.Package_Name = versions.Package_Name
此查询将返回两个表中Package_Name列匹配的所有列。您可以添加更多JOIN子句,以基于相关列合并更多表。您可以在这里了解有关BigQuery中连接的更多信息

相关问题