已关闭。此问题需要更多focused。当前不接受答案。
**想要改进此问题吗?**更新问题,使其仅关注editing this post的一个问题。
2天前关闭。
Improve this question
**问题陈述:**我想创建一个离线数据库,以查找在美国销售的n本最有用的书的价格/信息(其中n可能是300万左右)。
**问题:**因此,我的问题是(我也愿意采用其他方法),我正在尝试了解如何使用Amazon AWS下载销售排名最高的n本书的列表,以及关于这本书的一些信息(即书名、价格等...)。
**到目前为止我所做的:**首先,类似的东西已经存在(asellertool.com),但是,我认为这将是一个有趣的项目,坦率地说,我们还没有严重到需要支付30美元/月的订阅。
现在,AWS非常棒(很简单)如果你有几本书想查,但我似乎不知道如何列举销售排名。最初,我希望列举亚马逊所有的图书项目的ISBN。但这也是不可用的。然后我想我可以找到一个列表,所有的ISBN号码在那里。但那也是一条死胡同。最后我想我可以创建自己的ISBN号码列表,但当我做一些信封后面的计算时,我认为它更好,因为我的解决方案将需要大约一年的时间来通过三分之一的10位数空间在100/秒(这是矫枉过正反正)。
所以,我又回到了销售排行榜上,目前看来也是死路一条。所以,如果你有什么想法,我将不胜感激。
4条答案
按热度按时间lf3rwulv1#
亚马逊有一个数据源服务,你可以使用它,它包含他们所有产品的基于顶级类别的GZipped xml文件。它每天更新一次,总共大约20 GB/110 GB的压缩/未压缩数据。因为你只需要书籍,所以它更多的是在4GB/31 GB的范围内。唯一的问题是我不知道谁可以使用它,以及获得一个帐户需要什么。他们不“据我所知,他们的网站上没有列出任何关于这个的信息,所以你很可能要联系那里的人来了解更多。我们在工作中使用这个来处理我们和他们一起做的事情,这是我不得不做的最疯狂的XML处理。
nuypyhwy2#
看一下
Amazon E-Commerce Service
部分中的AWS Zone。cl25kdpy3#
我想知道你想使用哪一个亚马逊AWS服务?或者你不知道?
为什么你需要离线数据库呢?为什么不对你需要的所有东西都发出请求,并做一些临时缓存呢?
smtd7mpg4#
我也不是一个程序员,但好奇和便宜。Asellerstool可能是伟大的,但他们不会左右,如果不是亚马逊的免费数据库。嗯,我想没有人关心二手书的价格?