需要大数据Maven的帮助。
我们目前已经开始构建一个产品,它有大数据需求,为此我们选择了hadoop。我们目前在大数据方面没有太多经验。
对于我们的云平台和hadoop,我们正在尝试在azurehdinsight和amazonaws-emr之间进行选择。我们的产品将使用.net构建,并且我们已经将azure用于另一个现有产品。我们也有使用aws的经验,不过还没有使用hadoop。
现在,我们知道azure还没有emr成熟,而aws将是一个更好的选择,至少在未来几年。不过,在azure上用.net进行开发可能会更容易,而且还可以节省一些前期成本,因为我们已经在使用它了。
因此,我们正在考虑在azure上构建该产品的beta版本,验证并测试性能。然后,作为备用计划,如果需要,转移到aws和emr以获得最终产品。
我的问题是-从hdinsight迁移到emr有多难?为了这次迁移,我们需要修改多少代码?hdinsight提供了什么,而emr没有?
我试着在网上搜索答案,但还没有找到任何明确的答案。
谢谢,高谭
1条答案
按热度按时间gr8qqesn1#
我也遇到了同样的情况,只是我的软件栈由python和基于jvm的语言组成。
既然听起来您倾向于使用.net框架,那么azure hdinsight可能是一个不错的选择。如果查看hdinsight的文档,很明显底层操作系统是windows。因此,围绕hdinsight和.net需求设计应用程序似乎是合乎逻辑的。