apache spark中名为input path的错误不存在

afdcj2ne 于 2021-05-29 发布在 Hadoop

关注(0)|答案(2)|浏览(372)

apachespark中有什么算法可以找出文本文件中的频繁模式吗。我尝试了以下示例，但最终总是出现以下错误：
org.apache.hadoop.mapred.invalidinputexception:输入路径不存在：文件：/d:/spark-1.3.1-bin-hadoop2.6/bin/data/mllib/sample\u fpgrowth.txt
有人能帮我解决这个问题吗？

import org.apache.spark.mllib.fpm.FPGrowth

val transactions = sc.textFile("...").map(_.split(" ")).cache()

val model = new FPGrowth()

model.setMinSupport(0.5)

model.setNumPartitions(10)

model.run(transactions)

model.freqItemsets.collect().foreach { 
    itemset => println(itemset.items.mkString("[", ",", "]") + ", " + itemset.freq)
}

hadoop

来源：https://stackoverflow.com/questions/32537270/error-in-apache-spark-called-input-path-does-not-exist

2条答案

按热度按时间

woobm2wo1#

我猜你在windows上运行spark。
像这样使用文件路径

D:\spark-1.3.1-bin-hadoop2.6\bin\data\mllib\sample_fpgrowth.txt

注意：如有必要，请转义“\”。

赞(0）回复(0）举报 2021-05-30

eufgjt7s2#

试试这个

file://D:/spark-1.3.1-bin-hadoop2.6/bin/data/mllib/sample_fpgrowth.txt

或

D:/spark-1.3.1-bin-hadoop2.6/bin/data/mllib/sample_fpgrowth.txt

如果不起作用，则更换 / 与 //

赞(0）回复(0）举报 2021-05-30

我来回答

apache spark中名为input path的错误不存在

2条答案

相关问题

热门标签

最新问答