使用eclipse创建Nutch2.x插件

ctzwtxfj  于 2021-06-10  发布在  Hbase
关注(0)|答案(2)|浏览(343)

我必须写一个插件来解析爬网内容vynutch2.3.1。我决定使用eclipse作为它比简单编辑器更好的编辑器。现在我如何在eclipse中创建一个插件并通过一些简单的用例来测试它呢?

i2loujxw

i2loujxw1#

您可以使用以下步骤从eclipse中获取插件。
获取nutch源代码。 git clone https://github.com/apache/nutch.git 切换到2.3.1分支。如果您想要开发最新的2.x,可以使用2.x分支https://github.com/apache/nutch/tree/branch-2.3.1
在eclipse中导入项目。
为eclipse构建。它使用 ant 用于构建并具有 eclipse 目标。 ant eclipse nutch中所有可用的插件都在 src/plugins 目录。
你需要一个笑脸结构为你的新插件,所以复制一个现有的插件到新的。 cp -r lib-http my-http 7现在检查插件目录的结构。应该如下所示。

my-http/
├── build.xml
├── ivy.xml
├── plugin.xml
└── src
    ├── java
    └── test
``` `plugin.xml` 是一个具有扩展、扩展点、运行库等定义的插件,您可以在eclipse插件编辑器中查看它,并可以在那里进行更改。
添加适当的实现类和测试。在Map上画出分机的位置 `plugin.xml` 你得改变主意 `build.xml` 以及 `ivy.xml` 添加适当的依赖项。
可以覆盖中定义的目标 `src/plugin/build-plugin.xml` 在你的 `build.xml` .  `build-plugin.xml` 正在由主生成文件调用 `src/build.xml` 对于每个插件。
您可以使用插件目录中的ant来测试您的插件。 `ant test` . 
您还可以使用eclipse检查juint测试结果。单击test class并运行为 `JUnit Test` 添加插件以在中部署和测试目标 `src/plugin/build.xml` . 此文件由主生成文件使用 `<ant dir="my-http" target="deploy"/>` 在中添加任何必需的依赖项 `build/ivy/ivy.xml` 添加插件 `plugin.includes` 中的属性 `conf/nutch-site.xml` 造坚果 `ant runtime` 现在你的插件被设置为在本地/分布式模式下运行 `runtime` 目录。
hmae6n7t

hmae6n7t2#

只要生成一个 jar 在nutch插件系统中加载正确的依赖项和xml文件中的配置,一切都应该正常工作。你可以查一下https://wiki.apache.org/nutch/runnutchineclipse 它包含在eclipse中打开和运行的详细说明,因此调试更容易,但不是必需的。特别重要的是跑步 ant eclipse 在项目的本地副本中,这样您就可以在eclipse中打开nutch完整的源代码,一旦完成,您就可以创建插件文件结构并开始编码。
希望有帮助。

相关问题