我在这里看到的关于deeplearning4j的问题不到500个,而且大多数都是老问题,首先是一个不同的问题:dl4j死了吗?我真的要处理可怕的,可怕的Python只是为了建立我的人工智能?我不想!
现在真正的问题,我觉得有点愚蠢,但真正的文档和谷歌是有点缺乏(见上述问题):我一直在阅读过去几天建立一个简单的文档分类器与dl4j这似乎是直截了当足够,虽然后续材料再次是可怕的稀疏。
我建立了一个 ParagraphVector
,添加一些标签,传入训练数据并进行训练。我还发现,数据是作为 LabelAwareIterator
. 使用一个文件结构,我甚至找到了dl4j提供的关于如何构造数据的文档。但是,如果我想从api或类似的应用程序中读取数据,而不是通过文件结构来读取呢?我想我需要一个labelawaredocumentator,但是数据应该如何构造以及如何输入呢?我读到过关于用文本表格和标签列来构建的文章,但这看起来很粗略,也很不精确。
我们将非常感谢您的帮助,因为这是比我目前找到的更好的资源。谢谢!
--更新
通过阅读源代码(通常只检查实现是个好主意),看起来我真正想要的是 SimpleLabelAwareIterator
. 代码可读性很好。我真的不明白 LabelAwareDocumentIterator
现在还没有。不管怎样,简单的一个只需要一个列表 LabelledDocuments
. 这个 LabelledDocuments
只要有一个字符串内容和标签列表。到目前为止,好的将在今晚尝试实施。如果成功的话,我会把这个贴出来作为答案。
暂无答案!
目前还没有任何答案,快来回答吧!