python 是否有一个工具,为新的进程注解波斯语文本?[已关闭]

k4ymrczo  于 2023-08-02  发布在  Python
关注(0)|答案(1)|浏览(83)

已关闭。此问题需要更多focused。它目前不接受回答。
**希望改进此问题?**更新问题,使其仅针对editing this post的一个问题。

昨天关门了。
Improve this question
我想知道如何训练我自己的模型或数据集。我应该使用注解器工具吗?如果是的话,请给予我一个向导。我想使用波斯语(“fa”)提取文本中的命名实体。
我尝试了一些在线网站的注解。但我认为我们应该使用验证,我不知道如何,我也想知道这是否会在波斯语工作。

4bbkushb

4bbkushb1#

要训练自己的模型,您可以从预先存在的模型开始(请参阅Huggingface model hub),然后使用自己的数据对其进行微调。您可以查看this guide,但您会发现同一主题的几个。
对于NER,您可以使用this website来注解数据。
所需的注解数量取决于几个因素:类的数量,文本/实体的复杂性,但作为经验法则,几百个应该没问题。
然后,您可以在训练/测试中分割数据,或运行Cross Validation approach,就像通常的机器学习模型一样。

相关问题