如何重现行为
使用西班牙语模型es-core-web-sm训练NER模型,并使用cloudpickle.dumps()将管道保存。在反序列化时,通过.get("config")方法出现以下错误。
Bad value substitution: option 'width' in section 'components.morphologizer.model.tok2vec' contains an interpolation key 'components.tok2vec.model.encode:width' which is not a valid option name. Raw value: '${components.tok2vec.model.encode:width}'
在检查模型初始化时的配置时,'${components.tok2vec.model.encode:width}'是mophologizer组件中的tok2vec宽度选项。这似乎只适用于西班牙语模型,英语模型的宽度为96。
您的环境
- 操作系统:Windows 11
- Python版本:3.10
- spaCy版本:3.7.2
- 环境信息:
1条答案
按热度按时间kh212irz1#
这个问题似乎是由于西班牙语模型(es-core-web-sm)与英语模型(en-core-web-sm)在处理组件配置方面的方式不同,尤其是在morphologizer组件中设置宽度参数的方式不同。
以下是一些可能帮助您的步骤:
示例代码:
示例代码:
希望这对您有所帮助,谢谢!