我正在开发一个为视频内容提供翻译字幕的应用程序。我的访问模式如下所示:
获取视频字幕
对于每个单词,从“翻译数据库”获取翻译(基本上只是一个单词的字典->x中的单词)
返回聚合翻译。
每个视频可能有数千个单词,而我目前的方法对于一个视频需要几秒钟的时间——主要是通过重复提取单词->单词翻译来完成。由于整个翻译词典是有限的,而且相对较小,大约只有几兆字节,所以我想我可以简单地缓存整个词典,以跳过所有这些微小的数据库获取。
新的缓存策略-像redis这样的东西是过度杀戮还是这是一个预期的用例?希望保持低成本。使用node.js后端(如果相关)。
1条答案
按热度按时间9avjhtql1#
你几乎没有选择:
你可以使用亚马逊翻译,这将为你做繁重的工作。您可以简单地调用一个api并获取转换文本(既有批处理api,也有实时api)。
如果缓存大小只有几兆字节,那么在应用程序启动时从数据库检索字典并将其保存在应用程序的内存中。然而,如果字典要增长,那么就把它保存在redis中。