我正在寻找一种方法来实现一个在Android上运行的离线连续语音识别器,最好使用Tensorflow引擎。该应用程序需要能够识别连续语音流中预定义的一组单词中的任何单词,并且假设Android设备可能处于不支持互联网连接的区域,因此Google服务等是不可能的。是否有任何RNN或CNN模型可以实现这一点?
gdx19jrr1#
您可以使用TensorFlow Lite上提供的Speech Recognition(向下滚动并搜索“Speech Recognition”)模型。它可以为音频流中所说的单词生成概率得分。最好的事情是他们提供了一个Android示例(该示例现在已弃用,但最后可用的提交是here)。使用TensorFlow Lite模型,您不需要活动的互联网连接来进行预测。这可能会影响应用程序的大小(但.tflite模型文件可能会很大)。您可以构建一个简单的方法,从模型的预测中提取必要的单词。
.tflite
1条答案
按热度按时间gdx19jrr1#
您可以使用TensorFlow Lite上提供的Speech Recognition(向下滚动并搜索“Speech Recognition”)模型。它可以为音频流中所说的单词生成概率得分。最好的事情是他们提供了一个Android示例(该示例现在已弃用,但最后可用的提交是here)。
使用TensorFlow Lite模型,您不需要活动的互联网连接来进行预测。这可能会影响应用程序的大小(但
.tflite
模型文件可能会很大)。您可以构建一个简单的方法,从模型的预测中提取必要的单词。