昨天把前期的一些学习资料整理了一下,主要是为了后期可能会用到的文本语音合成。
通过安装Baidu-aip,使用百度的语音合成平台,基本可以实现我想实现的功能。但相比图像处理,百度的提供语言合成免费服务,就没有那么大方了,无论是使用期限还是使用次数。更苛刻的是合成文本大小只有1024字节,开始还以为是少了个K,后来确认,就是1024。
虽然文本大小可以通过预处理分解,存储到字典中批量处理,然后合并mp3文件,但总觉得不是长久之计。
于是又测试了一下百度曾经死对头谷歌的语音合成库gtts,没有那么多限制,虽然语调生硬了点,语速也没法调整,但好在是免费的,而且介词发音甚至好于百度语音库。
昨天在colab测试完后,今天就转到本地的机器上。百度语音合成库没有问题,但运转gtts却总是显示系统忙,生成的mp3文件大小也是0。因为python代码也就那么几行,问题出在哪一直百思不得其解。直到10几分钟后,出现错误提示后才发现,原来是被墙了。
之前因为一直在colab上测试运行,这个问题并未涉及,等到在本地机器上,这个大问题也就浮现了。
只能继续用colab了。