Kaldi 是一个用于语音识别的开发平台(工具包),目前已经较为成熟,而且文档很多。
本文提供一个 Kaldi 在 Mac OS X 10.11。5 下的安装教程,如果你用 Windows,请买一台 Mac。
下载源码
Kaldi 在 Github 上开源,我们应该直接下载他最新的源码执行编译。
|
|
编译
编译这种大型框架不应该去互联网上搜索任何安装教程,而是应该阅读官方的安装教程。(那我写这篇文章干嘛呢…(╯‵□′)╯︵┻━┻
我们容易看到在源码的根目录下有一个INSTALL
的文件,上面描述了安装步骤。
第一步:在 tools/
下查看 INSTALL
安装指令;
第二步:在 src/
下查看 INSTALL
安装指令。
tools/
首先我们需要安装 Kaldi 的相关工具,最重要的就是编译 openfst
,这里包含众多依赖,Kaldi 自身提供了一个脚本来帮助我们检查相关依赖。
|
|
对于没有安装的东西,请自行安装,我第一次检查的时候居然全部通过了。(这个脚本里面大部分依赖其实都是Python 2.7的一些库,说明我是一个 Python 用户。
如果打印了 all OK.
说明所有依赖都已经安装完成。
接下来就是编译,直接使用:
|
|
-j
参数是提供多核加速编译,这里的 4 就是用四核进行编译。(不太可能有谁现在还用单核 CPU 了吧?
src/
编译完 tools/
下的工具后,我们就可以开始编译 Kaldi 的主体部分了。
首先需要安装 CUDA,NVIDIA 传送门:https://developer.nvidia.com/cuda-downloads。
(如果你的电脑不是 N 卡,请把电脑扔了并买一台有 N 卡的 Mac;如果你的电脑上 Xcode 都没装,呵呵。。
然后我们需要进行一些编译前的配置,进入 src/
:
|
|
这时候,如果你遇到了下面提示的警告:
|
|
请升级你的系统,因为最新的 El Capitan 10.11.5 已经解决这个问题了,不要惧怕这个警告。
然后执行最后的编译:
|
|
这里会出现一个问题,可能会报错:
|
|
我 Google 了一段时间并没有发现有人提出这个问题的解决方案。
考虑到 DOUBLE_PRECISION 这个词的意思,个人猜测可能需要自己指定双精度浮点数的精度,在 Mac 是64位系统,浮点数的精度为64,看这里 所以可以:
|
|
这样完成了整个 Kaldi 的安装。