实现(联信)QA系统的可行性
不但 可行 而且 可行!
1.如何改进文本QA软件
如果想更贴近于业务场景(比如某业务领域知识的查询,知识问答,百度搜索,智能医生,催收),我们要做的就是修改训练集,使得底层调用的模型学习到该业务场景就好了,还有可能需要调整模型结构或参数。
2.基于文本QA软件,如何实现语音QA
我查了相关资料,团队完成语音识别和语音合成是有难度的,语音识别还可以,但是语音合成目前基本不可能完成。 我们要感谢一些牛B的,有逼格的互联网大公司,让我们做成QA系统成为可能。
简单介绍一下语音识别
- 将人类语言转化为文本的技术
- 智能机器人的必备技能
- 机器学习的一种应用
- 离线语音识别:sphinx,windows
- 云语音识别:百度,科大讯飞,苹果,谷歌(墙外)
- 在线语音识别的精度远高于离线语音识别
- 百度,讯飞等提供的离线语音识别,实际上还是需要网络,需要与云服务器通讯的
离线语音识别
- 李开复,sphinx
- 微软,win7系统内置的语音识别引擎,识别率低,经过重复训练后可提高
在线语音识别
-
科大讯飞
-
识别率高,支持方言(超赞)
-
每天500次免费调用,超过部分收费
-
-
百度语音
- 识别率高,不支持方言(支持粤语)
- 免费,无限次调用(业界良心)
- 我已经测试,调用百度云语音的服务,完成初步的QA系统
-
苹果
- 因其独立的硬件和软件系统
- 你们休想知道我是怎么做到的
-
谷歌
- 免费,但是你找不到我
百度云语音
- 语音识别,语音合成
- 免费使用
- 可申请无限次调用API
- 提供移动平台的SDK接入,对于PC平台,可使用REST API访问
- 提供java,C++的访问demo(好像现在也有Python的访问Demo)
使用比较简单:
- 云端程序开发
- 注册百度开发者
- 建立应用
- 提升应用权限
- 记住token和key
- http://yuyin.baidu.com/
对于语音合成,我想我们还是放弃吧,直接拿第三方的开源云服务接口就够我们用了,你只要提供正确的文本,百度云语音就可以变换各种声线的给你提供准确的语音合成。
基于百度语言识别及合成,我们就非常容易修改我们的小软件,做成语音QA系统,这里边需要特别的问题有:多线程并发识别合成,断点识别,语音降噪,云服务调用。
难点: 语音识别的准确性,基于业务场景的文本QA系统的训练,不论怎么样,先做出来,慢慢调整。
还有最重要的一点是,聊天机器人的前后文逻辑性基本是0,她只会很好的回答你当前的问题
example:
A: 你爸爸是谁?
机器人: 我爸爸是XXX
A: 我刚才问你爸爸是谁了没有?
机器人:他不会结合上下文聊天语境来回答这个问题,他的语言逻辑推理能力基本为0