实现(联信)QA系统的可行性

不但 可行 而且 可行!

1.如何改进文本QA软件

如果想更贴近于业务场景(比如某业务领域知识的查询,知识问答,百度搜索,智能医生,催收),我们要做的就是修改训练集,使得底层调用的模型学习到该业务场景就好了,还有可能需要调整模型结构或参数。

2.基于文本QA软件,如何实现语音QA

我查了相关资料,团队完成语音识别和语音合成是有难度的,语音识别还可以,但是语音合成目前基本不可能完成。 我们要感谢一些牛B的,有逼格的互联网大公司,让我们做成QA系统成为可能。

简单介绍一下语音识别

  • 将人类语言转化为文本的技术
  • 智能机器人的必备技能
  • 机器学习的一种应用
  • 离线语音识别:sphinx,windows
  • 云语音识别:百度,科大讯飞,苹果,谷歌(墙外)
  • 在线语音识别的精度远高于离线语音识别
  • 百度,讯飞等提供的离线语音识别,实际上还是需要网络,需要与云服务器通讯的

离线语音识别

  • 李开复,sphinx
  • 微软,win7系统内置的语音识别引擎,识别率低,经过重复训练后可提高

在线语音识别

  • 科大讯飞

    • 识别率高,支持方言(超赞)

    • 每天500次免费调用,超过部分收费

  • 百度语音

    • 识别率高,不支持方言(支持粤语)
    • 免费,无限次调用(业界良心)
    • 我已经测试,调用百度云语音的服务,完成初步的QA系统
  • 苹果

    • 因其独立的硬件和软件系统
    • 你们休想知道我是怎么做到的
  • 谷歌

    • 免费,但是你找不到我

百度云语音

  • 语音识别,语音合成
  • 免费使用
  • 可申请无限次调用API
  • 提供移动平台的SDK接入,对于PC平台,可使用REST API访问
  • 提供java,C++的访问demo(好像现在也有Python的访问Demo)

使用比较简单:

  • 云端程序开发
  • 注册百度开发者
  • 建立应用
  • 提升应用权限
  • 记住token和key
  • http://yuyin.baidu.com/

对于语音合成,我想我们还是放弃吧,直接拿第三方的开源云服务接口就够我们用了,你只要提供正确的文本,百度云语音就可以变换各种声线的给你提供准确的语音合成。


基于百度语言识别及合成,我们就非常容易修改我们的小软件,做成语音QA系统,这里边需要特别的问题有:多线程并发识别合成,断点识别,语音降噪,云服务调用。


难点: 语音识别的准确性,基于业务场景的文本QA系统的训练,不论怎么样,先做出来,慢慢调整。

还有最重要的一点是,聊天机器人的前后文逻辑性基本是0,她只会很好的回答你当前的问题


example:

A: 你爸爸是谁?
机器人: 我爸爸是XXX
A: 我刚才问你爸爸是谁了没有?
机器人:他不会结合上下文聊天语境来回答这个问题,他的语言逻辑推理能力基本为0