解决口语化翻译
在翻译系统中的准确率相对提升10%
解决数据稀缺
标注数据仅有几十个小时情况下,成功搭建语音识别系统,且识别率近 80%!
  • 声学资源
  • 引入迁移学习复用声学资源
  • 引入模型
  • 引入相似词语音模型
  • 解决问题
  • 解决外来词(OOV)问题
  • 语音识别
  • 语音识别翻译引擎
解决环境鲁棒性
与主流基线相比,在强噪音和强混响条件下,WER平均相对下降 10%~15%!
  • 时域去噪
  • 引入稀疏编码(SC)实现时域去噪
  • 回声消除
  • 引入稀疏约束(LASSO)实现特征端回声消除
  • 音乐去噪
  • 引入去噪自编码器(DAE)实现特征端音乐去噪
  • 模型训练
  • 引入加噪训练实现鲁棒性模型训练
解决声纹识别速度及识别率
在 0.3秒 超短时情况下,声纹识别率达到87%!在1秒超短时情况下,语种识别率达到95%!
  • 说话提取
  • 超短时说话人特征分析提取
  • 语种识别
  • 超短时语种识别和口音识别
  • 深度分解
  • 多任务协同学习与信息深度分解
解决离线模型
节省了 90% 以上的网络结构!真正实现网络稀疏化! 基于剪枝与重整的模型压缩
  • OBD算法
  • 引入OBD算法
  • GA算法
  • 引入GA算法实现稀疏分块矩阵
  • 剪枝与重整
  • 基于剪枝与重整的模型压缩
联系我们
  • 服务号
  • 订阅号
  • 电话   400-996-6525
    邮箱   zhuner@aibabel.com
    地址   北京市海淀区知春路12号泰跃商务中心4层
  • 商业合作
  • (大客户)
  • 戴先生,18600548661,daizheng@aibabel.com
  • (翻译机代理合作)
  • 何先生(线上业务),18691772019 ,hebo@aibabel.com
  • 高先生(线下业务),15176389678,gaoyanpei@aibabel.com
© 2016 - 2017 北京分音塔科技有限公司京 ICP备16058387号