本课程主要讲解语音信号处理,麦克风阵列信号处理,语音识别中的关键技术及实用技巧。

 

通过该课程的学习,可以了解目前AI设备(智能音响、机器人、车载设备等)中语音交互的关键技术,根据一些开源软件及硬件设备可以搭建一套远场语音识别系统,同时语音信号处理中的回声消除、噪声抑制技术也是VOIP的核心,广泛应用于各类直播平台、即时通讯等应用软件中。

开课安排

5月17日开课

线上录播视频+讲师直播答疑

学员福利

1.GPU服务

提供长达1个月的GPU服务,快速提升学员的实战开发能力。

2.价值1999元的开发板放送

抽取10名积极学员,每人提供一套价值1999元的SAI_MICA_41T-UI、USB版本的开发版,增强实操练习,有效提高学习效率。

3.优秀学员内推AI企业

优秀学员可内推BAT和AI企业,跳过层层审核,直达管理层。

4.进入学员群,获免费参与活动福利

不定期邀请大牛进行线上/线下的分享,进入一线语音公司面对面交流。

  • 早鸟票

    原价:¥1999

    ¥ 1499

    5月10日前
  • 优惠价

    原价:¥1999

    ¥ 1699

    5月10日-5月17日
  • 3人+团购价

    原价:¥1999

    ¥ 1399

    人数越多折扣越大
立即报名

(点击报名,联系客服改价)

  • 冯大航 声智科技CTO

    2007年开始从事语音信号处理,麦克风阵列信号处理,语音识别方向研究,在语音交互领域已经积累10年经验。

    2007年毕业于中国科学技术大学电子信息工程系;2007-2012年在中国科学院声学研究所读博士,博士期间在阵列信号处理方向发表多篇SCI、EI论文;中国科学院声学研究所任助理研究员,工作期间获得国家自然科学基金项目,同时参与了多个国家重大项目;2015年曾任职于云知声负责远场语音识别前端算法,2016年5月联合创建声智科技。

适合人群

课程大纲

第一部分

  • 语音交互概述

    1、语音交互行业发展未来趋势

    2、麦克风介绍

    3、Echo音响拆解及技术剖析

第二部分

  • 让智能设备听得清:麦克风阵列信号处理

    1、回声消除技术

    2、波达方向估计技术

    3、波束形成技术

    4、单通道语音增强技术

    5、去混响技术

    6、各个技术之间的联系

第三部分

  • 让设备听得懂:语音识别技术

    1、语音识别基础

    2、语音识别原理

    3、搭建语音识别系统一般流程

    4、远场语音识别声学模型匹配