镁佳申请多通道语音唤醒专利,减少对计算资源的依赖

2025-04-07ASPCMS社区 - fjmyhfvclm

金融界2025年4月7日消息,国家知识产权局信息显示,镁佳(北京)科技有限公司申请一项名为“多通道语音唤醒方法和装置”的专利,公开号CN 119763572 A,申请日期为2024年12月。

专利摘要显示,本公开涉及语音识别技术领域,公开了多通道语音唤醒方法和装置。方法包括:基于从多个麦克风通道收集的语音数据,生成多通道的语音数据;将多通道的语音数据输入语音特征提取网络进行逐层处理,得到多通道的语音数据对应的音频帧输出特征;语音特征提取网络是预先训练好的神经网络,语音特征提取网络包括:通过输出‑输入关系依次连接的波束赋形模块、梅尔滤波器语音编码器将多通道的语音数据对应的音频帧输出特征中的至少部分特征输入束搜索模块进行解码,得到多通道的语音数据对应的发音序列;在多通道的语音数据对应的发音序列中包含唤醒词时,发送语音唤醒指令,减少了对计算资源的依赖,且提高了唤醒结果的准确性。

天眼查资料显示,镁佳(北京)科技有限公司,成立于2018年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本10000万美元,实缴资本10000万美元。通过天眼查大数据分析,镁佳(北京)科技有限公司参与招投标项目13次,财产线索方面有商标信息99条,专利信息300条,此外企业还拥有行政许可3个。

全部评论