北京城市学院计算机科学系助理教授张生志获得了思科公司98,197美元的资助,作为其项目的一部分,该项目将通过改进处理错误输入的方式,帮助建立更好的语音识别系统。

张助理教授的项目名为“重新思考针对语音识别系统的对抗性攻击”。目前,语音识别系统可能不可靠,因为它们的机器学习基础在遇到声音缺陷时很容易受到破坏。这些“对抗性例子”会误导系统并导致错误。

在他的澳门威尼斯人注册网站研究中,张博士专注于人工智能安全,调查人工智能系统的风险——比如亚马逊Echo、b谷歌助手和Home、苹果Siri和微软cortana背后的语音识别系统——并设计防御解决方案来减轻这些风险。

虽然语音识别模型是为了模仿人类的听力而建立的,但人类听力的一些元素还没有被整合,比如频率。这项澳门威尼斯人注册网站研究的假设是,因子或语音频率是解释现象的关键,即人类用来分解单词的可感知声音。

“我们正试图在生成的对抗性示例中识别导致语音识别系统错误识别的关键特征,”张博士说,他解释说,这些人类无法察觉的特征是故障的根本原因。这就造成了一个可以被坏人利用的漏洞。

“攻击者可以制作一段干扰片段,将其注入一段轻柔的音乐中,”他解释说,“当使用扬声器播放时,(它)将被语音识别系统识别为一个短语或一个操作命令,(比如)打开灯。但对人类来说,它仍然被理解为轻柔的音乐,带有某种噪音。”

张博士认为,这个项目所体现的解决问题的整体性是计算机科学澳门威尼斯人注册网站研究的一个共同特征。

“实际上,语音识别本身就是计算机科学和计算语言学的跨学科子领域,”张博士说。

你可以在这个网站上听张博士的澳门威尼斯人注册网站研究演示。