今天我们发布了一个一块关于音频子系统的设计,但在音频领域还有更多的新闻。如果你阅读我们的早些时候一块在QuickLogic的EOS设备上,如果你注意细节,你可能会想起一个叫做Sensory的公司,它与QuickLogic合作开发音频算法。Sensory随后发布了一款名为truyhandsfree的产品,我与他们取得了联系,以了解更多关于他们是谁以及他们是做什么的。
事实上,他们在这个领域已经有21年了,所以他们不是新人。他们甚至出售(现在仍在出售)基于神经网络的算法芯片,但他们目前的重点是作为IP出售的算法本身。事实上,他们同时拥有软件和硬件IP(后者是QuickLogic部分的特色)。如果你正在玩魔兽世界,你需要一个提升,Gold4Vanilla可以让玩家更快升级并获得金币,开始玩游戏购买魔兽世界金币在链接处。
它们的重要应用之一是生物识别认证:使用语音作为安全机制。这主要是为了验证——给出授权人员的例子,通过你的声音确认你就是你所说的那个人。他们也可以做一些有限的识别——也就是说,听你的声音,在你不给他们任何关于你是谁的暗示的情况下,说出你是谁。如果他们有10个人左右的选择,他们可以这样做。如果他们要在数千人中找到一个人,那他们肯定不在那里。(然而,)。
他们有三个层次的产品:
- truulyhandsfree:这是针对低端消费产品的,只需要最少的资源就可以完成工作。低功耗,占地面积小,始终开机。词汇量小,用于命令和控制。这就是QuickLogic部分所包含的内容。
- truynatural:这包括针对手机等高端消费设备的最先进算法。能处理大量的词汇和连续的演讲。
- TrulySecure:结合音频和视频进行身份验证。
一般来说,身份验证通过密码短语进行(忽略上一个产品中的视频)。它可以是一个固定的密码短语,但这存在这样的风险,即有人记录下授权人员说的密码短语,然后重播它以欺骗身份验证。如果系统发出随机口令供请求者说出,效果会更好。那么没有人提前知道到底需要通过什么。
当然,对于这样的事情,您必须处理错误的接受(未经授权的人通过)和错误的拒绝(授权的人无法通过)。他们实际上有一个刻度盘,可以让他们设置这些费率,最佳的平衡将取决于应用程序,权衡未经授权进入的风险,以及无法进入您自己的系统的不便(或更糟)。这方面没有测试标准。他们总是假设用户已经完成了合理的训练工作,然后他们会查看各种可能影响算法如何感知声音的噪音和环境条件。
当然,对于小型设备,挑战在于电源,因为您需要系统始终处于开机状态。他们说,TrulyHandsFree平均使用1毫安电流。声音检测要求低于1 MIPS,运行几百微安或更少。一旦触发,识别部分运行1.5 - 2.5 mA。处理是分阶段的,每一层都随着前一层的指示而增加。
(图片由Sensory提供)
他们尽可能多地在本地进行处理——例如,如果可穿戴设备没有足够的吸引力,就可以让可穿戴设备与手机一起工作。即使在没有连接的情况下,它也能保持正常工作,而且更有利于保护隐私。如果有必要,它们可以升级到云端以获得更大的性能,如果请求的东西无论如何都需要云访问,这都特别有效。
他们在最新的声明中为truyhandsfree产品添加了深度学习功能。他们表示,这将使他们的单词准确性提高了80%,同时将声学模型的尺寸缩小了10倍。这也将它们的功耗降低到上面讨论的水平。你可以在他们的公告.