众推推 - 最专业的微信任务系统源码!

资讯热点
为什么Win10语音输入没有流行?

发布时间:2019-6-27 分类: 行业资讯

根据pcworld,Windows有一个微软不想提及的功能。虽然Windows10允许用户使用触摸笔“书写和绘制”,使用Windows Hello登录到Face系统(或保护Web安全),甚至命令Xiaona设置提醒,但它显然不希望用户使用其语音识别引擎来命令系统或让用户使用语音输入来编辑文档。微软对Windows语音识别的不充分推广可以追溯到10年前,当时微软的产品经理Shanen Boettcher在演示Windows Vista的语音输入功能时搞砸了。从那时起,Windows的语音输入技术已经相当“低调”。目前,很少有用户知道Windows具有语音输入功能。如果Windows有机会再次阻止语音输入,这似乎是一个机会。”计算机和人工智能的进步为语音输入提供了更好的基础。在被问及Office语音输入技术的未来时,微软负责语音识别研究的执行副总裁Harry Shum和Xiaona和Bing说:“这是一个重大问题。无法理解的是,语音输入并没有发挥更重要的作用。”语音识别不完美的原因是一些用户仍然认为语音输入是Doonesbury卡通系列中苹果的Newton PDA的水平。他们称用户的“我正在写一个测试句”为“暹罗战斗原子哨兵”。用户可以原谅Windows语音识别仍然使用Microsoft语音识别器8.0技术的想法,该技术自Vista以来基本保持不变。Schumm称之为“祖父级”技术。但是硬件已经发生了巨大的变化:pcworld说,听和解释语音需求的处理能力比10年前要低得多。PC产品(如Surface Book)中集成麦克风阵列的质量意味着无需使用专用麦克风语音识别即可实现高精度。但是,语音输入技术的发展是否适合公众使用?当使用语音输入软件输入长度为1028字的文章时,95%的准确率意味着用户必须纠正超过15个错误。在测试中,Windows语音输入的准确率为93.6%,理论上不高,低于测试的其他专用语音输入软件。Windows有一个奇怪的习惯,即在输入逗号时,在文档中插入“逗号”。语音输入界似乎对这种相对较小的错误是否有重大影响有不同的看法。当然,这不是全部。任何使用语音输入软件的人都知道准确的关键是训练。随着时间的推移,语音输入软件将理解用户的口音。“杏”中“A”的发音与“猿”中“坏”或“A”的发音相同,如何过滤无意识的痉挛性语言障碍。微软员工声称,经过适当的培训,Windows语音识别技术的准确率可以达到99%。用1000个字犯10个错误也不算太坏。很少有用户愿意花时间培训使用语音识别软件。Windows语音识别软件要求用户在10分钟内训练好几句话,这会让用户觉得自己活在一年之中。Xiaona和Siri不要求用户进行培训,因为他们已经培训了数百万个语音样本。与Windows语音输入系统相比,Xiaona(可用于个人电脑和手机)在语音识别方面的表现要好得多,因为它充分利用了微软云服务的计算能力。微软将分析用户的声音,将用户的声音与其他数据联系起来,并生成智能作为小娜的灵魂。微软重视语音识别。鉴于小娜的出色表现,用户会认为语音应该是上周微软点火会议的中心。然而,在点火期间,没有与语音输入相关的会议,只有一个与语音识别相关的会议。微软首席执行官萨蒂亚纳德拉在他的主题演讲中称语音识别是微软未来发展的关键因素。以Skype翻译器为例。据纳德拉说,Skype翻译依赖于三个研究领域:语音识别、语音合成和机器翻译。纳德拉在演讲中说,微软语音识别算法的错误率为6.9%,这是一个糟糕的结果:准确率仅为93.1%。PCWorld表示,如果微软真的重视办公软件,个人电脑语音识别的未来不仅仅是用Skype在孟加拉国预订酒店,而是通过语音而不是手指来书写体验。

« 人人网拆分视频社交平台“我的节目”向股东分配股权 | 1/3平台破产网络互助产业是要生存吗?还是商业化? »