众推推 - 最专业的微信任务系统源码!

资讯热点
王小川:让机器做出判断和决定,这其中蕴含着巨大的商业价值

发布时间:2021-9-30 分类: 行业资讯

因为它取代了人力,使机器生产出更先进的产品。判断和决策是业务的核心。3月27日,搜狗CEO王小川在宏泰基金CEO春分大会上发表了题为“人工智能技术的思考与应用”的演讲。王小川认为,概括了人工智能的三个应用层次。第一个层次是向机器传授传统规则;第二个层次是教授机器记忆学习的答案;第三层是将目标交给机器进行自学习。他认为,现阶段的人工智能有很多局限性。例如,机器需要学习和判断的先决条件,例如对环境的极端严格要求。在TOC方面,对图像和声音的深入学习非常重要。在谈到人工智能的商业价值时,王小川认为,人工智能有机会做出判断和决定。以下是王小川演讲的一部分:人工智能将分为三个阶段。我们仍处于第二阶段的高级阶段。人工智能并不是一个新的话题。这是在20世纪60年代和80年代完成的。不幸的是,当时是一名人工智能教授,因为人工智能的水平远远不够。那时,人们把对自己世界的认知变成了规则,变成了机器人,机器人告诉机器规则。这是那个时代的作品。那是20世纪60年代和80年代。人们对规则的表达偏离了这一目标。20世纪80年代后,基于统计方法的人工智能不再试图告诉机器人们对世界的认知,而是让机器学习并让你看到答案。一方面,他给了他原来的问题和答案后,看到了问题,这是一个机器人学习的道路。花了好几年时间。答案很清楚。一个典型的例子是人脸识别。如何描述它?我知道这个人是谁,但我无法描述。在2000年之后的突破点,我们发现,使用更粗略的方法,我们不应该试图找到这个问题的特征,将特征告诉机器,并将原始问题和原始数据移交给机器。我给了他2000多张照片,让他找出自己的特点,最后得到答案。2000年后的疫情与此有关。阿尔法犬就是这样出来的。他不是按原来的方式做的。今天,一些人工智能开始进入第三阶段。Alphago属于第二阶段,再加上第三阶段的一点,给它一些答案,告诉它人们在每种情况下的表现,让机器学习。这样,可以发现机器很难赶上顶尖人物。最后,我告诉机器你是对的,你赢了还是输了。目前,我们主要处于第二阶段,必须使用大数据。优点是我们不需要工程师对原始行业有特别深入的了解。例如,医生知道如何查看心脏病的心电图,但他们很难向工程师清楚地描述这一规则。自去年以来,这位工程师获得了一项非常重要的经验。我不需要医生了解他详细的技术经验,只要医生告诉我这代表什么。有了大量的工程数据,就可以建立这样一个模型,消除了行业与人工智能之间的天然沟通鸿沟。这将很快成为人工智能领域的突破性应用。在接下来的两三年里,成功的工作经验有了很大的提升,今年在情报领域有了很大的发现。今天的人工智能仍然有许多局限性。核心问题是有一个先决条件。例如,在有背景音乐的环境中,两到三个人同时说话。人们可以清楚地分辨出人们所说的声音,但机器却不能做到这一点。因为人工智能是对所见声音的处理,如果两个人在一起说话,它就不起作用了。例如,在一个非常安静的环境中,如果环境中有背景音乐,两到三个人一起说话,人们可以清楚地分辨出来,但机器无法做到。对于机器来说,如果声音与声音混合,人工智能就是对声音的处理。如果两个人一起说话,那是行不通的。如何处理?一种方法是使用麦克风。例如,当我们在车内时,车内有轮胎噪音和风噪音。将此记录下来,然后将其混合到培训中。我们这样做并不是为了表示认可,但它看到了这样的声音。有噪音。另一个困难是自然语言的处理。尽管机器翻译有了很大的发展,但它可以将汉语翻译成英语,将英语翻译成汉语。这可以很顺利地翻译。因为目前的机器人学习不是基于理论的方法。如果人说得流利,机器也能说得流利。例如,去年六月我去了剑桥的一个顶级语言实验室。他们正在演示人机对话系统。示威游行非常清楚。我想吃辣的食物。这台机器会帮你找到我想要的东西。当我找到餐馆时,机器问我,你需要停车位吗?我说我没有车,它不会回答。因为它不知道汽车和停车位之间的关系。所以自然语言处理是不够的。如果我们对产品进行分类,我将人工智能分为三类:识别、判断、决策和创造。今天要做的第一件事是对物理世界中的事物进行建模,如语音识别、图像识别等。这是一种。还有创造性的一代,如语音合成和图像合成,这是第一类和第三类的结合,如在安全领域的应用。我个人认为,第二类,即让机器做出判断和决定,具有巨大的商业价值。因为它取代了人力,使机器生产出更先进的产品。判断和决策实际上是业务的核心。早些时候,我谈到了人工智能的判断。我将在这里分享一些关于搜狗的想法。首先,人工智能的基本实践是学习。事实上,对于搜索引擎公司来说,无论是百度还是搜狗,他们中的大多数人仍在学习。现在随着学习的深入,我们可以想象更多。例如,在网络搜索中,我们的工程师如何让这台机器高质量地学习,或者如何在图像识别中更好地找到人脸和特征。经过深入学习,需要更多的数据进行改进。第二,对于TOC来说,图像和声音非常重要,这应该称为深度学习,它已经取得了很大的进步。我想表达的是,搜狗自2011年以来一直在这样做。其语音收入的80%将每天产生200000个语音数据。顺便说一句,语音识别的识别价值高于其他国家。这有一个清晰的应用场景。tob和TOC公司之间存在差异。应该有数据场景。如果没有情景,我们必须依赖其他国家的数据情景,这是一种合作方式。我们首先使用这项技术为自己服务,因为我们有足够大的数据场景来支持。第三,语音识别是人工智能的核心,还是未来人工智能的重要组成部分?我不这么认为。因为语音搜索只是一个擦伤。例如,使用语音搜索“王先生”“,这与用文字搜索基本上没有区别。它只是把我的新闻、百度和微博推给你。我们也在做把语言变成声音的事情,但我们正在考虑以个人为核心的周边地区的发展。它包括两种声音的转换和翻译,最后是对声音的理解。这就是我们在TOC公司的想法,这被称为自然交互和知识计算,自然交互关注于语音,以及如何建立对语音的分析和理解。业界将达成共识。演讲是未来最重要的事情。演讲是对话、翻译和问答,它们是最前沿的作品。我们为什么要考虑它?今天是单词搜索,未来是向机器提问,以便它能得到准确的答案。我们在这里工作,在w

« 国有资产部门和银行部门相互竞争,爱钱有助于关注共同基金市场 | 今年春天,风险投资圈中规模最大的一次跑步活动以“创业跑步”为标题,将创业者联系起来 »