王小川：让机器做出判断和决定，这其中蕴含着巨大的商业价值

众推推 - 最专业的微信任务系统源码！

资讯热点

当前位置：首页 > 行业资讯 > 王小川：让机器做出判断和决定，这其中蕴含着巨大的商业价值

发布时间：2021-9-30 分类：行业资讯

因为它取代了人力，使机器生产出更先进的产品。判断和决策是业务的核心。3月27日，搜狗CEO王小川在宏泰基金CEO春分大会上发表了题为“人工智能技术的思考与应用”的演讲。王小川认为，概括了人工智能的三个应用层次。第一个层次是向机器传授传统规则；第二个层次是教授机器记忆学习的答案；第三层是将目标交给机器进行自学习。他认为，现阶段的人工智能有很多局限性。例如，机器需要学习和判断的先决条件，例如对环境的极端严格要求。在TOC方面，对图像和声音的深入学习非常重要。在谈到人工智能的商业价值时，王小川认为，人工智能有机会做出判断和决定。以下是王小川演讲的一部分：人工智能将分为三个阶段。我们仍处于第二阶段的高级阶段。人工智能并不是一个新的话题。这是在20世纪60年代和80年代完成的。不幸的是，当时是一名人工智能教授，因为人工智能的水平远远不够。那时，人们把对自己世界的认知变成了规则，变成了机器人，机器人告诉机器规则。这是那个时代的作品。那是20世纪60年代和80年代。人们对规则的表达偏离了这一目标。20世纪80年代后，基于统计方法的人工智能不再试图告诉机器人们对世界的认知，而是让机器学习并让你看到答案。一方面，他给了他原来的问题和答案后，看到了问题，这是一个机器人学习的道路。花了好几年时间。答案很清楚。一个典型的例子是人脸识别。如何描述它？我知道这个人是谁，但我无法描述。在2000年之后的突破点，我们发现，使用更粗略的方法，我们不应该试图找到这个问题的特征，将特征告诉机器，并将原始问题和原始数据移交给机器。我给了他2000多张照片，让他找出自己的特点，最后得到答案。2000年后的疫情与此有关。阿尔法犬就是这样出来的。他不是按原来的方式做的。今天，一些人工智能开始进入第三阶段。Alphago属于第二阶段，再加上第三阶段的一点，给它一些答案，告诉它人们在每种情况下的表现，让机器学习。这样，可以发现机器很难赶上顶尖人物。最后，我告诉机器你是对的，你赢了还是输了。目前，我们主要处于第二阶段，必须使用大数据。优点是我们不需要工程师对原始行业有特别深入的了解。例如，医生知道如何查看心脏病的心电图，但他们很难向工程师清楚地描述这一规则。自去年以来，这位工程师获得了一项非常重要的经验。我不需要医生了解他详细的技术经验，只要医生告诉我这代表什么。有了大量的工程数据，就可以建立这样一个模型，消除了行业与人工智能之间的天然沟通鸿沟。这将很快成为人工智能领域的突破性应用。在接下来的两三年里，成功的工作经验有了很大的提升，今年在情报领域有了很大的发现。今天的人工智能仍然有许多局限性。核心问题是有一个先决条件。例如，在有背景音乐的环境中，两到三个人同时说话。人们可以清楚地分辨出人们所说的声音，但机器却不能做到这一点。因为人工智能是对所见声音的处理，如果两个人在一起说话，它就不起作用了。例如，在一个非常安静的环境中，如果环境中有背景音乐，两到三个人一起说话，人们可以清楚地分辨出来，但机器无法做到。对于机器来说，如果声音与声音混合，人工智能就是对声音的处理。如果两个人一起说话，那是行不通的。如何处理？一种方法是使用麦克风。例如，当我们在车内时，车内有轮胎噪音和风噪音。将此记录下来，然后将其混合到培训中。我们这样做并不是为了表示认可，但它看到了这样的声音。有噪音。另一个困难是自然语言的处理。尽管机器翻译有了很大的发展，但它可以将汉语翻译成英语，将英语翻译成汉语。这可以很顺利地翻译。因为目前的机器人学习不是基于理论的方法。如果人说得流利，机器也能说得流利。例如，去年六月我去了剑桥的一个顶级语言实验室。他们正在演示人机对话系统。示威游行非常清楚。我想吃辣的食物。这台机器会帮你找到我想要的东西。当我找到餐馆时，机器问我，你需要停车位吗？我说我没有车，它不会回答。因为它不知道汽车和停车位之间的关系。所以自然语言处理是不够的。如果我们对产品进行分类，我将人工智能分为三类：识别、判断、决策和创造。今天要做的第一件事是对物理世界中的事物进行建模，如语音识别、图像识别等。这是一种。还有创造性的一代，如语音合成和图像合成，这是第一类和第三类的结合，如在安全领域的应用。我个人认为，第二类，即让机器做出判断和决定，具有巨大的商业价值。因为它取代了人力，使机器生产出更先进的产品。判断和决策实际上是业务的核心。早些时候，我谈到了人工智能的判断。我将在这里分享一些关于搜狗的想法。首先，人工智能的基本实践是学习。事实上，对于搜索引擎公司来说，无论是百度还是搜狗，他们中的大多数人仍在学习。现在随着学习的深入，我们可以想象更多。例如，在网络搜索中，我们的工程师如何让这台机器高质量地学习，或者如何在图像识别中更好地找到人脸和特征。经过深入学习，需要更多的数据进行改进。第二，对于TOC来说，图像和声音非常重要，这应该称为深度学习，它已经取得了很大的进步。我想表达的是，搜狗自2011年以来一直在这样做。其语音收入的80%将每天产生200000个语音数据。顺便说一句，语音识别的识别价值高于其他国家。这有一个清晰的应用场景。tob和TOC公司之间存在差异。应该有数据场景。如果没有情景，我们必须依赖其他国家的数据情景，这是一种合作方式。我们首先使用这项技术为自己服务，因为我们有足够大的数据场景来支持。第三，语音识别是人工智能的核心，还是未来人工智能的重要组成部分？我不这么认为。因为语音搜索只是一个擦伤。例如，使用语音搜索“王先生”“，这与用文字搜索基本上没有区别。它只是把我的新闻、百度和微博推给你。我们也在做把语言变成声音的事情，但我们正在考虑以个人为核心的周边地区的发展。它包括两种声音的转换和翻译，最后是对声音的理解。这就是我们在TOC公司的想法，这被称为自然交互和知识计算，自然交互关注于语音，以及如何建立对语音的分析和理解。业界将达成共识。演讲是未来最重要的事情。演讲是对话、翻译和问答，它们是最前沿的作品。我们为什么要考虑它？今天是单词搜索，未来是向机器提问，以便它能得到准确的答案。我们在这里工作，在w

« 国有资产部门和银行部门相互竞争，爱钱有助于关注共同基金市场 | 今年春天，风险投资圈中规模最大的一次跑步活动以“创业跑步”为标题，将创业者联系起来 »

: 周一周五 8:30 - 18:00

鲁ICP备14007395号-15

百度统计

客服QQ