week3-10 Survey of major AI techniques (optional) 人工智能主要技术调查（可选）

今天有很多AI和机器学习技术。

而有监督的学习，即学习A到B的映射，是最有价值的，至少在经济上今天，还有许多值得了解的其他技术。

让我们来看看。

无人监督学习的最着名的例子是聚类，这是一个例子。

假设您经营一家专门销售薯片的杂货店。

并且您收集不同客户的数据，并跟踪单个客户购买的薯片的不同包装数量，以及该人员为其薯片支付的每包的平均价格。

因此，你出售一些低端，更便宜的薯片，以及一些高端，更昂贵的薯片包。

不同的人可能会购买不同数量的薯片，这是典型的杂货店之旅。

给定这样的数据，聚类算法会说你的数据看起来像两个簇。

你的一些顾客倾向于购买价格相对便宜的薯片，但买了很多包。

例如，如果您的杂货店靠近大学校园，您可能会发现许多大学生购买更便宜的薯片，但他们肯定会购买很多。

在这个不同购物者群体的数据中有第二个集群购买更少的薯片包，但购买更昂贵的包。

聚类算法查看数据，并自动将数据分组为两个聚类或更多聚类，并且通常用于市场细分。

如果你有一个购买某种类型的薯片的大学生观众，以及一个购买较少薯片而且愿意支付更多费用的专业观众，你会发现这些事情。

这可以帮助您对这些细分市场进行不同的营销。

这称为无监督学习的原因如下。

有监督的学习算法运行A到B的映射，而你必须告诉算法你想要的输出B是什么，一个无监督的学习算法不能完全按照它想要的方式输出AI系统。

相反，它为AI系统提供了大量数据，例如此客户数据，它告诉AI在数据中找到有趣的东西，在数据中找到有意义的东西。

在这种情况下，聚类算法事先并不知道有大学生人口统计和工作专业人口统计。

相反，它只是试图找到不同的细分市场而不被告知它们是什么。

因此，无监督学习算法，给定没有任何特定设计输出标签的数据，没有目标标签B，可以自动找到有关数据的东西。

我曾经研究过的无监督学习的一个例子就是那只略显臭名昭着的Google猫。

在这个项目中，我让我的团队在一大堆YouTube视频上运行无监督学习算法，我们询问了算法，告诉我们你在YouTube视频中找到了什么。

YouTube视频中的许多内容之一就是猫，因为有点刻板印象，YouTube显然有很多猫视频。

但这是一个非凡的结果，没有事先告诉它它应该找到猫，AI系统，无监督的学习算法，能够自己发现猫的概念。

只是看了很多YouTube视频并发现了这个，男孩，YouTube视频中有很多猫。

很难准确地想象出AI算法有时会想到什么，但右边的图片是系统学到的猫概念的可视化。

尽管有人监督学习是一种非常有价值和强大的技术，但对监督学习的批评之一是它只需要一些标记数据。

例如，如果您正在尝试使用监督学习将AI系统转换为公认的咖啡杯，那么您可以给它1000张咖啡杯照片或10,000张咖啡杯照片。

而这只是咖啡杯咖啡杯的很多图片我们将提供我们的AI系统。

对于那些作为父母的人，我最近向你保证，这个星球上没有任何父母，无论多么爱和关心，都曾向他们的孩子指出过10,000个独特的咖啡杯，尝试给孩子们带来什么是咖啡杯。

因此，今天的人工智能系统需要更多的标记数据来学习，而不是大多数动物的人类孩子。

这就是为什么人工智能研究人员为无人监督学习提供了很多希望，可能在未来，人工智能可以用更人性化的方式更有效地学习，而更像生物学的方式可以形成更少标记的数据。

现在，我们几乎没有理解生物大脑的作用，因此要实现这一愿景，我们将在人工智能方面取得重大突破，而今天我们所知道的如何实现。

但是，我们中的许多人对无监督学习的未来抱有很大的希望。

话虽如此，无监督学习在今天很有价值。

例如，存在一些特定的应用和自然语言处理，其中无监督学习有助于网络搜索的质量。

但是，今天监督学习的价值远远低于通过监督学习创造的价值。

另一个重要的AI技术是转移学习。

让我们看一个例子。

假设你买了一辆自动驾驶汽车，你已经训练过你的AI系统来检测汽车。

但是你并没有将你的车辆部署到一个新的城市，不知怎的，这个新的城市有很多高尔夫球车，所以你需要建立一个高尔夫球车检测系统。

您的汽车检测系统可能包含大量图像，比如100,000张图像，但在这个新开始运营的新城市中，您可能拥有更少数量的高尔夫球车图像。

转移学习是让您从任务A（例如汽车检测）中获取技术并利用知识帮助您完成不同任务B（例如高尔夫球车检测）的技术。

如果从一个非常大的汽车检测数据集（任务A）中学习，转移学习真的很有吸引力，即使你有一个更小的高尔夫球车数据集，你也可以在高尔夫球车检测上做得很好。

因为从第一项任务中学到了一些知识，车辆的样子，车轮的样子，车辆的运动方式。

也许这对于高尔夫车检测也很有用。

转学习不是很多新闻，但它是当今人工智能中非常有价值的技术之一。

例如，许多计算机视觉系统都是使用传输学习构建的，这对他们的性能产生了很大的影响。

您可能还听说过一种称为强化学习的技术。

那么，什么是强化学习？

让我用另一个例子来说明。

这是斯坦福自治直升机的照片。

所以它配备了GPS，加速度计和指南针，所以它总是知道它在哪里。

而且，假设你想要编写一个程序让它自己飞行。

使用有监督的学习输入/输出，A到B映射很难，因为很难指定什么是最佳方式。

当飞机在某个特定位置时，飞行直升机的最佳方式是什么？

强化学习提供了不同的解决方案。

我认为强化学习类似于训练宠物狗的表现方式。

我的家人，在我长大的时候，有一只宠物狗。

所以，你怎么跟踪狗的行为？

好吧，我们让狗不管它想要做什么，然后只要它表现得好，我们就会赞美它。

你去，好狗，每当它做坏事你都会去，坏狗。

加班时，它学会了做更多的好狗，事情和害怕坏狗的事情。

强化学习采用相同的原理，并将其应用于直升机或其他两件事。

所以，我们会在模拟器中绕过直升机，这样它就可以在不伤害任何人的情况下坠毁。

但是我们会让人工智能飞机一次飞过直升机，每当它飞好直升飞机时，我们都会去，好直升机。

如果它崩溃了，我们会变坏直升机。

然后，人工智能的工作是学习如何驾驶直升机获得更多的直升机奖励，以及更少的直升机负面奖励。

更正式地说，强化学习算法使用奖励信号，告诉AI何时或者表现良好。

这意味着只要它表现良好，你给它一个大的正数，给它一个很大的积极奖励。

每当它做得非常糟糕时，你给它发一个负数，给它一个负面的奖励。

AI是自动学会表现以最大化奖励的工作。

因此，好狗回应给出正数，坏狗或坏直升机对应玩具给出负数。

并且人工智能将学习更多导致大量正数或大量积极奖励的行为。

在我们这样做之后，让我给你看一下斯坦福自主直升机的视频。

这是直升机飞行增援学习控制的视频。

那天我是摄影师，当你缩小相机时，你会看到树木指向天空。

所以，我们实际上给了它一个奖励信号，奖励直升机飞来飞去。

通过强化学习，我们建造了世界上最强大的自主直升机之一。

除了机器人控制之外，强化学习在玩游戏，奥赛罗或西洋跳棋或国际象棋或围棋等游戏中也有很大的吸引力。

您可能听说过AlphaGo，它在使用强化学习方面做得很好。

强化学习在玩视频游戏方面也非常有效。

增强学习算法的一个缺点是它们可能需要大量数据。

所以，如果你正在玩视频游戏，强化学习算法基本上可以玩无限数量的视频游戏。

因为它只是一个计算机游戏的计算机游戏，并获得大量的数据容忍如何表现更好。

或者用于玩跳棋或其他游戏等游戏。

它可以针对自己玩很多游戏，并且免费获取大量数据以提供强化学习算法。

在自主直升机的情况下，我们有直升机的模拟器，所以它可以长时间模拟飞行，以弄清楚什么有效，什么对飞行直升机不起作用。

有很多令人兴奋的研究工作可以使强化学习工作，即使对于你可能没有精确模拟器的环境也是如此。

而获取大量数据的难度更大。

尽管媒体对强化学习的关注程度很高，但至少在今天，它创造的经济价值显着低于有监督的学习。

但未来可能会有突破，可能会改变这一点。

人工智能正在迅速发展，我们所有人当然希望我们所谈论的所有这些领域都会有突破。

GAN或生成对抗网络是另一种令人兴奋的新AI技术。

他们是由我的学生Ian Goodfellow创建的。

GAN非常擅长从头开始合成新图像。

让我向您展示一个由NVIDIA团队制作的视频，该视频使用GAN来合成名人的图片。

这些都是以前从未存在的人的照片。

但通过从数据库名人图像中了解名人的外观，它能够合成所有这些全新的图片。

现在将GAN应用于娱乐业的不同事情令人兴奋。

从计算机图形到计算机游戏，到媒体，再到从头开始构建这样的新内容，应有尽有。

最后，知识图是另一种重要的AI技术，我认为它非常低估。

如果您在Google上搜索Leonardoda Vinci，您可能会在右侧有关达芬奇的信息中找到这组结果。

如果您在Ada Lovelace上搜索，您也可以在右侧找到一组附加信息。

此信息来自知识图，它基本上是指列出人员和关于这些人的关键信息的数据库。

比如他们的生日，他们过世时，他们的生物，以及这些人的其他属性。

今天，不同的公司已经建立了许多不同类型的事物的知识图，而不仅仅是人。

但他们也建立了这些电影，名人，酒店，机场，景区，以及等等的数据库。

例如，带有酒店信息的知识图表可能包含大型酒店数据库以及有关这些酒店的关键信息。

因此，如果您在地图上查看它们，您可以相对快速地找到正确的信息。

知识图这个术语最初是由谷歌推广的，但这个概念已经传播到许多其他公司。

有趣的是，尽管KnowledgeGraphs在这一点上为多家大公司创造了许多经济价值，但这是学术界相对较少研究的一个主题。

因此，相对于当今的实际经济影响，您在知识图上看到的研究论文数量似乎不成比例地小。

但是，根据您所从事的行业，可能还有一些构建知识图表的技术，对于构建与您公司相关的大量信息数据库也很有用。

在本视频中，您学习了无监督学习，转移学习，强化学习，GAN和知识图表。

好像很多，不是吗？

我希望其中一些想法对您的项目有用，并且知道这些算法是什么，将使您更容易与AI工程师进行富有成效的讨论。

在本周，我们已经谈论了人工智能如何影响公司。

也许你如何使用AI来影响你的公司。

人工智能也对社会产生巨大影响。

那么，我们怎样才能理解人工智能对社会的影响，以及确保我们做出道德的事情呢？

我们只使用人工智能来帮助人们并让人们变得更好？

下周我们将谈论AI和社会。

感谢与我一起到此为止，我期待在最后一周的视频中看到你为这门课程。

讲师：Andrew Ng
课程：https://www.coursera.org/learn/ai-for-everyone