week2-2 Workflow of a machine learning project 机器学习项目的工作流程

2-2-0.png

机器学习算法可以学习输出到输出或A到B映射。

那么,你如何建立机器学习项目?在这个视频中,你将了解机器学习项目的工作流程。

让我们来看看。

2-2-1.png

2-2-2.png

2-2-3.png

作为一个运行的例子,我将使用语音识别。

因此,你们中的一些人可能在家中安装了Amazon Echo或Google Home或Apple Siri设备或BaiduDuerOS设备。

几年前,我在Google的语音识别系统上做了一些工作,这也引领了百度的DuerOS项目。

今天,我的厨房里竟然有一个亚马逊回声。

因此,每次我煮鸡蛋时,我会说,“Alexa,设定计时器三分钟”,然后它让我知道三分钟什么时候,我的鸡蛋准备好了。

那么,你如何建立一个语音识别系统,可以识别你说“Alexa”,“嘿,谷歌”,“嘿,Siri”或“你好,百度”?让我们来看看关键步骤机器学习项目。

为简单起见,我将使用Amazon Echo或检测Alexa关键字作为此运行示例。

如果您想构建AI系统或构建机器学习系统以确定用户何时说出Alexa这个词,那么第一步就是收集数据。

所以,这意味着,你可以四处走动,让一些人为你说“Alexa”这个词,然后你录制它的音频。

你也会得到一群人说“你好”之类的其他词,或说出很多其他的话,并记录下来的音频。

收集了大量的音频数据之后,很多人都说“Alexa”或其他事情,第二步就是对这个模型进行解读。

这意味着您将使用机器学习算法来学习输出到A到B映射的输入,其中输入A将是音频剪辑。

在上面的第一个音频剪辑的情况下,希望它会告诉你用户说“Alexa”,并且在右边显示的音频剪辑2的情况下,希望系统将学习识别用户说“你好。“

每当AI团队开始训练模型时,意味着要学习A toB或输入输出映射,每次都会发生什么事情,这是第一次尝试不能正常工作。

总是如此,团队需要多次尝试或在AI中,我们多次调用此迭代。

你必须迭代多次,希望模型看起来很好。

第三步是实际部署模型。

这意味着您将此AI软件输入到实际的智能语言中,并将其发送给一小组测试用户或大量用户。

许多AI产品中发生的事情是,当您发货时,您会看到它开始获取新数据,并且它可能无法像您最初希望的那样工作。

所以,例如,我来自英国。

所以,我要去英国人。

但是,假设你已经在美国口音的扬声器上训练了你的语音识别系统,然后你将这个聪明的英语发送到英国,你开始让英国口音的人说“Alexa。“

他们可能会发现它并不像你所希望的那样认出演讲。

当这种情况发生时,希望你可以获得数据,例如英国口音的扬声器可能不像你希望的那样工作,然后使用这些数据来维护和更新模型。

因此,总而言之,机器学习项目的关键步骤是收集数据,训练模型,A到B映射,然后部署模型。

在这些步骤中,通常需要进行大量的迭代,这意味着微调可以使模型更好地工作或者甚至在将数据发送到数据库后获取数据,希望产品更好,这可能会也可能不会取决于您是否可行能够获得数据。

让我们看看这三个步骤,看看它们如何应用于构建自动驾驶汽车关键部件的不同项目。

因此,请记住关键步骤,收集数据,训练模型,部署模型,因为我们将在下一张幻灯片中重新审视这些步骤。

假设你正在建造一辆自动驾驶汽车。

自动驾驶汽车的关键部件之一是机器学习算法,它可以作为输入,比如图片,显示汽车前面的东西,并告诉您其他车辆的位置。

那么,构建这个机器学习系统的第一步是什么呢?希望你能从最后一张幻灯片中记得第一步是收集数据。

因此,如果您的目标是使用机器学习算法,可以将图像作为输入并输出其他车辆的位置,那么您需要收集的数据既可以是图像,也可以是您希望AI系统输出的其他车辆的位置。

所以,让我们假设您从这样的一些图片开始。

这些是机器学习算法的输入。

你还需要告诉它你想要的输出B.

因此,对于每张图片,您都会在想要检测的图片中围绕汽车绘制一个矩形。

在这张幻灯片上,我手绘这些矩形,但在实践中,你会使用一些软件,让你绘制完美的矩形而不是这些手绘的矩形。

然后,创建了这个数据集,第二步是什么?希望你记住,第二步是训练模型。

现在,当你的AI工程师开始训练一个模型时,他们最初会发现它并不能很好地发挥作用。

例如,鉴于这张照片,也许软件,前几次尝试,认为这是一辆汽车。

只有通过多次迭代,你才能获得更好的结果,然后才能确定汽车实际上是哪里。

最后,第三步是什么?它是部署模型。

当然,在自动驾驶世界中,重要的是将安全视为第一,并部署模型或仅以可以保护安全的方式测试模型。

但是当你将汽车中的软件放在路上时,你可能会发现有新型车辆,比如高尔夫球车,软件检测得不是很好。

因此,您可以获取数据,比如这些高尔夫球车的图片,使用新数据来维护和更新模型,希望您可以让您的AI软件不断变得更好,直到您最终可以做到的软件检测其他类似汽车的相当不错的工作。

在本视频中,您了解了机器学习项目的关键步骤,即收集数据,训练模型,然后部署模型。

接下来,让我们来看看数据科学项目的关键步骤或工作流程是什么。

让我们继续下一个视频。

讲师:Andrew Ng
课程:https://www.coursera.org/learn/ai-for-everyone

iOSDevLog wechat
欢迎您扫一扫上面的微信公众号,订阅我的博客!