week2-7 Working with an AI team 与人工智能团队合作

假设您找到了一个令人兴奋的项目，您想要执行该项目，您如何与该项目的aAI团队合作？

在本视频中，您将了解AI团队如何思考数据，以及如何与AI团队进行交互以帮助他们在项目上取得成功。

现在，有一点需要注意的是，无论你有一个很酷的想法，但你没有访问AI团队，你没有任何AI工程师的访问权限。

幸运的是，在今天的世界里，如果你有任何一个你可以鼓励你的一些工程学朋友参加机器学习或深度学习的在线课程，通常会给他们足够的知识来开始尝试，做一个合理的尝试这些项目类型。

那么，让我们谈谈你如何与AI团队合作。

首先，如果您可以为项目指定验收标准，它确实有助于您的AI团队。

我在自动视力检测方面做了很多工作。

因此，我将在少数幻灯片中将其用作运行示例。

假设您的目标是检测咖啡杯中的缺陷，其准确度至少达到95％。

因此，这可能是您接受此项目的标准。

但95％的准确度，你如何测量准确度？

AI团队需要的一个东西是用于测量准确性的数据集。

因此，数据集只是一组像这样的图片与标签一起，设计输出B表示前两个咖啡杯是好的，第三个是有缺陷的。

因此，作为您接受标准的规范的一部分，您应该确保AI团队有一个数据库，用于衡量性能，如果他们达到95％的准确率，他们就可以知道。

此数据集的正式术语称为测试集。

测试集可能不会太大，也许1000张图片对于这个例子来说就好了。

但是，如果您咨询AI专家，他们可以让您更好地了解测试集需要多大才能评估他们是否达到95％的准确率。

EA系统的一个新颖部分是它们的性能通常以统计方式指定。

因此，不是要求人工智能系统完美地完成某些事情，而是经常看到我们想要的AI系统能够像这个例子那样以一定的百分比精度执行。

因此，在指定您的验收标准时，请考虑您是否需要以统计方式指定您的验收标准，而您在平均时间指定的时间或其得到正确答案的时间百分比。

让我们更深入地探讨测试集的概念。

这就是AI团队关于数据的方式。

AI团队将数据分组到两个主要数据集。

第一个称为训练集，第二个称为测试集，我们已经讨论了一下。

训练集只是一组图片以及标签，显示这些图片中的每一张是咖啡杯还是有缺陷的咖啡杯。

因此，训练集给出了输入的示例，即咖啡杯的图片以及所需的输出B，无论是可能的还是有缺陷的。

所以，考虑到这个训练集，机器学习算法将要做的是学习，换句话说，计算或计算从A到B的一些映射，你现在有一个软件可以输入输入A并试图弄清楚是什么适当的输出B.

因此，训练集是机器学习软件的输入，可以让它弄清楚这个A到B的映射是什么。

AI团队将使用的第二个数据集是测试集。

正如您所见，这只是另一组图像，与训练集不同，也提供了标签。

AI团队评估其学习算法性能的方式是将图像放入AI软件的测试集中，并查看AI软件输出的内容。

例如，如果在这三个测试集图像上，AI软件输出就可以了，对此可以，也可以，然后我们会说他们有三个例子中的两个正确，所以这是一个66。

精度7％。

在这个图中，上面的训练集和测试集只有三张图片，实际上这两个数据集当然都会更大。

你发现训练集的表格问题比测试集大得多。

但您可以与AI工程师交谈，了解他们在给定问题中需要多少数据。

最后，由于技术原因，一些AI团队不仅需要一个，而且还需要两个不同的测试集。

如果你听到人工智能团队谈论开发或者验证测试，那就是他们正在使用的第二个测试集。

他们需要两个测试集的原因是技术性很强，超出了本课程的范围，但如果AI团队要求您提供两种不同的测试集，那么尝试将它们提供给他们是相当合理的。

在结束这段视频之前，我想敦促你避免期待从你的AI软件中获得100％的准确性。

这就是我的意思，让我们说这是你在上一张幻灯片中看到过的测试集。

但是，让我在这个测试集中添加一些示例。

以下是一些人工智能软件可能无法100％准确的原因。

首先，今天的机器学习技术尽管功能非常强大，但仍然存在局限性，它们只能做到一切。

所以，你可能正在研究一个问题，即使对于今天的机器学习技术来说这也是非常困难的。

第二，数据不足。

如果您没有足够的数据，如果您没有足够的AI软件培训数据来学习，那么可能很难达到非常高的准确度。

第三，数据混乱，有时数据可能被错误标记。

例如，这里的绿色咖啡杯看起来对我来说完全没问题，因此，它的标签看起来像是一个不正确的标签，这会损害你的AI软件的性能。

数据也可能不明确。

例如，看起来这个咖啡杯在那边有一个小划痕，这是一个非常小的划痕，所以，也许我们会想到这一点虽然没问题。

但也许这实际上应该是一个缺陷，或者甚至不同的专家都不同意，如果这个特定的咖啡杯是好的，应该通过检查步骤。

其中一些问题可以得到改善。

例如，如果您没有足够的数据，则可以尝试收集更多数据，而更多数据通常会有所帮助。

或者您也可以尝试清理错误标记的数据，或尝试让您的factoriesexperts更好地同意这些模糊的标签。

因此，有很多方法可以让这些东西变得更好，但是，即使没有达到100％的准确度，许多AI系统仍然具有极高的价值。

因此，我将敦促您与您的AI工程师讨论试图达到的合理准确度水平？

然后尝试找到既通过技术尽职调查又需要商业勤奋的东西，而不一定需要100％的准确性。

恭喜您完成了本周的视频。

您现在知道它是什么样的以及构建AI项目需要什么。

我希望你开始头脑风暴并探索一些想法。

还有一个可选的视频编程可以帮助AI团队使用的一些技术工具。

但无论哪种方式，我都期待着在下周见到你，在那里你将了解AI项目是否适合大公司的背景。

期待下周为你服务。

讲师：Andrew Ng
课程：https://www.coursera.org/learn/ai-for-everyone