week1-9 Non-technical explanation of deep learning (Part 2, optional) 深度学习的非技术性解释(第2部分,可选)

1-9-0.png

在上一个视频中,您看到了神经网络如何应用于需求预测,但是新网络如何看待图片并弄清楚图片中的内容?或者听一个音频片段并了解音频片段中的内容?让我们来看看看一下将神经网络应用于人脸识别的更复杂的例子。

假设您想构建一个系统来识别图片中的人物,一个软件如何看待这张图片并找出其中人物的身份?让我们放大到这样的小方块,以便更好地了解计算机如何看待图片。

1-9-1.png

1-9-2.png

在你和我看到人眼的地方,计算机会看到它,并且看到这个像素亮度值的网格告诉它,对于图像中的每个像素,该像素有多亮。

如果它是黑色和白色或灰度图像,那么每个像素将对应于一个数字,告诉你这个像素是否明亮。

如果它是彩色图像,那么每个像素都会有三个数字,对应于该像素的红色,绿色和蓝色元素。

所以,神经网络工作就是把很多数字作为输入,然后告诉你图片中人物的名字。

在上一个视频中,您看到了神经网络如何将四个数字作为输入对应于价格,运输成本,营销金额以及T恤和布料需求的布料。

在这个例子中,神经网络只需输入更多的数字,对应于该图像的所有像素亮度值。

如果这张图片的分辨率是1000像素乘1000像素,那么这是一百万像素。

因此,如果它是一个黑色和白色或灰度图像,这个神经网络作为输入一百万个数字对应于该图像中所有一百万个像素的亮度,或者如果是一个彩色图像,它将作为输入三百万个数字对应于红色,绿色,以及此图像中这一百万像素中的每一个的蓝色值。

与以前类似,你会有许多这些人工神经元计算各种值,并且你不应该弄清楚这些神经元应该计算什么。

神经网络将自行配置。

通常情况下,当你给它一个图像时,神经网络早期部分的神经元将学习检测图像中的边缘,然后检测叶片,然后学会检测对象的部分。

因此,他们学会检测眼睛和鼻子以及脸颊的形状和嘴巴的形状,然后后面的神经元,进一步向右,将学会检测不同形状的面部,最后,将所有这些放在一起输出身份图像中的人。

再一次,神经网络的神奇之处在于你并不需要担心它在中间的情况。

所有你需要做的就是给它提供很多这样的图片数据,A,以及正确的身份B和学习算法将自己弄清楚中间的每个神经元应该在计算什么。

恭喜您完成了本周的所有视频。

您现在知道机器学习和数据科学是如何工作的。

我期待着在下周的视频中看到你,以及你将如何建立自己的机器学习者数据科学项目。

下周见。

讲师:Andrew Ng
课程:https://www.coursera.org/learn/ai-for-everyone

iOSDevLog wechat
欢迎您扫一扫上面的微信公众号,订阅我的博客!