Jan 14, 2020

三分钟了解深度学习

深度学习(Deep Learning)、人工智能(Artificial Intelligence)、机器学习(Machine Learning)是当下最热话题。每天关于“AI”这个词都在耳边横飞,胸怀抱负的开发人员声称想要研究人工智能;经理们说想在服务中应用深度学习。但是,通常我们很多人还是不知道人工智能是什么,深度学习又是什么。

本期我们一起来简单了解一下深度学习、人工智能和机器学习的几个基本知识,了解机器学习中最火的方法——深度学习的工作原理以及常见应用。

背景


了解深度学习的第一步,先介绍几个重要的概念。

人工智能(AI)是在计算机中复制人类智能。

AI研究刚开始时,研究人员尝试复制人类只能来完成特定任务,比如玩游戏。

他们给计算机制订了大量的规则。计算机有一张可能行为的具体清单,并根据制定的规则作出决定。

机器学习(ML)指机器通过大数据集(而不是定死的规则)来学习的能力。

机器学习允许计算机自主学习,这种类型的学习利用现代计算机的处理能力,可以轻松处理大型数据集。

监督学习使用标记过的数据集,有输入和预期的输出。

如果使用监督学习来训练AI,你要给它一个输入并告诉它预期的输出。

如果AI产生的输出错了,它会重新调整它的计算。这个过程是通过遍历数据集完成的,直到AI不再犯错。

监督学习的一个例子是天气预报AI。 它通过历史数据来学习预测天气。训练数据有输入(气压,湿度,风速)和相应的输出(温度)。

无监督学习是使用没有特定结构的数据集进行机器学习。

如果使用无监督学习训练AI,就是让AI对数据进行逻辑分类。

无监督学习的一个例子是电子商务网站的行为预测AI。它不用通过标记数据集来学习。

相反,它会自己对输入数据创建分类。它会告诉你哪种用户最有可能购买这款产品。

深度学习是如何工作的


现在,我们已经具备了理解深度学习工作原理的基本知识。

深度学习是一种机器学习方法,可以通过一组输入,训练AI来预测输出。监督学习和无监督学习都能用来训练AI。

我们将通过建立一个假想的机票估价服务来了解深度学习是如何工作的。我们将使用监督学习方法进行训练。

我们希望机票估价工具能够使用以下输入来预测价格(方便起见,不包括返程票):

• 始发机场

• 到达机场

• 起飞日期

• 航线

接下来,来看看人工智能大脑的内部构造。

和动物一样,估价AI的大脑也有神经元,用圆圈来表示。这些神经元是互相连接的。

人工智能大脑的内部构造图

这些神经元被分成三层:

1、输入层

2、隐藏层

3、输出层

输入层用来接收输入的数据。在我们举出的案例中,输入层有四个神经元:始发机场、到达机场、起飞日期和航线。输入层把输入传递到隐藏层的第一层。

隐藏层对输入数据进行数学计算。建立神经网络的一个难题就是如何决定隐藏层的数量以及每一层的神经元个数。

深度学习中的“深”指的是神经网络有超过一层的隐藏层。

输出层返回输出数据。在本案例中,输出就是价格预测。

那么它如何计算价格预测呢?

这就是深度学习的魔力开始的地方。

神经元之间的每个连接都有相应的权重。这个权重决定了输入值的重要性。初始权重是随机设置的。

在预测机票价格时,出发日期是较重要的因素之一。因此,出发日期的神经元连接将有很大的权重。

每个神经元都有一个激励函数。没有数学推理,这些功能是难以理解的。

简而言之,其目的之一是“标准化”神经元的输出。

一旦一组输入数据通过了神经网络的每一层,它就通过输出层返回输出数据。

训练神经网

训练AI是深度学习中最难的部分。为什么呢?

1.需要大数据集。

2.需要很强的计算能力。

对于机票价格估算,我们需要找到票价的历史数据。由于可能的机场和出发日期组合数量很大,我们需要一个非常大的票价清单。

为了训练AI,我们需要从数据集中给出输入,并将AI的输出与数据集的输出进行比较。由于AI尚未经过训练,其输出将是错的。

一旦遍历了整个数据集,就可以创建一个函数(代价函数,理想情况下,我们希望代价函数为零。此时,AI的输出和数据集的输出一样)来显示AI的输出与实际输出的偏差。

深度学习的应用

在了解完以上几个基础概念以后,我们再来看下平时所说的,深度学习被应用在了哪些领域。

知名创投研究机构CB Insights调研了25种最大的AI趋势,预测2019年该技术的下一步趋势,他们根据行业采用率和市场优势评估了每种趋势,并将其归类为必要性、实验性、威胁性、暂时性四类。

2019人工智能市场优势趋势图

深度学习其实在图像、语音、自然语言处理这三个领域都已经有了很好的应用落地,比如我们生活中常见的,拍照购、相似推荐、人脸识别、在线试衣等等 。在图像、语音、自然语言处理领域中深度学习的性能往往比传统方法好得多。

深度学习的应用——拍立淘

根据我们从上一小节了解到的知识,深度学习在这些领域内大放异彩的主要原因,就在于图像、语音、文本数据中都是有 pattern 的,这种 pattern 人脑比较容易识别,但难以明确说出识别的规则,这正是深度学习适合的问题。另外还有一个重要原因就是这些领域有足够多的数据来训练神经网络。

而一般的预测问题,可能本身不够复杂,也可能数据不够多。面对这些问题,一般是先试验简单的、传统的机器学习模型,当它们明显表现出瓶颈的时候,再去试深度学习模型。

深度学习在日常生活中已经耳熟能详,前几天,央视新闻发布了一条新闻:

北京30余家重点医院将共享 2017 年以来被公安机关处罚的 2100 余名号贩子的头像信息,身份证信息等等。未来这些人一旦进入医院,系统就能立刻监控到这些号贩子。

人脸识别技术已屡见不鲜,毕竟在公共安防领域的应用已经非常成熟,比如“张学友演唱会三抓逃犯事件”,应该没人不知道了吧?不过这次的应用,却而更加贴近了平常人的生活。

人脸识别也仅仅是深度学习的冰山一角,相信在很多其他领域,深度学习的应用也将会未来得到落实。


央视新闻微博热评

产品推荐


宽泛科技专注为人工智能、影视后期、动漫设计、商务应用等领域提供深度学习、VR/AR/MR、视觉计算、虚拟化云计算等硬件解决方案,提供IT基础构架建设、IT咨询等服务。

下面为进行深度学习项目研究开发的工程师朋友们推荐一款主机:

云轩八核i9/GTX1080Ti/RTX2080TI 深度学习GPU服务器/AI算法工程师电脑主机 



GPU服务器适用于GPU渲染、深度学习训练、并行计算等。

机器学习算法可从能够带来洞察力的数据中发现自然模式,帮助您更好地制定决策,做出预测。

医疗诊断、股票交易、能量负荷预测及更多行业每天都在使用这些算法制定关键决策。

更适用于概念验证测试、高等院校课题研究、互联网企业、医疗成像、油气勘探、量子化学、财务模拟、基因组学等领域中众多图形和计算密集型应用。

加入深度学习时代,从专业配置开始。