神经网络开始放飞自我都是因为架构搜索新算.蹭飞
民生娱乐 2021-03-01 21:20 字号: 大 中 小
神经络开始放飞自我!都是因为架构搜索新算法
(公众号:):雷锋字幕组出品系列短视频《 2 分钟论文 》,带大家用碎片时间阅览前沿技术,了解 AI 领域的最新研究成果。
本期论文:结合分层表示的高级架构搜索
Hierarchical Representations For Efficient Architecture Search
? 观看论文解读
说到学习算法,为什么我们不让神经络学习其自身的架构呢?
终于有人提出了。这个新算法正是关于架构搜索的。
到目前为止,这并不是第一个可以解决这个问题的办法。但它无疑是艺术层面上的一个显著的进步。它代表了作为有机体的神经络结构,可以通过遗传算法编程使其进化。
两分钟论文节目之前有提到过,神经络技术发展十分迅速,在十年前就已经解决了那些人们认为完全不可能解决的问题。当我们想利用它来解决一些问题的时候,我们需要选择正确的神经络。问题是,我们要如何去建立正确的神经络架构呢?
针对典型的神经络结构,我们至少要知道在这个络中层的种类和数量,和每一层中使用的神经元的数量。更大一些的神经络可以通过学习解决方案来处理更加复杂一些的问题。这样一来,事情就变得很简单,只要给出尽可能大的神经络,我们就能解决问题,并且可以期望得到最好的结果。但是,如果你真的认为答案仅是如此,那太果断了。
建立更大的神经络是要付出代价的。它们要花更长的时间训练,更糟的是,如果我们有一个过于大的神经络,就会遇到过拟合的问题。过拟合现象是指学习算法从本质上来说是在记忆训练数据,而实际上并没有进行学习。其结果是,它的知识并不适用于它没见到过的数据。
想象一下,一名学生有着非凡的才能。他能够记下教科书里的所有内容,如果考试内容跟书本上一样,这名学生能够做的非常好,但是,即使考试内容有最细微的偏差,这名学生也将会做的非常糟糕。人们喜欢称之为死记硬背,但是这种方式跟任何一种学习方法都无法相比。一个较小的神经络就像一名知识量较少的学生。他们更倾向于选择一种方式来完成他们的家庭作业,这种方式会完成得更好。这就是过拟合现象。它是众多现代学习算法的弊端。
使用L1、L2正则化或者dropout方法在某种程度上可以防止过拟合现象。这些方法通常有所帮助,但是没有一种方法是非常高效的。因此,虽然算法本身是学习算法,但是出于某种原因,我们必须人为设计其络结构,正如我们讨论的一些结构,实际上他们明显优于其他的结构。我们要完成长期的反复测试以求解决结构中的错误
,从而人为地找到最好的结构。
在这个图表中,水平的X轴表示进化的步骤数目,垂直的Y轴表示随着时间的推移进化后架构的性能。最后,在花了一天半时间完成了几千个进化步骤之后,此算法找到的最好的络架构只是稍稍逊色于适合许多经典数据集的现有的最好的神经络。
两者共赢才是上策。”请仔细阅读本篇文章,并与最先进的神经络和其他的架构搜索方法进行比较。这篇文章里有很多容易读懂的结果。需要注意的是,这是初步工作,在过程中仍需要使用数百显卡。假如你知道神经络是如何应用于AlphaGo的,那么它的计算成本会在一年多的时间里减少10倍。
关注的学霸们请阅读论文获得更多细节:
来源 /TwoMinute Papers
翻译 /严谨文
校对/凡江
整理 /雷锋字幕组
原创文章,未经授权禁止转载。详情见转载须知。
合肥治白癜风医院哪好廊坊哪家医院治牛皮癣好
南宁治疗妇科费用
-
-
恩惠深度吞下万帮火箭拿下甜瓜老鹰图的啥
深度|吞下万帮火箭拿下甜瓜 老鹰图的啥?安东尼随着老鹰买...
2020-09-14 | 民生娱乐
-
-
英媒克洛普将不会被禁赛口头警告罚款榜搭配
英媒:克洛普将不会被禁赛 口头警告+罚款榜克洛普直播吧12月...
2020-06-07 | 民生娱乐
-
-
中国房地产市场泡沫的存在是不争的事实搭配
中国房地产市场泡沫的存在是不争的事实自4月14日国务院调控...
2020-06-06 | 民生娱乐
-
-
NBA大富豪老板最壕是他灰熊老板帅出天际搭配
NBA大富豪老板:最壕是他!灰熊老板帅出天际NBA老板们北京时间...
2020-05-31 | 民生娱乐
-
-
阿根廷主帅意甲两神锋还有戏之前也招过他们搭配
阿根廷主帅:意甲两神锋还有戏 之前也招过他们桑保利表示迪...
2020-05-29 | 民生娱乐
-
-
7月海南新房均价环比下跌后市房价仍将小幅搭配
7月海南新房均价环比下跌 后市房价仍将小幅下调数据显示,...
2020-05-28 | 民生娱乐