手机浏览器扫描二维码访问
在神经网络里,梯度消失的问题就是这种感觉,网络不知道该如何继续改进。
而梯度爆炸又是另外的一个极端。
假设这次你站在一座非常陡的悬崖边,一不小心就滚下去了!
因为坡度太陡了,你的速度变得非常快,失控了。
在神经网络中,这种情况也被称为“梯度爆炸”
当梯度太大时,参数的调整会变得过于剧烈,网络的学习变得不稳定,甚至会导致训练失败。
这就像你在陡峭的悬崖边滑落,一下子失去了控制。
网络的参数变化过大,导致结果变得很不稳定,甚至完全错误。
概括地说:
梯度消失就像在一座越来越平的山坡上,梯度变得很小,神经网络不知道该怎么调整,进而学习变得很慢,甚至无法进步。
梯度爆炸就像从悬崖边滚下去,梯度变得很大,网络的学习变得过于剧烈,结果会非常不稳定,训练过程变得不可控。
这两个问题经常会出现在深层神经网络中。
而这也是马库斯所要倾诉的困扰。
“说起来,最近的研究还卡在了‘梯度消失’的问题上。”
马库斯苦笑着说道,靠在沙发上,“我们在训练一些更深层次的神经网络时,发现模型一旦超过一定的深度,反向传播算法中的梯度会逐渐趋近于零,根本无法有效更新权重。
深度越大,梯度就越容易消失,整个网络的学习效率大幅下降。”
马库斯知道林枫硕士是麻省理工学院的计算机硕士,因此也就全都用专业术语表述了。
对于这些林枫当然能听明白,非但能听明白,而且作为一个资深的人工智能从业人员。
林枫也清楚知道马库斯面临的难题。
林枫对AI的发展也有所了解,涉及到梯度问题在2014年是深度学习研究中的一个巨大挑战。
甚至可以说解决不了梯度问题就很难有真正的深度学习,也就不会有后来的人工智能成果的一系列井喷。
林枫心说,自己这是一不小心站在了技术发展的最前沿了吗?
不得不说,这种举手投足之间就能影响时代命运的感觉是真的无比美妙。
“梯度消失的问题一直存在,尤其是深层网络。
梯度爆炸倒是相对好解决,但梯度消失会直接导致学习过程停滞不前。”
林枫沉思片刻,补充道,“这不仅是你们实验室的问题,也是整个领域的瓶颈。
反向传播的基本原理决定了,当信号在网络中层层传递时,梯度的变化会以指数级缩小。”
马库斯脑海中泛起了大大的问号,梯度爆炸问题好解决吗?
他怎么觉得梯度爆炸问题也挺麻烦的?
不过聊天本来就是求同存异,既然林同样认为梯度消失难以解决就够了。
马库斯也没纠结为什么林说梯度爆炸容易解决,而是继续就梯度消失发表观点说道:“是啊,哪怕有了ReLU(修正线性单元)激活函数的引入,虽然能在一定程度上减轻梯度消失,但对深层网络还是不够。”
林枫想了想,说道:“你们有考虑过改进网络结构吗?”
喜欢不朽从二零一四开始请大家收藏:()不朽从二零一四开始
作者风已远走的经典小说天眼神农最新章节全文阅读服务本站更新及时无弹窗广告小说天眼神农勤劳踏实却颗粒无收,善良本分却造人陷害,刘大伟不信天命,拿起锄头怒怼贼老天,却意外被天雷劈中,机缘巧合之下获得万灵之眼。且看刘大伟如何逆天改命,走上人生巅峰...
一个被坏人陷害的高三学生崔杰,被枪毙后灵魂居然俯身在一个皇帝身上,而这个皇帝是一个只有不到一年皇帝命的无道昏君弘光帝朱由崧,也就是历史上的南明小朝廷。崔杰会怎么做呢?想知道就看下去吧!本书不但是跟风(疯),而且还涉嫌抄袭,看惯了历史人物着忙赶场的你肯定深有体会,不说了,看吧!战国时代和三国时代,天下大乱,战火纷飞,派系林立,民不聊生,但是这两个时代天下虽乱,但贤良辈出,由乱而治,独独清末民国时代,可谓一个大乱场,非奸雄不能得势,好人的下场都很悲惨。新书后光绪时代之我的奋斗...
全球连续四天出现超自然现象,直到了第五天,拉开了末世纪元。当旧秩序被破坏,人性释放,我,将建立新的秩序,属于我的国度!...
家族嫡长子苏洛,一代天骄,消失两年,再度归来已是至尊,面对毫无人情味的家族,他发誓必将重临巅峰,不负红颜,傲立寰宇,令这天地颤抖,重现仙主风姿,令所有敌人颤栗。...
主角叫房遗爱高阳公主的小说叫重生之大唐最强驸马,它的作者是大名府白衣倾心创作的一本穿越重生类型的小说,文中的爱情故事凄美而纯洁,文笔极佳,实力推荐。小说精彩段落试读一觉醒来,竟然变成了大唐原谅帽之王房遗爱身上。...
神级农牧场由于身处烟火气浓郁的凡间,他地里种出来的瓜果口感超佳,成了仙界的抢手货。我家玉儿的胡萝卜吃完了,你多种点,钱不是问题!嫦娥发来信息道。嘿,你那枣啊樱桃啊梨子桃啥的各给俺老孙来一筐!孙悟空刷屏骚扰。俺老猪要吃人参果,兄弟多种点啊!猪八戒哼哼唧唧的很是不满,因为抢不上货。...