浅谈torch中的softmax与CrossEntropy
2023-08-14 02:54:33 来源:哔哩哔哩
首先是softmax函数,我认为我在之前的文章
分类模型中为何更适合使用softmax函数?
(资料图片)
已经较为清楚的阐述,故这里不再重复赘述。
在上文中,我较为清晰的说明了,softmax函数只是为了将我们的预测结果,表达成一种合适的结果,去拟合one-hot编码。
但是对于这种向量标签,我们并不能很好的去定义其损失函数(误差函数)。
我们理所当然应该想到均方误差函数,但实际上,均方误差函数(MSE),对于标量标签确实能起到一个非常好的效果。
而对于一个向量标签,我们选择了一个能实现与之同等效果的CrossEntropy函数,也即交叉熵损失函数。
如上图所示,其中 为正确的标签,而 为预测标签(经过softmax处理后)。
该损失函数在计算上具有非常明显的便利性,即仅考虑正确标签下对应的损失。例如,我们不妨令 = [0, 1, 0], = [, , ], 那么此时的 ,
即仅考虑到了正确标签下的损失。
而其优越性不仅表现在此处,其导函数更是有非常优异的性质,即:
其中 为未经softmax处理前得到的预测标签。
换言之,
如下图所示:
毫无疑问,y_ == softmax(y_pred) - one_hot(y),这是成立的。(不成立可能是精度误差导致的,看图中明显成立)。
而观察y_,对于y[1]这个样本,我们明显可以看出,其梯度是正在减少前两项的权值,而增大最后一项的权值,以努力实现正确归类至第三类,这是符合我们预期的。
故,CrossEntropy函数确实是在朝着我们的目标去实现。
关键词:
[责任编辑:]
相关阅读
- (2023-08-14)浅谈torch中的softmax与CrossEntropy
- (2023-08-14)7900元!七彩虹将星X15 AT游戏本上市
- (2023-08-14)还原日本战国时代,《战国王朝》开启抢先体验
- (2023-08-14)海南媒体行|海南商业航天发射场力争明年首次发射
- (2023-08-14)重庆涪陵啤酒节点亮乡村夏日夜经济
- (2023-08-14)中国驻曼彻斯特总领事唐锐会见曼彻斯特市长雅思敏·达尔
- (2023-08-14)金观平:引导金融资源更多流向民营经济
- (2023-08-14)长途带100个鸡蛋不碎法(长途带鸡蛋不破方法)
- (2023-08-14)广州上半年GDP数据出炉,番禺超1000亿元!
- (2023-08-14)重拳出击!国家安全机关破获美国中央情报局间谍案
- (2023-08-14)被拖了!浦江个别车主一车占两个停车位…
- (2023-08-14)野外红外相机拍摄到“四不像” 中华鬣羚现身壮乡苗岭
- (2023-08-14)多部门会商部署重点地区防汛防台风工作
- (2023-08-14)相约大运 成就梦想丨请记住彼此给予的友善和鼓励,我们“不说再见”!
- (2023-08-14)《潜行者2》全新截图公布 画面效果非常出色
- (2023-08-14)饥荒联机版地精玩偶有什么用_饥荒地精玩偶有什么用
- (2023-08-14)红薯的做法花样大全 红薯的做法
- (2023-08-14)60岁到70岁还没老?这4大身体健康的危机,希望你能安全度过
- (2023-08-14)1至7月我国汽车产销量同比分别增长7.4%和7.9%
- (2023-08-14)雀圣2(雀圣3)
- (2023-08-14)《GINKA》新游Steam上架 支持简体中文
- (2023-08-14)招标公告!涉及环城水系提升改造
- (2023-08-14)体积怎么算吨 体积怎么算立方米
- (2023-08-14)合肥市疾控中心提醒:要注意预防"空调病"
- (2023-08-14)虎门国际布料交易中心(关于虎门国际布料交易中心简述)
- (2023-08-14)虎踞龙蟠(关于虎踞龙蟠简述)
- (2023-08-14)虎门镇志(关于虎门镇志简述)
- (2023-08-14)苹果手机ios11怎么分屏 ios11分屏
- (2023-08-14)彩绘墙面墙体绘画 彩绘墙
- (2023-08-14)借呗延期还款券下个月还两期吗-借呗延期还款券下个月还两期吗怎么还