![深度学习视频理解](https://wfqqreader-1252317822.image.myqcloud.com/cover/920/43737920/b_43737920.jpg)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
2.1.5 Inception V2/V3
Inception V2(Szegedy et al.,2016)在BN-Inception的基础上进一步改进网络结构。Inception V2和BN-Inception 都用了10个Inception模块,两者区别在于Inception V2 同时使用了图2-8中的3种模块。
![img](https://epubservercos.yuewen.com/E5C1AE/23020634309724506/epubprivate/OEBPS/Images/txt002_65.jpg?sign=1739665894-sW04mLNuZ2194icBdudTJgoXEPerP4Hs-0-bb84726eb880b1d4fc885ae32e2641ac)
图2-8 Inception V2和Inception V3中的Inception模块
● 在网络的前几层,使用3个图2-8(a)中的模块,该模块和BN-Inception中使用的模块相同,都是将 GoogLeNet中Inception模块中的卷积用两个
卷积取代。相比于使用一个
卷积,使用两个
卷积有更少的参数量和计算量。
● 在网络的中间几层(对应特征空间维度为),使用5个图2-8(b)中的模块,该模块进一步将
卷积分解成
卷积,相比于使用一个
卷积,使用
卷积有更少的参数量和计算量。这种非对称的卷积分解形式在网络前几层中作用不大,但是在网络中间几层(特征空间维度在
到
之间)中效果很好。
● 在网络的后几层(对应特征空间维度为),使用图2-8(c)中的两个模块,相比于原始Inception模块,该模块可以得到更多通道数的输出特征,以避免特征空间维度比较小时带来的信息损失。
Inception V3(Szegedy et al.,2016)在Inception V2的基础上,将网络最初的卷积也分解为
卷积。此外,在全连接层后也使用了BN层,并且使用了标记平滑(Label Smoothing)训练技巧等。Inception V3计算量是GoogLeNet计算量的2.5 倍,而错误率较后者下降了3%。