5.Discussion
1、论文提出的 DPC 架构基于 Cell 构建的搜索空间,每个 Cell 有语义分割采用经典的空洞卷积,空间金字塔池化,1x1 卷积,在 mIOU 实现 state-of-art 水准。
2、论文的搜索策略采用随机搜索,评价指标也只有 mIOU,相比 Google 另一篇论文 MnasNet,在准确率和推断时间上均有显著提高。
3、论文摘要选择只需要一半的参数和一半的计算效率,但是只在论文的表 1 即 Cityscapes 数据集对比了 MobileNet-v2 和 modified Xception 的实现方式,其他数据集没有体现计算效率的优越性。论文架构搜索和训练时的目标函数没有计算效率的体现。
Additionally,the resulting architecture is more computationally efficient,requiring half the parameters and half the computational cost as previous state of the art systems
4、作为 Google 在语义分割领域的开山之作,目测会有一大批基于 NAS 实现的目标检测、实例分割的优秀论文,NAS 应用到工业界产品指日可待。
5、语义分割是一种广义上的图像分类(对图像的每个像素进行分类),和图像分类在搜索空间有很多相似之处,但是目标检测需要 Region Proposal,Bounding-Box Regression 等,增加搜索空间的难度,NAS 在目标检测领域可能还需要很长一段路要走。
以上仅为个人阅读 MnasNet 论文后的理解,总结和一些思考,观点难免偏差,望读者以怀疑的态度阅读,欢迎交流指正。
6.参考文献
1.Searching for Efficient Multi-Scale Architectures for Dense Image Prediction
arXiv:1809.04184(2018)
2.Neural Architecture Search:A Survey
arXiv:1808.05377(2018)
3.A service for black-box optimization
4. https://github.com/tobegit3hub/advisor
5.MnasNet:终端轻量化模型新思路
https://zhuanlan.zhihu.com/p/42474017
6.让算法解放算法工程师──NAS综述
https://zhuanlan.zhihu.com/p/44576620