栏目文章

机器学习方法与系统栏目所有文章列表

(按年度、期号倒序)

一年内发表的文章 |

两年内 |

三年内 |

全部

Please wait a minute...

选择:

导出引用
EndNote Ris BibTeX

显示/隐藏图片

Select

1. 通过细粒度的语义特征与Transformer丰富图像描述

王俊豪, 罗轶凤

华东师范大学学报（自然科学版） 2020, 2020 (5): 56-67. DOI: 10.3969/j.issn.1000-5641.202091004

摘要（713）

HTML （40）

PDF（pc）（754KB）（257）

传统的图像描述模型通常基于使用卷积神经网络(Convolutional Neural Network, CNN)和循环神经网络(Recurrent Neural Network, RNN)的编码器-解码器结构, 面临着遗失大量图像细节信息以及训练时间成本过高的问题. 提出了一个新颖的模型, 该模型包含紧凑的双线性编码器(Compact Bilinear Encoder)和紧凑的多模态解码器(Compact Multi-modal Decoder), 可通过细粒度的区域目标实体特征来改善图像描述. 在编码器中, 紧凑的双线性池化(Compact Bilinear Pooling, CBP)用于编码细粒度的语义图像区域特征, 该模块使用多层Transformer编码图像全局语义特征, 并将所有编码的特征通过门结构融合在一起, 作为图像的整体编码特征. 在解码器中, 从细粒度的区域目标实体特征和目标实体类别特征中提取多模态特征, 并将其与整体编码后的特征融合用于解码语义信息生成描述. 该模型在Microsoft COCO公开数据集上进行了广泛的实验, 实验结果显示, 与现有的模型相比, 该模型取得了更好的图像描述效果.

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

2. 深度神经网络模型压缩方法与进展

赖叶静, 郝珊锋, 黄定江

华东师范大学学报（自然科学版） 2020, 2020 (5): 68-82. DOI: 10.3969/j.issn.1000-5641.202091001

摘要（810）

HTML （54）

PDF（pc）（1132KB）（829）

深度神经网络(Deep Neural Network, DNN)模型通过巨大的内存消耗和高计算量来实现强大的性能, 难以部署在有限资源的硬件平台上. 通过模型压缩来降低内存成本和加速计算已成为热点问题, 近年来已有大量的这方面的研究工作. 主要介绍了4种具有代表性的深度神经网络压缩方法，即网络剪枝、量化、知识蒸馏和紧凑神经网络设计; 着重介绍了近年来具有代表性的压缩模型方法及其特点; 最后, 总结了模型压缩的相关评价标准和研究前景.

参考文献 | 相关文章 | 多维度评价 | 评论（0）

机器学习方法与系统 栏目所有文章列表

机器学习方法与系统栏目所有文章列表