基于微博2019年11月11日—2022年5月12日的快递物流博文数据, 对疫情背景下快递物流服务的用户行为进行画像, 以扎根理论为理论框架, 结合抽象聚类方法抽象出5种用户行为、22个主题内容, 并生成相应的用户画像. 论文进一步探讨了主题的内容、主题的演化和群体的差异性. 结果表明: ① 用户对快递物流服务的满意行为单一; ② 用户的不满意行为多样化, 存在明显的升级性; ③ “运输效率”和“物流保障”是影响快递物流服务评价的主要因素; ④ 疫情的发展变化影响用户主题内容呈现的关注点和态度;⑤ 主题内容具有明显不同程度的群体差异.
近年来, 卷积神经网络已经在人工智能领域取得了巨大成功, 例如, 区块链、语音识别、图像理解等. 然而, 随着模型准确率的不断提高, 与之伴随的是网络模型计算量与参数量的大幅增长, 从而带来了诸如处理速度小, 内存占用大, 在移动端设备上难以部署等一系列问题. 知识蒸馏作为一种主流的模型压缩方法, 将教师网络的知识迁移到学生网络中, 从而在不增加参数量的情况下优化学生网络的表现. 如何挖掘具有代表性的知识表征进行蒸馏成为了知识蒸馏领域研究的核心问题. 本文提出了一种新的基于模型隐含层相关联算子的知识蒸馏方法, 借助数据增强方法准确捕获了图像特征在网络中间层每个阶段的学习变化过程, 利用相关联算子对该学习过程进行建模, 从而在教师网络中提取出一种新的表征信息用于指导学生网络训练. 实验结果表明, 本文所提出的方法在CIFAR-10、CIFAR-100两种数据集上, 相较于目前最优方法均取得了更好的性能.
文本语义匹配是很多自然语言处理任务的基础. 在很多场景中都需要文本语义匹配技术, 如搜索、问答系统等. 在实际运用场景中, 对文本语义匹配的效率有很高的要求. 虽然表征学习型语义匹配模型相较于交互型模型的准确率有所下降, 但效率极高. 而表征学习型语义匹配模型提升性能的关键是抽取具有高层语义特征的句向量. 针对该问题, 本文在ERINE模型的基础上, 设计了特征融合模块及特征抽取模块, 以获取具有多维语义特征的句向量, 并通过设计语义预测的损失函数, 进一步提升模型获取语义信息的性能, 从而提高文本语义匹配的准确率. 最终在百度千言文本相似度数据集上的准确率达到85.1%, 表现出较好的性能.
实例分割是计算机视觉领域中的一项重要任务, 近年来元学习和小样本学习的发展推动了小样本与计算机视觉任务的结合, 突破了对人工标注难、标注成本高的目标检测与分类瓶颈. 虽然在小样本图像分类、小样本语义分割和小样本目标检测上都取得了较大的发展, 但是基于小样本学习的实例分割近年来才成为研究热点. 从小样本实例分割的相关概念出发, 对现有小样本实例分割方法, 按照基于锚框和无锚框两类分别进行了系统性的概述, 并介绍了小样本实例分割常用的数据集及评价指标. 通过对算法性能和优缺点的分析对比, 以及研究现状的整理归纳, 对小样本实例分割未来发展方向和面临的挑战进行了展望.