与非图模型是一种表示电路设计的通用基础形式, 同时也是模型检查器的一种通用输入格式. 介绍了一种基于与非图结构编码的特征提取方法, 并基于该方法实现了一种快速的组合模型检查器Liquid. 所提出的结构编码的核心思想: 首先罗列出与非图中所有可能的子结构, 再将每个子结构出现的次数编码成向量, 该向量即作为与非图的特征向量参与之后的机器学习过程. 由于各种模型检查算法的性能在不同的与非图上参差不齐, Liquid的设计目标是组合多种模型检查算法, 针对不同的与非图使用机器学习模型挑选出合适的算法. 收集了目前所有的模型检查器基准测试集作为实验数据集并进行了实验. 实验结果表明, Liquid在实验数据集上的表现优于所有组合中的独立模型检查算法, 并有着不错的预测准确率. 同时, 还从多个维度分析了Liquid有效的原因.
操作系统是整个计算机系统的核心与基石, 其可靠性与安全性至关重要. 操作系统的故障或漏洞可能会导致系统崩溃、数据丢失、隐私泄露和安全攻击等问题, 特别是在安全攸关系统中, 一旦操作系统发生错误, 就可能会造成重大人员伤亡或财产损失. 一直以来, 如何保障操作系统的安全性和可靠性对学术界和工业界都是一个重大挑战. 目前验证操作系统安全性的方法有软件测试、程序静态分析、形式化方法等. 其中, 形式化方法是最有潜力确保操作系统安全可信的方法, 通过使用形式化方法, 建立数学模型并进行系统的形式化分析和验证, 从而发现潜在的错误和漏洞. 在操作系统中, 形式化方法可以用于验证操作系统的功能正确性、完整性以及系统安全性等. 在已有的针对操作系统形式化验证的成果基础上, 提出了一个面向嵌入式操作系统的形式化验证方案, 采用VCC (verified C compiler)、CBMC (C bounded model checker)以及PAT (process analysis toolkit)工具分别对操作系统单元层面、模块层面和系统层面进行验证. 该方法已成功应用到某操作系统的任务调度架构案例中, 对于嵌入式操作系统的分析验证具有一定的通用性.
随着高校信息系统应用的普及以及使用频率的提高, 师生对数据一致性、准确性、及时性和完整性提出了更高的要求, 原数据同步方案中使用XML (extensible markup language)进行数据同步具有同步效率低下、难以扩展的缺点. 考虑到开源工具DataX可以完成多种异构数据库之间的数据同步且不会对源数据库造成破坏, 本文使用DataX对原数据同步方案进行改进, 并针对高校研究生信息系统建设过程中存在的多个业务需求和应用场景, 提出了不同的数据同步方案. 同时, 针对DataX在启动和执行过程中一次读只能进行一次写的缺点, 设计了一次读可以多次写的方案. 对比实验表明, 优化后的方案可以提高数据同步效率, 具有较好的扩展性, 能够满足高校数据同步需求.
基于评论的推荐系统是一种主要通过挖掘文本信息抽取物品特征和用户偏好, 以提高性能的推荐系统方法. 现存的大多数方法忽略了撰写评论的陌生人信息, 引入陌生人信息可以更准确地衡量用户的相对感受并对目标用户的表达进行补充, 从而进行更精细的用户建模. 近年来, 一些研究尝试整合相似陌生人的信息, 但忽略了对其他陌生人信息的利用. 提出了基于偏好级别陌生人信息辅助的推荐系统模型CSRR(collaborative stranger review-based recommendation), 利用陌生人信息, 更加准确地对用户建模并进行适当扩展, 提升了推荐性能. 具体地, 为了准确捕捉用户的偏好, 首先, 设计了一个基于陌生人信息辅助的注意力模块, 该模块不仅考虑了评论文本的相似性, 也考虑了目标用户与撰写评论的陌生人之间的偏好交互作用; 其次, 一个基于陌生人信息过滤的门控模块根据目标用户–物品对的特征, 在偏好级别动态整合陌生人信息, 有效地过滤了陌生人的偏好信息以及丰富目标用户的建模; 最后, 应用隐因子模型 (latent factor model, LFM) 来完成评分预测任务. 实验结果说明CSRR模型在多个来源的真实数据集上均具有较高的预测准确度.
现有的一阶段方法分别提取视觉特征映射和文本特征, 并进行多模态推理来预测被引用对象的边界框. 这些方法存在以下两个缺点: 首先, 预先训练的视觉特征提取器在视觉特征中引入了与文本无关的视觉信号, 阻碍了多模态交互; 其次, 现有模型的推理过程缺乏对语言建模的可视化指导. 基于上述缺点, 现有的一阶段方法的推理能力是有限的. 提出了一种提取文本相关视觉特征映射的低阶交互和一种整合视觉特征的高阶交互来指导语言建模, 并进一步对视觉特征进行多步推理. 在此基础上, 提出了一种新的网络结构, 称为双路径多级交互网络. 在5种常用的视觉定位数据集上进行了实验, 结果表明该方法具有较好的性能和实时性.
深度神经网络模型的庞大存储和高计算量的需求限制了其在面积和功耗受限的嵌入式设备上的部署. 为了解决这一问题, 随机计算将数据表示为一个随机序列, 继而通过基本逻辑运算单元实现加法和乘法等算术运算, 以减小神经网络的存储空间和降低计算复杂度. 然而, 当随机序列的长度较短时, 网络权重在从浮点数转换到随机序列的过程中存在离散化误差, 这会降低随机计算网络模型的推理准确率. 尽管使用更长的随机序列可以扩大随机序列的表示范围以缓解这一问题, 但也会导致更长的计算时延和更大的能源功耗. 本文提出了一种基于傅立叶变换的可微量化函数的设计, 可以在网络的训练过程中, 通过提高模型对随机序列的匹配度, 来减小数据转换过程中的离散化误差, 从而保证较短随机序列的随机计算神经网络的准确率. 此外, 还设计了一种加法器, 用于提高运算单元的准确性, 并通过将输入分块来并行计算以进一步缩短时延. 最后, 通过实验表明, 本文相较于其他方法可以提高20%的模型推理准确率, 并能够达到缩短50%的计算时延.
集装箱锁销曲面结构复杂, 因而建立出一个曲面特征完整度较高的点云模型较为困难. 考虑到在大多数场景下, 位于固定高度的传感器搭配旋转的转台采集的曲面特征通常会存在一定的缺失. 为此, 提出了一种基于转台的多视角多姿态点云模型重建算法, 还原锁销较完整的曲面特征. 首先, 利用转台参数标定结果, 实现多视角三维点云的拼接, 建立一个固定姿态下的点云模型; 其次, 通过提出的改进球面投影算法, 选取锁销置于转台的摆放姿态, 建立另一姿态下的点云模型; 最后, 融合多个姿态下的点云模型, 提高其具备的曲面特征. 实验结果表明, 所提出的算法能建立出曲面特征完整度较高的锁销点云模型.
红外小目标的检测一直是红外追踪系统的关键技术, 针对现有红外小目标检测方法在复杂背景下易造成虚警、检测速度慢的不足, 从人类视觉系统的角度出发, 参考了多尺度局部能量因子检测方法 (multiscale local contrast measure using a local energy factor, MLCM-LEF), 提出了一种基于双层局部能量因子的红外小目标检测方法. 从局部能量差异与局部亮度差异两个角度进行目标检测, 使用双层局部能量因子从能量角度描述小目标与背景的相异程度, 同时采取加权亮度差因子从亮度角度对图像进行目标检测, 通过二维高斯融合上述二者的处理结果, 最终利用图像均值和标准差进行自适应阈值分割, 提取红外小目标. 经过公开数据集实验测试, 该方法在抑制背景噪声、减低虚警概率的表现上比主流的检测方法有所提升, 与MLCM-LEF算法相比, 基于双层局部能量因子的方法将单帧检测时间降低至三分之一.
三维点云语义分割方法, 是三维视觉环境感知中的重要任务, 被广泛应用于自动驾驶、增强现实、机器人等领域. 然而, 大多数语义分割方法工作在全监督的模式下, 为数据标注带来了极大的压力, 为了解决对于大规模点云标注数据的依赖问题, 许多工作基于有标签数据训练生成伪标签进一步迭代训练模型, 但未考虑到错误伪标签累积所导致的确认偏差. 针对该问题, 本文提出了一种基于组对比学习的弱监督三维点云语义分割方法, 在从伪标签中选择的正例组与负例组之间构造对比学习, 令伪标签之间相互竞争, 减少错误伪标签的梯度贡献, 从而缓解确认偏差. 实验结果表明, 本文所提出的方法在S3DIS、ScanNet-V2、Semantic3D等3个公开数据集上, 相较于目前最优方法均取得了更优的精度.
随着深度学习在计算机视觉领域取得的巨大成功, 基于示例的纹理合成研究得到了长足的发展. 当下主流纹理合成模型往往采用神经网络方法, 其通常包含卷积层和上采样层、下采样层等局部组件, 并不适用于捕捉非平稳纹理中的不规则结构特征. 受频率域与空间域的对偶性质的启发, 提出了一种基于隐层傅里叶卷积的非平稳纹理合成方法. 该方法以生成对抗网络为基础架构, 沿着隐层通道进行特征拆分, 搭建图像域局部分支和频率域全局分支, 进而兼顾视觉感知和结构信息. 实验表明, 该方法能够处理结构上极具挑战的非平稳纹理样本, 相较于目前最优方法而言, 在大尺度结构的学习与扩展上取得了更好的效果.
基于解耦常识性关联的图像描述生成算法旨在排除各类实体间常识性关联对模型推理的干扰, 提高描述生成的流畅性与准确性. 针对当前图像描述生成中存在的符合常识但与图像内容不相符的关系语句, 该算法先通过一种新颖的训练方式加强关系检测模型对图像中真实关系的关注程度, 提高关系推理的准确性. 再通过一种关系感知的实体交互方法, 对存在关系的实体进行有针对性的信息交互, 对关系信息进行强化. 实验表明, 该算法能够纠正一些常识性的虚假关系, 生成较为准确的图像描述, 并在各项评价指标上获得了较好的实验结果.
提出了一种角色动画中基于隐式曲面的皮肤变形方法, 主要面向具有骨骼层次以及相关蒙皮权重的动画模型, 利用隐式曲面来驱动皮肤变形. 首先, 采用埃尔米特径向基函数和泊松圆盘采样对给定骨骼绑定的网格部分进行重建, 把角色模型的体积近似当作一组局部的三维标量场, 并保留原有的网格属性; 其次, 构造场函数, 通过场函数纠正几何蒙皮技术的结果; 最后, 结合两种组合算子, 使用隐式方法在人体模型上形成合理可信的皮肤变形效果. 本方法不会产生糖纸扭曲和关节膨胀的问题, 并且可以生成皮肤接触效果和肌肉凸起. 由于该方法是后处理, 因此非常适合标准动画制作流程.
主流句子分类算法采用单一词向量表示模型获得文本表示, 导致了对文本的映射能力不足. 对此, 通过融合多种词向量的文本表示以提高分类的准确率. 针对多核学习在融合不同核函数时, 常规的核函数系数寻优方法存在的训练时间长、难以求得局部最优解等问题, 提出了一种新的核函数系数寻优方法, 该方法基于参数空间分割与广度优先搜索不断逼近核系数的最优值. 以支持向量机(support vector machine, SVM)为分类器, 在7个文本数据集上进行了分类实验. 实验结果表明, 多核学习分类效果明显优于单核学习, 并且所提出的寻优方法在训练次数少于常规方法时也能获得了好的分类效果.
提出了一个基于动量更新表示与重构约束的神经网络训练框架: 在视角标签信息缺失的限制性条件下, 使用2D (two-dimensional)图像进行3D (three-dimensional)物品识别. 首先, 使用自监督学习来解决训练过程中标签缺失的问题. 其次, 在动态队列基础上, 使用动量更新来保持物品表示的稳定性. 更进一步地, 在训练框架中加入自编码器模块, 利用重构约束使模型学习到的表示具有更多的语义信息. 最后, 提出动态队列递减策略, 解决训练过程中数据分布不均衡带来的准确度下降问题. 在2个广泛使用的多视角数据集ModelNet和ShapeNet上进行了实验, 结果表明所提方法具有良好的性能表现.
由于定位设备误差、非机动车骑行习惯等因素的影响, 骑行轨迹存在数据异常与定位信息缺失等质量问题, 为骑行地图推断和骑行路径规划等基于轨迹的应用带来了极大挑战. 为解决上述问题, 提出了一个面向骑行地图推断的轨迹数据质量提升框架, 包括网格索引构建、异常轨迹点的消除、徘徊轨迹段的消除、违章轨迹段的消除、漂移轨迹段的校准以及缺失轨迹的恢复等. 在真实非机动车骑行轨迹数据集上进行了对比实验和消融实验, 实验结果验证了所提方案对于提升骑行地图推断的精度优于现有方法.
无共享架构的分布式数据库是为了应对互联网业务的高可扩展性和高可用性而诞生的. 目前无共享架构的分布式数据库虽然已经有了长足的进展, 但是对于一些采用无状态计算层的无共享架构分布式数据库而言, 往往存在着冲突检测链路过长的问题, 这一问题在高冲突的场景下会更加突出. 针对这一问题, 设计了预先加锁和本地缓存两个策略, 并开发了配套的高冲突检测模块, 可以实现快速检测冲突并启动对应的高冲突处理策略. 实验表明, 对高冲突事务处理的架构设计和优化可以提高分布式数据库系统在高冲突负载下的性能.
基于双视图眼底图像的诊断方法被广泛应用于糖尿病视网膜病变 (diabetic retinopathy, DR) 的筛查, 该方法可以有效地解决单视角下图像遮挡和视场受限的问题. 针对如何有效融合不同视图信息来提高DR分级准确率, 提出了一种基于注意力机制的多视角图像之间特征融合的学习方法. 针对眼底图像中病灶占比率较小的问题, 引入了自注意力机制以加强局部病灶特征的学习; 针对双视图眼底图像分类场景, 提出了一种跨视图注意力机制, 有效地利用了双视图之间的信息. 在内部数据集DFiD和公开数据集DeepDR上进行的实验, 验证了所提方法能够有效提高DR分级精度, 可用于大规模DR筛查, 辅助医生实现高效诊断.
智能手机、监控摄像头等智能设备的普及导致了严重的人脸隐私安全问题. 人脸去识别化技术被认为是解决上述问题的有效途径, 该技术旨在将人脸图像中的身份信息去除以有效保护人脸的隐私. 然而, 现有的研究工作大多缺乏对去识别化人脸图像在身份上显式的控制与可控的变化, 导致去识别化后的图像无法应用于人脸验证和检索等与身份相关的任务. 因此, 考虑到去识别化人脸图像在身份相关任务上的可用性, 提出了一种新的面向身份相互关系一致性的人脸去识别化任务, 即任意两个被去识别化的人脸之间的身份相互关系与去识别化前的人脸保持一致. 为解决这一问题, 引入了一种任务驱动的身份相互关系一致性生成对抗网络算法. 该方法设计了一种基于特征向量旋转的去识别化模块, 将原有的身份特征可控修改为具有身份相互关系一致性的去识别化特征. 此外, 还引入了身份控制损失, 以保证去识别化后生成的人脸身份的准确性. 大量的定性和定量结果表明, 提出的方法在人脸的去识别化和去识别人脸的身份相互关系一致性上的表现远优于现有的方法.
评论文本蕴含丰富的用户信息和物品信息, 对于用户的购买决策有着重要作用. 当用户面对不同的目标物品时, 会展现复杂的兴趣. 因此准确提取评论中的语义特征并建模物品和用户之间的上下文交互, 对学习用户偏好和物品属性十分关键. 专注于增强推荐系统的个性化捕捉和动态兴趣建模能力, 考虑不同特征的有用性, 提出了一种分层级描述感知的个性化推荐 (description-aware personal recommendation, DAPR) 算法: 在评论集合的单词层级, 设计个性化的信息选择网络, 提取重要的单词语义特征; 在评论层级, 基于交叉注意力机制设计神经网络, 动态地学习评论的有用性; 拼接评论摘要作为描述, 设计协同注意力网络, 捕捉更丰富的上下文感知的特征. 在5个Amazon数据集上的实验结果证明了所提方法能取得与基线模型相当的推荐性能.
中文情感分析是自然语言处理的重要研究内容, 旨在探究中文文本中蕴含的情感倾向. 近年来, 中文情感分析研究取得了长足进步, 但鲜有研究根据语言本身特征和下游任务需求进行探讨. 鉴于此, 针对中文文本的特殊性以及情感分析的实际需求, 在字、词特征的基础上, 引入部首特征和情感词性特征, 利用双向长短期记忆网络、注意力机制、循环卷积神经网络等模型, 提出了融合字、词、部首、词性等多粒度语义特征的中文文本情感分析方法. 在融合各类特征的基础上, 利用softmax函数进行情感预测. 数据集NLPECC (natural language processing and Chinese computing)上的对比实验结果表明, 所提方法的F1值均达到84.80%, 一定程度上提高了已有方法的性能, 较好地完成了中文文本情感分析任务.