针对无人机在三维环境中寻求从起始位置到目标位置的一条最优、安全且能避开所有障碍物的路径, 提出了一种结合正六边形导向法改进的人工势场法, 用来解决传统人工势场法中障碍物附近目标不可达和局部极小值问题. 首先, 在排斥势场函数中加入距离修正因子, 解决目标不可达问题; 其次, 提出了一种正六边形导向法来改进局部极小值问题, 该方法可以在无人机陷入局部极小值区域时, 判断所处环境并选择适当的规划方法, 引导无人机逃离局部极小值区域; 再次, 在Matlab平台上进行了三维建模仿真, 同时考虑到多种复杂障碍物的场景, 结果表明了该方法在保留了原本算法优势的同时, 在无人机实时路径规划中更加有效和可行; 最后, 在真实环境中演示了所提出的方法, 实验结果表明了该方法的可行性和有效性.
自适应学习是使用计算机算法来协调自适应学习平台与学习者的互动, 并提供定制学习资源和学习活动来解决每位学习者的独特需求的教育方法. 自适应学习随着新冠疫情的影响变得越来越重要, 它面临的主要挑战之一是如何为学习者提供定制的学习资源, 即如何在海量的学习资源中为学习者生成个性化的推荐. 现存的方法大多使用基于学习者知识级别的推荐, 然而这些方法存在一些不足. 首先, 在获取学习者知识级别时, 学习者在学习过程中出现的遗忘现象并未得到很好的建模. 其次, 在推荐时, 这些方法将获取学习者知识级别的知识追踪技术和推荐分开进行, 忽视了这两者之间的深层连接关系. 此外, 仅考虑学习者的知识来建模, 将会忽略学习者对于学习资源类型、学习策略等的偏好. 为解决上述问题, 给出了一个知识和性格结合的多任务学习框架(Knowledge and Personality Incorporated Multi-Task Learning Framework, KPM)去促进课程 (即上文所指的学习资源) 的推荐, 该框架将增强的知识追踪任务作为辅助任务去协助主要的课程推荐任务. 具体地, 在增强的知识追踪任务(Enhanced Knowledge Tracing Task, EKTT)中, 设计了一个个性化的遗忘控制器去增强深度知识追踪模型, 从而更加准确地获取学习者的知识级别. 在课程推荐任务(Course Recommendation Task, CRT)中, 首先, 将学习者的知识级别、学习者的序列行为和学习者的性格根据特定的上下文进行自适应融合, 用以生成学习者的画像; 然后, 基于学习者的画像生成课程推荐列表. 在真实的教育相关数据集上的实验结果验证了提出的方法在点击率(Hit Ratio, HR)、归一化折损累计增益(Normalized Discounted Cumulative Gain, NDCG)、精确度(Precision)指标上的优越性, 即可以生成更加个性化的课程推荐.
知识追踪任务是根据学生历史做题记录和其他辅助信息追踪学生知识水平的变化过程, 以及预测学生在下一时刻作答的结果. 由于已有的神经网络知识追踪模型在效果和性能上还有待提升, 提出了基于堆叠门控循环单元(Gated Recurrent Unit, GRU)的深度残差(Stacked-Gated Recurrent Unit-Residual, S-GRU-R)网络. 针对长短期记忆网络(Long Short-term Memory, LSTM)参数过多导致过拟合问题, 用GRU代替LSTM学习做题序列中的信息, 采用堆叠GRU扩大序列学习容量, 并用残差连接降低模型训练的难度. S-GRU-R在数据集Statics2011上进行了实验, 并用AUC (Area Under the Curve)和F1-score作为评估指标. 结果表明S-GRU-R在这2个评估指标上都超过了其他类似的循环神经网络模型.
传统虚拟地形建模通常采用基于人工设计的过程化生成方法, 无法满足军事仿真等需要对真实环境进行还原的仿真建模任务. 针对此类任务, 提出了一种基于遥感图像的虚拟地形仿真建模方法, 其核心是地形混合纹理生成网络(landscape blended texture generation network, LBTG-Net). 该方法利用地形混合纹理生成器(blended texture generator, BTG), 在风格鉴别器(style discriminator, SD)以及多级分类损失的约束下生成地形混合纹理贴图, 基于该混合纹理贴图生成结果对地形环境进行程序化构建. 该方法包含2个核心特点: ① 对输入遥感图像进行准确的地表覆盖类型分类, 以保证对输入遥感图像环境的还原; ② 生成高质量地形混合纹理贴图, 以提高虚拟地形建模质量. LBTG-Net使用Sentinel-2多光谱遥感图像数据集进行训练和验证. 实验结果表明, 该方法在各地表覆盖类型分类评价指标下均有良好表现, 能够在准确还原输入遥感图像的环境分布的同时完成高质量虚拟地形仿真建模.
随着物联网的发展, 大量传感器设备被接入网络, 这些设备所产生的数据的异常检测关系到系统服务的稳定性. 时序数据库是专门为时序数据优化的数据库系统. 作为监控系统的重要环节, 时序数据库担负着时序数据的管理和查询任务. 但目前时序数据库在处理多个数据源数据的查询上存在着延迟高、没有充分利用系统计算资源的缺点. 针对上述缺点, 基于InfluxDB, 重新设计了时序数据库的查询执行模型, 提出了InfluxDB-PP (parallel processing), 很好地解决了上述问题. 实验结果表明, InfluxDB-PP在实时数据异常查询场景下, 查询时延相较于InfluxDB降低了约85.7%.
远程监督的标注方法在关系抽取任务中被广泛应用, 其在减小人工标注负担的同时, 也引入了大量噪声样本, 影响了模型的训练. 针对这个问题, 提出了一种基于影响函数的去噪方法. 通过影响函数衡量训练集中每一条训练样本对模型预测的影响, 并在建立噪声样本与其的关系后, 设计了1个判断样本是否是错误标注的打分函数. 基于此打分函数的值, 从初始的1个小的无噪声集合出发, 通过自举法迭代式地获得最后的去噪数据集. 该去噪方法作为一种对数据的前处理方法, 在公开数据集上取得了良好的效果.
定位设备的普及产生了海量的车辆行驶数据, 使得利用历史数据预测车辆行驶时长成为可能. 车辆行驶数据由两部分组成: 车辆行驶经过的路段序列信息和出发时段; 路径总长度等外部信息. 如何提取路段序列特征, 以及如何将序列特征与外部特征有效地融合, 成为预测行驶时间的关键问题. 为解决以上问题, 提出了一个基于 Transformer 的行驶时间预测模型, 模型由路段序列处理模块和特征融合模块两部分组成. 首先, 路段序列处理模块使用自注意力机制处理路段序列, 提取路段序列特征. 该模型不但可以充分考虑各条路段与其他路段间道路速度的时空关联性, 同时可保证数据并行输入模型, 避免了使用循环神经网络时数据顺序输入导致的效率低下. 其次, 特征融合模块将路段序列特征与出发时段等外部信息相融合, 最终获得预测的行驶时长. 在此基础上, 统计路口连接的路段数作为路段的上/下游路口特征, 与路段特征结合输入模型, 进一步提升了行驶时长的预测精度. 在真实的数据集上与主流预测模型进行的对比实验表明, 该模型在预测精度以及训练速度上均有提升, 体现了所提模型的有效性.
大数据时代, 数据信息的不断膨胀给数据的快速存取带来了巨大挑战. 因此, 设计一种高效的索引结构具有重要意义. ALEX (updatable adaptive learned index)是一种利用机器学习模型代替传统B-树索引结构的学习索引, 具有较好的时间、空间性能, 但存在频繁的缺页中断问题. 为解决此问题, 进一步提升ALEX性能, 在ALEX基础上提出了一种基于大页内存的内存预分配策略, 较好地降低了内存缺页中断率, 提升了ALEX性能. 在内存分配阶段, 采用预分配策略; 在内存回收阶段, 则采用延迟释放策略. 在Longitudes数据集上的实验表明, 该策略具有良好的效果.
急性肾衰竭是一种发病率较高的临床疾病, 尽早识别潜在患者有助于医生对其进行医疗干预, 降低发病率和死亡率. 近年来, 依靠电子健康病历去预测患者潜在的健康风险逐渐受到关注. 大多数模型通过聚合数据或者填充缺失值的方式处理人体生理指标数据中存在的稀疏性和不规则性问题, 忽视了缺失信息隐含的患者健康状态. 此外, 现有的急性肾衰竭预测模型并没有考虑各种模态的数据特点和模态之间的相关性. 为了解决以上问题, 提出了基于多模态的急性肾衰竭预测模型. 该模型考虑了人体生理指标数据、疾病数据和人口统计学数据. 设计了新的基于掩码和时间差的LSTM (long short term memory)网络去学习各个生理指标的时间间隔和缺失信息, 捕获指标的数值变化和检测频率变化, 引入了多头自注意力机制促进各模态表征的相互学习. 在真实的数据集上进行了急性肾衰竭预测问题和死亡风险预测问题的实验, 证明了所提出模型的有效性和合理性.
如何将洞窟甬道顶部的非规则柱面壁画展开成全景图像, 在古壁画保护和二次开发领域是一个比较有挑战性的课题. 提出了将柱面壁画先划分成众多有重叠的小区域进行采样, 然后再把这些采样图像拼接成一幅全景图像的方法. 该方法的主要处理内容: ① 依据采样图像集重构三维模型; ② 把图像纹理映射到三维模型上; ③ 将重构得到的非规则三维圆柱面拟合到最接近于原形状的理想圆柱面上; ④ 最后将理想圆柱面的壁画投影成全景图像. 所提出的方法在实际洞窟图像集上进行了验证实验. 实验结果显示, 所提方法能较完整地生成全景图像, 并且从全景图像上看不出有拼接痕迹和纹理变形的现象, 具有一定的实用价值.
海量新闻文本中往往涉及多个实体, 并蕴含复杂多样的事件. 为了挖掘这些实体、事件信息, 先前的以事件为中心的事件抽取方法大多先检测事件, 再抽取事件论元. 受限于触发词和事件识别, 该方法无法应用于真实工业场景下的新闻事件抽取. 考虑到命名实体识别(named entity recognition , NER)的性能达到90%以上, 提出了以目标实体为视角的事件抽取任务—目标依赖的事件识别(target-dependent event detection, TDED), 旨在抽取出实体并识别其对应的事件. 基于该任务, 提出了先抽取实体再识别目标级事件类型的两阶段模型框架. 该模型融合了事件关键词和句法依存距离特征, 能够学习目标依赖的上下文信息. 在构建好的真实中文金融数据集上的实验结果表明, 该模型抽取性能较佳, 即使在句中存在多个实体或事件的复杂情形下也能取得很好的性能表现.
随着我国电力系统的不断发展, 供电的安全性和可靠性直接影响着地区的生产生活和民众的经济生活. 电网故障定位是电力调度系统中重要的组成部分. 传统的故障定位需要依靠调度人员大量的经验积累和人工判断, 而面对日益增长的需求, 仅依靠传统方法进行故障定位会增加误判率, 进而对电力系统的稳定运行造成威胁. 提出了一种基于基尔霍夫定律和布尔方程的电网故障定位算法, 将故障定位问题转化为布尔线性混合规划问题, 并结合模拟退火算法和遗传算法的思想进行求解, 实现了在小型电网中的故障快速定位, 有效降低了调度错误率, 缩短了从故障发生到故障隔离、故障处理的时间差, 节约了人力资源, 提高了调度效率.
随着工业智能巡检的不断发展, 基于数字图像处理方法的设备元件状态识别系统被广泛应用. 为提升配电室中配电柜设备元件状态识别的准确率, 提出了一种基于残差网络(residual networks, ResNet)的设备元件状态识别方法. 首先搭建数据采集系统, 构建数据集; 然后对配电柜图像, 裁剪预设的设备元件目标区域, 生成设备元件图像; 对于设备元件图像, 构建基于ResNet的元件状态识别模型并训练; 使用训练完毕的模型识别元件的状态. 以变电站配电室中配电柜设备元件数据集作为研究对象, 对于特征复杂的元件采用单预测头的网络, 对于特征简单的元件采用多预测头的网络; 然后使用紧凑和剪枝的模型压缩方法在精度损失较小的情况下减少参数量和计算量; 最后介绍巡检系统的架构设计, 将JetSon Nano边缘终端作为算法模块的运行硬件, 以减少通信成本.
基于高重叠度视角, 提出了一种在集装箱码头针对锁销模型快速建立的三维点云拼接方法. 实验使用Azure Kinect深度相机采集场景点云, 并对点云进行预处理, 得到目标点云. 对于视角略微不同的锁销, 在采用采样一致性初始配准算法 (sample consensus initial algorithm, SAC-IA) 的基础上, 利用经典的迭代最近点 (iterative closest point, ICP)算法进行配准, 确定2片点云的重叠位置关系. 在总体拼接过程中, 用锁销在相机z方向投影的包围盒面积的相对大小, 来估计锁销的大体形状; 然后通过对比相邻视角该面积的差值, 选取数量合适的、重叠度较大的点云视角, 保证配准的正确率并减少耗时. 实验结果表明, 该方法对锁销的配准误差较低, 可以较快速地建立适用于类型匹配的工件模型.
中文情感分析是自然语言处理的重要研究内容, 旨在探究中文文本中蕴含的情感倾向. 近年来, 中文情感分析研究取得了长足进步, 但鲜有研究根据语言本身特征和下游任务需求进行探讨. 鉴于此, 针对中文文本的特殊性以及情感分析的实际需求, 在字、词特征的基础上, 引入部首特征和情感词性特征, 利用双向长短期记忆网络、注意力机制、循环卷积神经网络等模型, 提出了融合字、词、部首、词性等多粒度语义特征的中文文本情感分析方法. 在融合各类特征的基础上, 利用softmax函数进行情感预测. 数据集NLPECC (natural language processing and Chinese computing)上的对比实验结果表明, 所提方法的F1值均达到84.80%, 一定程度上提高了已有方法的性能, 较好地完成了中文文本情感分析任务.
智能手机、监控摄像头等智能设备的普及导致了严重的人脸隐私安全问题. 人脸去识别化技术被认为是解决上述问题的有效途径, 该技术旨在将人脸图像中的身份信息去除以有效保护人脸的隐私. 然而, 现有的研究工作大多缺乏对去识别化人脸图像在身份上显式的控制与可控的变化, 导致去识别化后的图像无法应用于人脸验证和检索等与身份相关的任务. 因此, 考虑到去识别化人脸图像在身份相关任务上的可用性, 提出了一种新的面向身份相互关系一致性的人脸去识别化任务, 即任意两个被去识别化的人脸之间的身份相互关系与去识别化前的人脸保持一致. 为解决这一问题, 引入了一种任务驱动的身份相互关系一致性生成对抗网络算法. 该方法设计了一种基于特征向量旋转的去识别化模块, 将原有的身份特征可控修改为具有身份相互关系一致性的去识别化特征. 此外, 还引入了身份控制损失, 以保证去识别化后生成的人脸身份的准确性. 大量的定性和定量结果表明, 提出的方法在人脸的去识别化和去识别人脸的身份相互关系一致性上的表现远优于现有的方法.
由于定位设备误差、非机动车骑行习惯等因素的影响, 骑行轨迹存在数据异常与定位信息缺失等质量问题, 为骑行地图推断和骑行路径规划等基于轨迹的应用带来了极大挑战. 为解决上述问题, 提出了一个面向骑行地图推断的轨迹数据质量提升框架, 包括网格索引构建、异常轨迹点的消除、徘徊轨迹段的消除、违章轨迹段的消除、漂移轨迹段的校准以及缺失轨迹的恢复等. 在真实非机动车骑行轨迹数据集上进行了对比实验和消融实验, 实验结果验证了所提方案对于提升骑行地图推断的精度优于现有方法.
基于双视图眼底图像的诊断方法被广泛应用于糖尿病视网膜病变 (diabetic retinopathy, DR) 的筛查, 该方法可以有效地解决单视角下图像遮挡和视场受限的问题. 针对如何有效融合不同视图信息来提高DR分级准确率, 提出了一种基于注意力机制的多视角图像之间特征融合的学习方法. 针对眼底图像中病灶占比率较小的问题, 引入了自注意力机制以加强局部病灶特征的学习; 针对双视图眼底图像分类场景, 提出了一种跨视图注意力机制, 有效地利用了双视图之间的信息. 在内部数据集DFiD和公开数据集DeepDR上进行的实验, 验证了所提方法能够有效提高DR分级精度, 可用于大规模DR筛查, 辅助医生实现高效诊断.
评论文本蕴含丰富的用户信息和物品信息, 对于用户的购买决策有着重要作用. 当用户面对不同的目标物品时, 会展现复杂的兴趣. 因此准确提取评论中的语义特征并建模物品和用户之间的上下文交互, 对学习用户偏好和物品属性十分关键. 专注于增强推荐系统的个性化捕捉和动态兴趣建模能力, 考虑不同特征的有用性, 提出了一种分层级描述感知的个性化推荐 (description-aware personal recommendation, DAPR) 算法: 在评论集合的单词层级, 设计个性化的信息选择网络, 提取重要的单词语义特征; 在评论层级, 基于交叉注意力机制设计神经网络, 动态地学习评论的有用性; 拼接评论摘要作为描述, 设计协同注意力网络, 捕捉更丰富的上下文感知的特征. 在5个Amazon数据集上的实验结果证明了所提方法能取得与基线模型相当的推荐性能.
主流句子分类算法采用单一词向量表示模型获得文本表示, 导致了对文本的映射能力不足. 对此, 通过融合多种词向量的文本表示以提高分类的准确率. 针对多核学习在融合不同核函数时, 常规的核函数系数寻优方法存在的训练时间长、难以求得局部最优解等问题, 提出了一种新的核函数系数寻优方法, 该方法基于参数空间分割与广度优先搜索不断逼近核系数的最优值. 以支持向量机(support vector machine, SVM)为分类器, 在7个文本数据集上进行了分类实验. 实验结果表明, 多核学习分类效果明显优于单核学习, 并且所提出的寻优方法在训练次数少于常规方法时也能获得了好的分类效果.