计算机科学 栏目所有文章列表

    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    基于多核支持向量机的句子分类算法
    肖开研, 廉洁
    华东师范大学学报(自然科学版)    2023, 2023 (6): 85-94.   DOI: 10.3969/j.issn.1000-5641.2023.00.008
    摘要58)   HTML3)    PDF (1621KB)(33)   

    主流句子分类算法采用单一词向量表示模型获得文本表示, 导致了对文本的映射能力不足. 对此, 通过融合多种词向量的文本表示以提高分类的准确率. 针对多核学习在融合不同核函数时, 常规的核函数系数寻优方法存在的训练时间长、难以求得局部最优解等问题, 提出了一种新的核函数系数寻优方法, 该方法基于参数空间分割与广度优先搜索不断逼近核系数的最优值. 以支持向量机(support vector machine, SVM)为分类器, 在7个文本数据集上进行了分类实验. 实验结果表明, 多核学习分类效果明显优于单核学习, 并且所提出的寻优方法在训练次数少于常规方法时也能获得了好的分类效果.

    图表 | 参考文献 | 相关文章 | 多维度评价
    动量更新与重构约束的限制视角下3D物品识别
    崔瑞博, 王峰
    华东师范大学学报(自然科学版)    2023, 2023 (6): 61-72.   DOI: 10.3969/j.issn.1000-5641.2023.06.006
    摘要44)   HTML7)    PDF (1207KB)(26)   

    提出了一个基于动量更新表示与重构约束的神经网络训练框架: 在视角标签信息缺失的限制性条件下, 使用2D (two-dimensional)图像进行3D (three-dimensional)物品识别. 首先, 使用自监督学习来解决训练过程中标签缺失的问题. 其次, 在动态队列基础上, 使用动量更新来保持物品表示的稳定性. 更进一步地, 在训练框架中加入自编码器模块, 利用重构约束使模型学习到的表示具有更多的语义信息. 最后, 提出动态队列递减策略, 解决训练过程中数据分布不均衡带来的准确度下降问题. 在2个广泛使用的多视角数据集ModelNet和ShapeNet上进行了实验, 结果表明所提方法具有良好的性能表现.

    图表 | 参考文献 | 相关文章 | 多维度评价
    面向骑行地图推断的轨迹数据质量提升方法
    陈杰, 沈文怡, 吴问宇, 毛嘉莉
    华东师范大学学报(自然科学版)    2023, 2023 (6): 14-27.   DOI: 10.3969/j.issn.1000-5641.2023.06.002
    摘要80)   HTML11)    PDF (5823KB)(72)   

    由于定位设备误差、非机动车骑行习惯等因素的影响, 骑行轨迹存在数据异常与定位信息缺失等质量问题, 为骑行地图推断和骑行路径规划等基于轨迹的应用带来了极大挑战. 为解决上述问题, 提出了一个面向骑行地图推断的轨迹数据质量提升框架, 包括网格索引构建、异常轨迹点的消除、徘徊轨迹段的消除、违章轨迹段的消除、漂移轨迹段的校准以及缺失轨迹的恢复等. 在真实非机动车骑行轨迹数据集上进行了对比实验和消融实验, 实验结果验证了所提方案对于提升骑行地图推断的精度优于现有方法.

    图表 | 参考文献 | 相关文章 | 多维度评价
    面向高冲突事务处理的架构设计和优化
    连薛超, 刘维, 王清帅, 张蓉
    华东师范大学学报(自然科学版)    2023, 2023 (6): 28-38.   DOI: 10.3969/j.issn.1000-5641.2023.06.003
    摘要50)   HTML7)    PDF (1659KB)(45)   

    无共享架构的分布式数据库是为了应对互联网业务的高可扩展性和高可用性而诞生的. 目前无共享架构的分布式数据库虽然已经有了长足的进展, 但是对于一些采用无状态计算层的无共享架构分布式数据库而言, 往往存在着冲突检测链路过长的问题, 这一问题在高冲突的场景下会更加突出. 针对这一问题, 设计了预先加锁和本地缓存两个策略, 并开发了配套的高冲突检测模块, 可以实现快速检测冲突并启动对应的高冲突处理策略. 实验表明, 对高冲突事务处理的架构设计和优化可以提高分布式数据库系统在高冲突负载下的性能.

    图表 | 参考文献 | 相关文章 | 多维度评价
    基于双视图特征融合的糖尿病视网膜病变分级
    姜璐璐, 孙司琦, 邹海东, 陆丽娜, 冯瑞
    华东师范大学学报(自然科学版)    2023, 2023 (6): 39-48.   DOI: 10.3969/j.issn.1000-5641.2023.06.004
    摘要61)   HTML4)    PDF (1286KB)(36)   

    基于双视图眼底图像的诊断方法被广泛应用于糖尿病视网膜病变 (diabetic retinopathy, DR) 的筛查, 该方法可以有效地解决单视角下图像遮挡和视场受限的问题. 针对如何有效融合不同视图信息来提高DR分级准确率, 提出了一种基于注意力机制的多视角图像之间特征融合的学习方法. 针对眼底图像中病灶占比率较小的问题, 引入了自注意力机制以加强局部病灶特征的学习; 针对双视图眼底图像分类场景, 提出了一种跨视图注意力机制, 有效地利用了双视图之间的信息. 在内部数据集DFiD和公开数据集DeepDR上进行的实验, 验证了所提方法能够有效提高DR分级精度, 可用于大规模DR筛查, 辅助医生实现高效诊断.

    图表 | 参考文献 | 相关文章 | 多维度评价
    面向身份相互关系一致性的人脸去识别化方法
    步一凡, 王晓玲, 贺珂珂, 卢兴见, 王文萱
    华东师范大学学报(自然科学版)    2023, 2023 (6): 49-60.   DOI: 10.3969/j.issn.1000-5641.2023.06.005
    摘要65)   HTML8)    PDF (1499KB)(49)   

    智能手机、监控摄像头等智能设备的普及导致了严重的人脸隐私安全问题. 人脸去识别化技术被认为是解决上述问题的有效途径, 该技术旨在将人脸图像中的身份信息去除以有效保护人脸的隐私. 然而, 现有的研究工作大多缺乏对去识别化人脸图像在身份上显式的控制与可控的变化, 导致去识别化后的图像无法应用于人脸验证和检索等与身份相关的任务. 因此, 考虑到去识别化人脸图像在身份相关任务上的可用性, 提出了一种新的面向身份相互关系一致性的人脸去识别化任务, 即任意两个被去识别化的人脸之间的身份相互关系与去识别化前的人脸保持一致. 为解决这一问题, 引入了一种任务驱动的身份相互关系一致性生成对抗网络算法. 该方法设计了一种基于特征向量旋转的去识别化模块, 将原有的身份特征可控修改为具有身份相互关系一致性的去识别化特征. 此外, 还引入了身份控制损失, 以保证去识别化后生成的人脸身份的准确性. 大量的定性和定量结果表明, 提出的方法在人脸的去识别化和去识别人脸的身份相互关系一致性上的表现远优于现有的方法.

    图表 | 参考文献 | 相关文章 | 多维度评价
    分层级描述感知的个性化推荐系统
    陈道佳, 陈志云
    华东师范大学学报(自然科学版)    2023, 2023 (6): 73-84.   DOI: 10.3969/j.issn.1000-5641.2023.06.007
    摘要55)   HTML5)    PDF (786KB)(31)   

    评论文本蕴含丰富的用户信息和物品信息, 对于用户的购买决策有着重要作用. 当用户面对不同的目标物品时, 会展现复杂的兴趣. 因此准确提取评论中的语义特征并建模物品和用户之间的上下文交互, 对学习用户偏好和物品属性十分关键. 专注于增强推荐系统的个性化捕捉和动态兴趣建模能力, 考虑不同特征的有用性, 提出了一种分层级描述感知的个性化推荐 (description-aware personal recommendation, DAPR) 算法: 在评论集合的单词层级, 设计个性化的信息选择网络, 提取重要的单词语义特征; 在评论层级, 基于交叉注意力机制设计神经网络, 动态地学习评论的有用性; 拼接评论摘要作为描述, 设计协同注意力网络, 捕捉更丰富的上下文感知的特征. 在5个Amazon数据集上的实验结果证明了所提方法能取得与基线模型相当的推荐性能.

    图表 | 参考文献 | 相关文章 | 多维度评价
    融合多粒度语义特征的中文情感分析方法
    任菊香, 刘忠宝
    华东师范大学学报(自然科学版)    2023, 2023 (6): 95-107.   DOI: 10.3969/j.issn.1000-5641.2023.06.009
    摘要58)   HTML5)    PDF (898KB)(46)   

    中文情感分析是自然语言处理的重要研究内容, 旨在探究中文文本中蕴含的情感倾向. 近年来, 中文情感分析研究取得了长足进步, 但鲜有研究根据语言本身特征和下游任务需求进行探讨. 鉴于此, 针对中文文本的特殊性以及情感分析的实际需求, 在字、词特征的基础上, 引入部首特征和情感词性特征, 利用双向长短期记忆网络、注意力机制、循环卷积神经网络等模型, 提出了融合字、词、部首、词性等多粒度语义特征的中文文本情感分析方法. 在融合各类特征的基础上, 利用softmax函数进行情感预测. 数据集NLPECC (natural language processing and Chinese computing)上的对比实验结果表明, 所提方法的F1值均达到84.80%, 一定程度上提高了已有方法的性能, 较好地完成了中文文本情感分析任务.

    图表 | 参考文献 | 相关文章 | 多维度评价
    基于多模态的急性肾衰竭预测模型
    邓未, 周昉
    华东师范大学学报(自然科学版)    2023, 2023 (4): 52-64.   DOI: 10.3969/j.issn.1000-5641.2023.04.006
    摘要158)   HTML12)    PDF (1179KB)(173)   

    急性肾衰竭是一种发病率较高的临床疾病, 尽早识别潜在患者有助于医生对其进行医疗干预, 降低发病率和死亡率. 近年来, 依靠电子健康病历去预测患者潜在的健康风险逐渐受到关注. 大多数模型通过聚合数据或者填充缺失值的方式处理人体生理指标数据中存在的稀疏性和不规则性问题, 忽视了缺失信息隐含的患者健康状态. 此外, 现有的急性肾衰竭预测模型并没有考虑各种模态的数据特点和模态之间的相关性. 为了解决以上问题, 提出了基于多模态的急性肾衰竭预测模型. 该模型考虑了人体生理指标数据、疾病数据和人口统计学数据. 设计了新的基于掩码和时间差的LSTM (long short term memory)网络去学习各个生理指标的时间间隔和缺失信息, 捕获指标的数值变化和检测频率变化, 引入了多头自注意力机制促进各模态表征的相互学习. 在真实的数据集上进行了急性肾衰竭预测问题和死亡风险预测问题的实验, 证明了所提出模型的有效性和合理性.

    图表 | 参考文献 | 相关文章 | 多维度评价
    目标依赖的新闻事件识别
    张甜甜, 兰曼
    华东师范大学学报(自然科学版)    2023, 2023 (2): 60-72.   DOI: 10.3969/j.issn.1000-5641.2023.02.008
    摘要187)   HTML14)    PDF (1822KB)(92)   

    海量新闻文本中往往涉及多个实体, 并蕴含复杂多样的事件. 为了挖掘这些实体、事件信息, 先前的以事件为中心的事件抽取方法大多先检测事件, 再抽取事件论元. 受限于触发词和事件识别, 该方法无法应用于真实工业场景下的新闻事件抽取. 考虑到命名实体识别(named entity recognition , NER)的性能达到90%以上, 提出了以目标实体为视角的事件抽取任务—目标依赖的事件识别(target-dependent event detection, TDED), 旨在抽取出实体并识别其对应的事件. 基于该任务, 提出了先抽取实体再识别目标级事件类型的两阶段模型框架. 该模型融合了事件关键词和句法依存距离特征, 能够学习目标依赖的上下文信息. 在构建好的真实中文金融数据集上的实验结果表明, 该模型抽取性能较佳, 即使在句中存在多个实体或事件的复杂情形下也能取得很好的性能表现.

    图表 | 参考文献 | 相关文章 | 多维度评价
    基于大页内存的学习索引内存分配策略
    官嘉林, 朱艳, 吴庭亮, 陈艳, 张敬伟
    华东师范大学学报(自然科学版)    2023, 2023 (2): 73-81.   DOI: 10.3969/j.issn.1000-5641.2023.02.009
    摘要209)   HTML11)    PDF (1015KB)(64)   

    大数据时代, 数据信息的不断膨胀给数据的快速存取带来了巨大挑战. 因此, 设计一种高效的索引结构具有重要意义. ALEX (updatable adaptive learned index)是一种利用机器学习模型代替传统B-树索引结构的学习索引, 具有较好的时间、空间性能, 但存在频繁的缺页中断问题. 为解决此问题, 进一步提升ALEX性能, 在ALEX基础上提出了一种基于大页内存的内存预分配策略, 较好地降低了内存缺页中断率, 提升了ALEX性能. 在内存分配阶段, 采用预分配策略; 在内存回收阶段, 则采用延迟释放策略. 在Longitudes数据集上的实验表明, 该策略具有良好的效果.

    图表 | 参考文献 | 相关文章 | 多维度评价
    基于遥感图像的虚拟地形仿真建模方法
    王泽华, 高岩, 陈敏刚
    华东师范大学学报(自然科学版)    2023, 2023 (2): 82-94.   DOI: 10.3969/j.issn.1000-5641.2023.02.010
    摘要303)   HTML13)    PDF (4124KB)(109)   

    传统虚拟地形建模通常采用基于人工设计的过程化生成方法, 无法满足军事仿真等需要对真实环境进行还原的仿真建模任务. 针对此类任务, 提出了一种基于遥感图像的虚拟地形仿真建模方法, 其核心是地形混合纹理生成网络(landscape blended texture generation network, LBTG-Net). 该方法利用地形混合纹理生成器(blended texture generator, BTG), 在风格鉴别器(style discriminator, SD)以及多级分类损失的约束下生成地形混合纹理贴图, 基于该混合纹理贴图生成结果对地形环境进行程序化构建. 该方法包含2个核心特点: ① 对输入遥感图像进行准确的地表覆盖类型分类, 以保证对输入遥感图像环境的还原; ② 生成高质量地形混合纹理贴图, 以提高虚拟地形建模质量. LBTG-Net使用Sentinel-2多光谱遥感图像数据集进行训练和验证. 实验结果表明, 该方法在各地表覆盖类型分类评价指标下均有良好表现, 能够在准确还原输入遥感图像的环境分布的同时完成高质量虚拟地形仿真建模.

    图表 | 参考文献 | 相关文章 | 多维度评价
    基于高重叠度视角的锁销点云模型的快速建立
    金志伟, 黄昶, 祝瑞红
    华东师范大学学报(自然科学版)    2023, 2023 (2): 95-105.   DOI: 10.3969/j.issn.1000-5641.2023.02.011
    摘要161)   HTML8)    PDF (2472KB)(73)   

    基于高重叠度视角, 提出了一种在集装箱码头针对锁销模型快速建立的三维点云拼接方法. 实验使用Azure Kinect深度相机采集场景点云, 并对点云进行预处理, 得到目标点云. 对于视角略微不同的锁销, 在采用采样一致性初始配准算法 (sample consensus initial algorithm, SAC-IA) 的基础上, 利用经典的迭代最近点 (iterative closest point, ICP)算法进行配准, 确定2片点云的重叠位置关系. 在总体拼接过程中, 用锁销在相机z方向投影的包围盒面积的相对大小, 来估计锁销的大体形状; 然后通过对比相邻视角该面积的差值, 选取数量合适的、重叠度较大的点云视角, 保证配准的正确率并减少耗时. 实验结果表明, 该方法对锁销的配准误差较低, 可以较快速地建立适用于类型匹配的工件模型.

    图表 | 参考文献 | 相关文章 | 多维度评价
    基于神经网络的行驶时长预测
    武朝阳, 毛嘉莉
    华东师范大学学报(自然科学版)    2023, 2023 (2): 106-118.   DOI: 10.3969/j.issn.1000-5641.2023.02.012
    摘要235)   HTML8)    PDF (1993KB)(154)   

    定位设备的普及产生了海量的车辆行驶数据, 使得利用历史数据预测车辆行驶时长成为可能. 车辆行驶数据由两部分组成: 车辆行驶经过的路段序列信息和出发时段; 路径总长度等外部信息. 如何提取路段序列特征, 以及如何将序列特征与外部特征有效地融合, 成为预测行驶时间的关键问题. 为解决以上问题, 提出了一个基于 Transformer 的行驶时间预测模型, 模型由路段序列处理模块和特征融合模块两部分组成. 首先, 路段序列处理模块使用自注意力机制处理路段序列, 提取路段序列特征. 该模型不但可以充分考虑各条路段与其他路段间道路速度的时空关联性, 同时可保证数据并行输入模型, 避免了使用循环神经网络时数据顺序输入导致的效率低下. 其次, 特征融合模块将路段序列特征与出发时段等外部信息相融合, 最终获得预测的行驶时长. 在此基础上, 统计路口连接的路段数作为路段的上/下游路口特征, 与路段特征结合输入模型, 进一步提升了行驶时长的预测精度. 在真实的数据集上与主流预测模型进行的对比实验表明, 该模型在预测精度以及训练速度上均有提升, 体现了所提模型的有效性.

    图表 | 参考文献 | 相关文章 | 多维度评价
    面向异常检测的时序数据库查询优化
    张帅, 胡卉芪, 徐尧强, 周烜
    华东师范大学学报(自然科学版)    2023, 2023 (2): 119-131.   DOI: 10.3969/j.issn.1000-5641.2023.02.013
    摘要283)   HTML15)    PDF (2279KB)(130)   

    随着物联网的发展, 大量传感器设备被接入网络, 这些设备所产生的数据的异常检测关系到系统服务的稳定性. 时序数据库是专门为时序数据优化的数据库系统. 作为监控系统的重要环节, 时序数据库担负着时序数据的管理和查询任务. 但目前时序数据库在处理多个数据源数据的查询上存在着延迟高、没有充分利用系统计算资源的缺点. 针对上述缺点, 基于InfluxDB, 重新设计了时序数据库的查询执行模型, 提出了InfluxDB-PP (parallel processing), 很好地解决了上述问题. 实验结果表明, InfluxDB-PP在实时数据异常查询场景下, 查询时延相较于InfluxDB降低了约85.7%.

    图表 | 参考文献 | 相关文章 | 多维度评价
    基于残差网络的配电柜设备元件状态识别
    张洋, 赖叶静, 黄定江
    华东师范大学学报(自然科学版)    2023, 2023 (2): 132-142.   DOI: 10.3969/j.issn.1000-5641.2023.02.014
    摘要166)   HTML11)    PDF (970KB)(64)   

    随着工业智能巡检的不断发展, 基于数字图像处理方法的设备元件状态识别系统被广泛应用. 为提升配电室中配电柜设备元件状态识别的准确率, 提出了一种基于残差网络(residual networks, ResNet)的设备元件状态识别方法. 首先搭建数据采集系统, 构建数据集; 然后对配电柜图像, 裁剪预设的设备元件目标区域, 生成设备元件图像; 对于设备元件图像, 构建基于ResNet的元件状态识别模型并训练; 使用训练完毕的模型识别元件的状态. 以变电站配电室中配电柜设备元件数据集作为研究对象, 对于特征复杂的元件采用单预测头的网络, 对于特征简单的元件采用多预测头的网络; 然后使用紧凑和剪枝的模型压缩方法在精度损失较小的情况下减少参数量和计算量; 最后介绍巡检系统的架构设计, 将JetSon Nano边缘终端作为算法模块的运行硬件, 以减少通信成本.

    图表 | 参考文献 | 相关文章 | 多维度评价
    基于基尔霍夫定律和布尔方程的故障定位算法
    鲁晓秋, 蔡阳, 陈佳俊, 周樨, 周雪茗, 唐赟喆, 黄定江
    华东师范大学学报(自然科学版)    2023, 2023 (2): 143-154.   DOI: 10.3969/j.issn.1000-5641.2023.02.015
    摘要182)   HTML8)    PDF (1422KB)(47)   

    随着我国电力系统的不断发展, 供电的安全性和可靠性直接影响着地区的生产生活和民众的经济生活. 电网故障定位是电力调度系统中重要的组成部分. 传统的故障定位需要依靠调度人员大量的经验积累和人工判断, 而面对日益增长的需求, 仅依靠传统方法进行故障定位会增加误判率, 进而对电力系统的稳定运行造成威胁. 提出了一种基于基尔霍夫定律和布尔方程的电网故障定位算法, 将故障定位问题转化为布尔线性混合规划问题, 并结合模拟退火算法和遗传算法的思想进行求解, 实现了在小型电网中的故障快速定位, 有效降低了调度错误率, 缩短了从故障发生到故障隔离、故障处理的时间差, 节约了人力资源, 提高了调度效率.

    图表 | 参考文献 | 相关文章 | 多维度评价
    基于学习者知识和性格的个性化课程推荐
    班启敏, 吴雯, 胡文心, 林晖, 郑巍, 贺樑
    华东师范大学学报(自然科学版)    2022, 2022 (6): 87-101.   DOI: 10.3969/j.issn.1000-5641.2022.06.010
    摘要400)   HTML7)    PDF (1363KB)(145)   

    自适应学习是使用计算机算法来协调自适应学习平台与学习者的互动, 并提供定制学习资源和学习活动来解决每位学习者的独特需求的教育方法. 自适应学习随着新冠疫情的影响变得越来越重要, 它面临的主要挑战之一是如何为学习者提供定制的学习资源, 即如何在海量的学习资源中为学习者生成个性化的推荐. 现存的方法大多使用基于学习者知识级别的推荐, 然而这些方法存在一些不足. 首先, 在获取学习者知识级别时, 学习者在学习过程中出现的遗忘现象并未得到很好的建模. 其次, 在推荐时, 这些方法将获取学习者知识级别的知识追踪技术和推荐分开进行, 忽视了这两者之间的深层连接关系. 此外, 仅考虑学习者的知识来建模, 将会忽略学习者对于学习资源类型、学习策略等的偏好. 为解决上述问题, 给出了一个知识和性格结合的多任务学习框架(Knowledge and Personality Incorporated Multi-Task Learning Framework, KPM)去促进课程 (即上文所指的学习资源) 的推荐, 该框架将增强的知识追踪任务作为辅助任务去协助主要的课程推荐任务. 具体地, 在增强的知识追踪任务(Enhanced Knowledge Tracing Task, EKTT)中, 设计了一个个性化的遗忘控制器去增强深度知识追踪模型, 从而更加准确地获取学习者的知识级别. 在课程推荐任务(Course Recommendation Task, CRT)中, 首先, 将学习者的知识级别、学习者的序列行为和学习者的性格根据特定的上下文进行自适应融合, 用以生成学习者的画像; 然后, 基于学习者的画像生成课程推荐列表. 在真实的教育相关数据集上的实验结果验证了提出的方法在点击率(Hit Ratio, HR)、归一化折损累计增益(Normalized Discounted Cumulative Gain, NDCG)、精确度(Precision)指标上的优越性, 即可以生成更加个性化的课程推荐.

    图表 | 参考文献 | 相关文章 | 多维度评价
    基于影响函数的远程监督关系抽取
    黄子寅, 吴苑斌
    华东师范大学学报(自然科学版)    2022, 2022 (6): 79-86.   DOI: 10.3969/j.issn.1000-5641.2022.06.009
    摘要230)   HTML7)    PDF (809KB)(113)   

    远程监督的标注方法在关系抽取任务中被广泛应用, 其在减小人工标注负担的同时, 也引入了大量噪声样本, 影响了模型的训练. 针对这个问题, 提出了一种基于影响函数的去噪方法. 通过影响函数衡量训练集中每一条训练样本对模型预测的影响, 并在建立噪声样本与其的关系后, 设计了1个判断样本是否是错误标注的打分函数. 基于此打分函数的值, 从初始的1个小的无噪声集合出发, 通过自举法迭代式地获得最后的去噪数据集. 该去噪方法作为一种对数据的前处理方法, 在公开数据集上取得了良好的效果.

    图表 | 参考文献 | 相关文章 | 多维度评价
    基于堆叠门控循环单元残差网络的知识追踪模型研究
    黄彩蝶, 王昕萍, 陈良育, 刘勇
    华东师范大学学报(自然科学版)    2022, 2022 (6): 68-78.   DOI: 10.3969/j.issn.1000-5641.2022.06.008
    摘要343)   HTML8)    PDF (1600KB)(165)   

    知识追踪任务是根据学生历史做题记录和其他辅助信息追踪学生知识水平的变化过程, 以及预测学生在下一时刻作答的结果. 由于已有的神经网络知识追踪模型在效果和性能上还有待提升, 提出了基于堆叠门控循环单元(Gated Recurrent Unit, GRU)的深度残差(Stacked-Gated Recurrent Unit-Residual, S-GRU-R)网络. 针对长短期记忆网络(Long Short-term Memory, LSTM)参数过多导致过拟合问题, 用GRU代替LSTM学习做题序列中的信息, 采用堆叠GRU扩大序列学习容量, 并用残差连接降低模型训练的难度. S-GRU-R在数据集Statics2011上进行了实验, 并用AUC (Area Under the Curve)和F1-score作为评估指标. 结果表明S-GRU-R在这2个评估指标上都超过了其他类似的循环神经网络模型.

    图表 | 参考文献 | 相关文章 | 多维度评价