专辑导语 栏目所有文章列表

    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    “‘智能+’与数据驱动的科学研究”专辑导语
    华东师范大学学报(自然科学版)    2019, 2019 (5): 0-0.  
    摘要124)   HTML288)    PDF (276KB)(127)   
    数据密集型的科学发现已成为继实证范式、理论范式、计算范式后科学发现的“第四范式”,其在物理、化学、生物、天文等自然科学领域,乃至社会学、教育学、新闻传媒、法律等人文社会科学领域的研究中,发挥着越来越大的作用。近年来,人工智能在图像、视频、语音识别,以及人机对弈等领域的技术突破,进一步为数据驱动的科学研究提供了新的技术和方法。人工智能技术作用于科学研究,可充分发挥文献、实验、仿真结果等各种类型科学数据的价值:发现新的科学现象、揭示新的科学规律、验证科学假设、促进不同领域科学研究的交叉融合、探索科学研究的新方法和新思路,这对提升科学研究水平,取得突破性的研究成果,具有重要意义。
    本期专辑围绕“‘智能+’与数据驱动的科学研究”这个主题,在全国范围内征集稿件,受到了学术界的广泛关注,经过专辑编委会专家们的认真评阅,总共收录16篇高质量学术论文,分别来自国内11个高校和科研院所,包括东北大学、桂林电子科技大学、华东理工大学、华东师范大学、南京农业大学、南瑞集团、上海电力大学、四川大学、同济大学、中国人民大学、中山大学等。根据主题的不同,上述论文被划分为3个板块:数据驱动的计算教育学、新兴应用中的计算机智能、新时期数据管理技术。
    互联网在改变世界的同时也深刻地改变着教育,利用信息技术优化教育过程、提升教学效果显得非常重要。数据驱动的计算教育学板块共收录5篇稿件:东北大学刘恒宇等人介绍了知识追踪及其应用背景,回顾了知识追踪所涉及的教育学与数据挖掘理论,总结了基于概率图、矩阵分解、深度学习的知识追踪研究现状,并展望未来的研究方向;华东师范大学陈远哲等人归纳梳理了共指消解的发展历程,从技术层面将共指消解划分为多个阶段,并介绍了各个阶段的代表性模型,以及它们的优缺点;华东师范大学杨康等人意识到机器阅读理解是理解学生问题和文档内容、快速获取知识的重要途径,综述了新近涌现出来的基于神经网络的机器阅读模型;华东师范大学杨东明等人基于百科语料和远程监督思想提出了基于关系表示的注意力机制,有效提取知识点间的有向关系信息;四川大学申航杰等人提出了一种融合模糊聚类和支持向量回归的成绩预测方法,即先引入模糊逻辑来计算隶属度矩阵,再对学生历史成绩进行聚类,最后对成绩轨迹进行拟合建模,从而提高成绩预测的准确率和可解释性。
    除了教育之外,计算机智能也广泛应用在法学、智慧城市、电子商务、智能电网等领域。新兴应用中的计算机智能板块共收录6篇稿件:中国人民大学邵明锐等人意识到FAQ数据集规模有限,给出了数据层面和模型层面的解决方案,在数据层面,利用百度知道爬取数据并挖掘语义等价问题,确保数据的相关性和一致性,在模型层面,提出了面向迁移学习的深度神经网络,以计算句子对之间的语义相似度;同济大学陈亮等人意识到在法学理论和法律实践中缺乏智能决策,采用多种数据分析模型研究智能决策算法,尝试建立法律关系坐标系,实现法律关系分析的空间几何转化;中山大学江群等人研究了基于用户偏好的最优路径搜索,从而在预算约束下寻找满足用户偏好的最优路径,所提的新方法可在查询阶段利用索引结构过滤出候选节点集;桂林电子科技大学傅裕等人观察到在电子商务领域中部分商品的名称可能包含属性等冗余信息,导致信息不一致现象,因而提出了一种基于自注意力机制的商品名称精简模型,以较小的计算代价精简商品名称;南瑞集团黄福兴等人认识到保证海量电能量数据的准确性、可靠性和完整性对智能电网至关重要,设计了一种基于孤立森林的异常检测算法,可检测大规模电能量数据中发生的异常;上海电力大学赵波等人基于机器学习方法,提出了一种优化神经网络的电网稳定性预测模型,并与经典机器学习方法进行了横向对比。
    创新的数据管理技术对高效管理海量数据非常关键。新时期数据管理技术板块共收录5篇稿件,作者均来自华东师范大学:丁国浩等人为了支持负载均衡的数据加载,采用选取部分采样块和等间隔选取样本的方式来确定分区之间的切分点,避免了全局采样和随机或头部样本选取方式确定切分点带来的高开销;刘子豪等人意识到LevelDB数据库具有Key-Value结构的局限性,因而无法有效索引空间数据,提出了一种基于LevelDB和R-tree的二级索引,从而支持二维数据的索引和近邻查询,实验结果表明该结构效果良好;祝朝凡等人发现基本的Paxos算法尽管在理论上保证了一致性,但是依然容易产生活锁问题,而且不易工程化,因而提出了一种改进算法,有效降低了网络通信开销;黄皓等人提出了一种基于GPU的流处理系统Serval,通过充分利用CPU-GPU异构资源,高效处理了关系型流查询;张涛等人意识到标准Benchmark负载固定,较难应对用户多样的应用场景,因而设计并实现了一个用户自定义性能测试负载的工具——Woodpecker+,该工具易于使用和可拓展,提供了可高效构造测试案例、做测试安排的测试定义语言(TDL),可灵活控制事务执行模式及数据访问分布,实现了轻量级的细粒度统计信息收集与分析,支持多种主流数据库系统DBMS及提供数据库访问接口的其他数据库。
    最后,谨在此感谢各位作者为专辑提供了优质的稿源,感谢各位评审专家,特别感谢我校学报编辑部自然科学版在收稿、审稿、校稿过程中的大力支持和辛勤工作。“智能+”与数据驱动的科学研究在许多领域中都有重要应用,希望本期专辑能够推动相关领域的研究进展和应用实施。
    相关文章 | 多维度评价
    “新型互联网应用中的数据管理技术”专辑导语
    华东师范大学学报(自然科学版)    2018, 2018 (5): 1-2.  
    摘要205)   HTML167)    PDF (266KB)(1222)   
    互联网的飞速发展正在深刻影响着社会和经济的方方面面。从搜索引擎到电子商务、从在线广告到即时消息、从数字娱乐到在线教育、从移动支付到分享经济,互联网应用已经改变了我们的娱乐、社交、购物、物流、出行、支付等等方面,并对金融、电信、制造、能源、零售等行业的变革产生了深远影响。数据是行业变革的动力来源。传感器和终端技术的发展使得数据收集更为便捷;通信网络技术的进步使得数据传输更加廉价、快速;新兴存储介质和设备的出现不仅降低了数据存储成本,还极大提升了数据访问性能。上述技术的进步使得数据资源被快速累积起来。海量数据资源的管理、分析和应用是企业和机构提升核心竞争力、服务水平和政府提高治理水平的关键之处。在教育、金融、电信、政府治理等领域,亟需高可用、高可靠、高性能的数据管理技术和系统功能来管理海量、多源、异构、分布数据。
    本期专辑围绕“新型互联网应用中的数据管理技术”这个主题,在全国范围内征集稿件,受到了学术界的广泛关注。经过专辑编委员会的认真评阅,共收录了16篇高质量学术论文。这些稿件分别来自国内6个高校,包括上海交通大学、云南大学、桂林电子科技大学、南京农业大学、上海电力学院、华东师范大学等。根据主题不同,将这些论文划分为3个类别:综述论文(4篇)、高性能数据库管理(5篇)、新型互联网应用技术(7篇)。
    4篇综述论文分别从不同角度回顾了各研究领域的现有工作,并展望未来。余若男等人认识到场景文字检测问题深受目标检测和图像分割算法发展的影响,介绍了近年来场景文字检测工作进展,比较分析了各算法的优点及不足,并总结了相关的基准数据集和评价方法;汤路民等人列举了非干预式感知的个性化学业求助资源推荐研究状况,并展望了未来研究方向,包括学业求助非干预式感知、学业求助多源异构数据分析,以及学业求助资源个性化推荐方法;涂云山等人综述了面向新硬件的数据处理软件技术,从计算、传输、存储这3个方面讨论了面向新型硬件的数据处理软件技术,梳理和分析了相关工作,总结概述了已取得的进展,分析了存在的问题和挑战;李娜等人综述了在异构网络中的实体匹配技术的研究现状与进展,特别是针对海量数据的可扩展实体匹配方法,包括运用监督学习和非监督学习这两类技术。
    5篇关于高性能数据库管理的论文分别从查询、存储、分布式协议、系统等角度开展研究。徐石磊等人研究了OLAP应用中常见的分组聚合问题,根据分布式数据库多副本的特点提出了并行实现方案,并在开源数据库系统上得以实现;俞文谦等人认识到列存储技术能够有效提高I/O效率、优化分析处理性能,提出了一种面向Cedar系统的列存储机制,分析了其适用场景并针对这种机制改进了Cedar的数据扫描和批量更新方法;黄建伟等人认识到在分布式和并发的环境中实现主键维护功能还要面临主键唯一性约束、事务性维护、高处理性能的挑战,提出了一种在分布式日志结构数据库系统中高效维护主键的方法;赵春扬等人详细介绍了经典的分布式一致性协议以及在目前常见的几种分布式数据库系统中一致性协议的应用,从读写操作、节点类型与网络通信等方面进行了对比与分析;贺小龙等人认识到在高性能硬件上重新设计与实现事务型数据库系统的重要性,介绍了在大内存、多核环境下事务型数据库系统的新近研究工作,并结合开源数据库系统OceanBase介绍了新型OLTP系统的设计方案。
    7篇关于新型互联网应用技术的论文中,徐阳等人认识到在基于位置服务应用中将会产生海量空间文本数据,提出了基于Spark的两层索引框架,采用分阶段过滤的策略来处理空间文本查询,执行性能较高;田福粮等人提出了一个基于区块链的智能电表身份认证方案,保证了交易的完整性和有效性;齐学成等人设计实现了基于区块链的仓单管理系统,确保标的仓单的准确性和真实性,该系统构建倒排索引以提高查询效率,且支持复杂查询;张衡等人提出了一种提前终止策略,可提前判断两个文本是否满足预先设定的相似度阈值,将该技术应用到题库判重应用中能够显著减少计算时间;唐海波等人提出了一种基于K-Means的平衡约束聚类算法,修改了K-Means算法每次迭代中数据点的分配策略,从而可对每个簇可包含的数据点数目上限进行约束;袁培森等人提出了一个深度哈希算法,通过获取符合哈希编码规范的位编码实现对商标图像数据快速检索;麻友等人针对社会媒体数据的非结构、多主题特征,基于LDA模型挖掘数据中的隐含主题,利用数据特征词序列和知识图谱描述的实体及实体间的关联关系,实现对特定领域数据的抽取。
    最后,谨在此感谢各位作者为专辑提供优质稿源,感谢各位评审专家,特别感谢华东师范大学学报编辑部自然科学版各位老师在收稿、审稿、校稿过程中的大力支持和辛勤工作。新型互联网应用是大数据应用领域的重要组成部分,希望本专辑能为新型互联网应用中的数据管理问题、研究进展和技术发展趋势等提供一个技术窗口,推动相关领域的研究进展和应用实施。
    相关文章 | 多维度评价