新型互联网应用技术 栏目所有文章列表

    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    基于分布式平台Spark的空间文本查询分析
    徐阳, 王志杰, 钱诗友
    华东师范大学学报(自然科学版)    2018, 2018 (5): 120-134,153.   DOI: 10.3969/j.issn.1000-5641.2018.05.010
    摘要291)   HTML9)    PDF (1180KB)(477)   
    随着基于位置服务应用的不断推广,空间文本数据查询的应用价值(例如结合地理位置和用户标签的社交推荐)也在不断提高.但是,随着数据规模的迅速增长,传统的基于单机环境实现的技术难以为用户提供低延时和高吞吐量的服务.为此,本文基于Spark平台对分布式环境下的空间文本查询算法进行了探究.采用了面向海量空间文本数据的两层索引框架(包括全局索引和局部索引),该框架利用了分阶段过滤的策略来处理分布式下的布尔范围查询问题.同时,针对空间文本相似连接提出了Prefix-RI结构并提出了相应的分布式算法.基于Spark平台实现了所提出的分布式算法,并通过大量的实验对比验证了所提出方法的优越性.
    参考文献 | 相关文章 | 多维度评价
    基于区块链的智能电表身份认证方案
    田福粮, 田秀霞, 陈希
    华东师范大学学报(自然科学版)    2018, 2018 (5): 135-143,171.   DOI: 10.3969/j.issn.1000-5641.2018.05.011
    摘要557)   HTML93)    PDF (1326KB)(529)   
    能源互联网是未来发展的趋势,能够实现电力资源在用户和能源系统中的双向流通.智能电表作为连接用户和能源系统的关键点,具有用户身份信息和大量有效的电力交易数据,而这些信息会造成用户隐私泄露.为保护用户隐私,提出了基于区块链的智能电表身份认证方案,利用Merkle树原理对智能电表身份信息进行处理并存储在区块链中,实现智能电表身份有效认证的同时,使智能电表身份信息具有不可篡改性,并破坏了用户身份和电力数据之间的可关联性,能够有效抵御内部和外部攻击者获取用户隐私.通过利用区块链的自身特性,保证了交易数据的完整性和有效性.
    参考文献 | 相关文章 | 多维度评价
    基于区块链的仓单管理系统
    齐学成, 朱燕超, 邵奇峰, 张召, 金澈清
    华东师范大学学报(自然科学版)    2018, 2018 (5): 144-153.   DOI: 10.3969/j.issn.1000-5641.2018.05.012
    摘要1312)   HTML121)    PDF (2297KB)(771)   
    在当前的电子仓单业务中,仓单真实性需要第三方机构背书.但机构失信导致重复质押事件时常发生,这给国家造成了巨大损失;而且数据采用集中管理方式,不公开,商品溯源困难.为了解决这两个问题,利用区块链系统高度透明、去中心化、去信任化、不可篡改的特点,设计实现了基于区块链的仓单管理系统,确保了标的仓单的准确性和真实性.在此基础上,在区块链系统上构建了倒排索引,提高了查询效率,且支持复杂查询;同时,实现了基于表述性状态传递(RepresentationalState Transfer,REST)的微服务架构,为多方接入提供了灵活接口,也为企业已有系统的集成及Web端、移动端的实现提供了支持.
    参考文献 | 相关文章 | 多维度评价
    Levenshtein算法优化及在题库判重中的应用
    张衡, 陈良育
    华东师范大学学报(自然科学版)    2018, 2018 (5): 154-163.   DOI: 10.3969/j.issn.1000-5641.2018.05.013
    摘要395)   HTML12)    PDF (1017KB)(434)   
    为了解决Levenshtein距离算法在长文本和大规模匹配效率的不足,本文针对Levenshtein距离算法提出一种提前终止的优化策略.首先根据Levenshtein距离矩阵中元素内在的联系,归纳总结出一个递推关系式.再依据此递推关系式,提出一种提前终止策略,可提前判断两个文本是否满足预先设定的相似度阈值.经过多个学科题库判重实验的佐证,本文的提前终止策略能显著减少计算时间.
    参考文献 | 相关文章 | 多维度评价
    一种基于K-Means的平衡约束聚类算法
    唐海波, 林煜明, 李优
    华东师范大学学报(自然科学版)    2018, 2018 (5): 164-171.   DOI: 10.3969/j.issn.1000-5641.2018.05.014
    摘要384)   HTML13)    PDF (932KB)(547)   
    聚类是一种重要数据分析技术,在众多领域中得到广泛地应用.然而,由于数据分布的内在特点,传统的聚类算法并不能保证聚类结果具有平衡性,这与很多现实的需求不一致.本文提出了一种基于K-Means的平衡约束聚类算法,该算法对K-Means算法每次迭代中数据点的分配策略进行修改,达到对每个簇可包含的数据点数目上限进行约束的目的.同时,算法支持用户自定义簇可包含的数据点数目上限,满足不同的平衡约束聚类需求.另外,本算法参数少,只需设置目标簇数目及其可包含的数据点数目上限,时间复杂度低,具有简单、快速的特点.在6个UCI(University of CaliforniaIrvine)真实数据集上进行的实验结果表明,文中提出的平衡约束聚类算法相比其他平衡约束聚类算法具有更佳的聚类效果和时间性能.
    参考文献 | 相关文章 | 多维度评价
    基于深度哈希学习的商标图像检索研究
    袁培森, 张勇, 李美玲, 顾兴健
    华东师范大学学报(自然科学版)    2018, 2018 (5): 172-182.   DOI: 10.3969/j.issn.1000-5641.2018.05.015
    摘要498)   HTML90)    PDF (1654KB)(585)   
    大规模图像检索具有广泛的应用前景,其核心在于图像特征提取和高效相似性计算.深度学习技术在图像特征提取具有较强的特征表示能力,同时哈希技术在高维数据近似计算方面具有较好的性能.目前,基于哈希学习的技术在大规模图像检索及相似性查询方面获得了广泛的研究和应用.本文结合卷积神经网络和哈希技术实现商标图像检索,通过深度学习技术提取商标图像特征,使用位哈希对数据对象编码,在海明空间折中查询的质量和效率.基于卷积神经网络模型,提出了深度哈希算法,并研究了损失函数和该数据集上的优化器选择,通过获取符合哈希编码规范的位编码实现对在二元空间对商标图像数据快速检索,该方法分为离线深度哈希学习和在线查询两个阶段.在真实商标数据集上进行实验,实验结果表明,本文方法能够在商标数据集上获得较高质量的位编码,并具有较高的检索精确度和在线查询效率.
    参考文献 | 相关文章 | 多维度评价
    基于知识图谱和LDA模型的社会媒体数据抽取
    麻友, 岳昆, 张子辰, 王笑一, 郭建斌
    华东师范大学学报(自然科学版)    2018, 2018 (5): 183-194.   DOI: 10.3969/j.issn.1000-5641.2018.05.016
    摘要442)   HTML20)    PDF (1117KB)(655)   
    社会媒体数据的抽取,是社会舆论集散、新闻信息传播、企业品牌推广、商业营销拓展等研究和应用的基础,准确的抽取结果是数据分析有效性的重要保证.本文针对社会媒体数据的非结构、多主题特征,基于LDA(Latent DirichletAllocation)模型挖掘数据中的隐含主题,利用数据特征词序列和知识图谱描述的实体及实体间的关联关系,实现对特定领域数据的抽取.建立在"今日头条"新闻数据和新浪微博数据之上的实验结果表明,本文提出的方法能有效地实现社会媒体数据的抽取.
    参考文献 | 相关文章 | 多维度评价