大数据分析 栏目所有文章列表

    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    基于神经网络语言模型的分布式词向量研究进展
    郁可人, 傅云斌, 董启文
    华东师范大学学报(自然科学版)    2017, 2017 (5): 52-65,79.   DOI: 10.3969/j.issn.1000-5641.2017.05.006
    摘要488)   HTML20)    PDF (515KB)(1474)   
    单词向量化是自然语言处理领域中的重要研究课题之一,其核心是对文本中的单词建模,用一个较低维的向量来表征每个单词.生成词向量的方式有很多,目前性能最佳的是基于神经网络语言模型生成的分布式词向量,Google公司在2012年推出的Word2vec开源工具就是其中之一.分布式词向量已被应用于聚类、命名实体识别、词性分析等自然语言处理任务中,它的性能依赖于神经网络语言模型本身的性能,并与语言模型处理的具体任务有关.本文从三个方面介绍基于神经网络的分布式词向量,包括:经典神经网络语言模型的构建方法;对语言模型中存在的多分类问题的优化方法;如何利用辅助结构训练词向量.
    参考文献 | 相关文章 | 多维度评价
    基于卷积神经网络的自动问答
    金丽娇, 傅云斌, 董启文
    华东师范大学学报(自然科学版)    2017, 2017 (5): 66-79.   DOI: 10.3969/j.issn.1000-5641.2017.05.007
    摘要418)   HTML15)    PDF (707KB)(831)   
    自动问答是自然语言处理领域中的一个研究热点,自动问答系统能够用简短、精确的答案直接回答用户提出的问题,给用户提供更加精确的信息服务.自动问答系统中需解决两个关键问题:一是实现自然语言问句及答案的语义表示,另一个是实现问句及答案间的语义匹配.卷积神经网络是一种经典的深层网络结构,近年来卷积神经网络在自然语言处理领域表现出强大的语言表示能力,被广泛应用于自动问答领域中.本文对基于卷积神经网络的自动问答技术进行了梳理和总结,从语义表示和语义匹配两个主要角度分别对面向知识库和面向文本的问答技术进行了归纳,并指出了当前的研究难点.
    参考文献 | 相关文章 | 多维度评价
    在线广告中点击率预测研究
    肖垚, 毕军芳, 韩易, 董启文
    华东师范大学学报(自然科学版)    2017, 2017 (5): 80-86,100.   DOI: 10.3969/j.issn.1000-5641.2017.05.008
    摘要749)   HTML31)    PDF (548KB)(697)   
    随着互联网的发展和用户的增长,广告行业从传统的线下广告模式,逐步转变为线上广告模式.同时,由于大数据分析技术的运用,线上广告模式相比于传统广告也体现了巨大的优越性.广告主之间相互竞争,通过竞价的方式,将自己的广告投放在运营媒体的广告位上.所以,在投放前预测该广告可能被用户点击的概率(CTR),对于广告主减少成本和增加可能收入来说非常重要.本文在调研了目前常用的广告点击率预测模型的基础上,选取广告主、广告和投放媒体平台信息作为预测模型的特征,采用真实数据集验证说明各种模型的优劣性,以及不同特征对广告点击率预测结果的影响.
    参考文献 | 相关文章 | 多维度评价
    面向智能电表隐私保护的电量请求方案
    田秀霞, 李丽莎, 赵传强, 田福粮, 宋谦
    华东师范大学学报(自然科学版)    2017, 2017 (5): 87-100.   DOI: 10.3969/j.issn.1000-5641.2017.05.009
    摘要402)   HTML12)    PDF (781KB)(584)   
    运通过有效融合Shamir(t,n)门限密钥共享方案和Laplace噪音干扰算法提出了一种面向智能电表隐私保护的电量请求方案,实现电力公司分时电价计费的同时保护用户隐私.定量分析了安全性并确定了最优门限值t的选择、测试分析了时间效率、验证分析了Laplace噪音干扰的ε-差分隐私保护效果并作了方案的可行性比较.实验结果表明,提出的方案具有有效性和可行性.
    参考文献 | 相关文章 | 多维度评价