计算机科学

基于演化算法的唐诗自动生成系统研究

  • 穆肇南 ,
  • 刘梦珠 ,
  • 孙界平 ,
  • 王成
展开
  • 1. 贵州商学院 计算机与信息工程学院, 贵阳 550014;
    2. 四川大学 计算机学院, 成都 610207;
    3. 广州汇智通信技术有限公司, 广州 510630
穆肇南, 男, 教授, 研究方向为数据挖掘. E-mail: 201510249@gzcc.edu.cn

收稿日期: 2019-08-27

  网络出版日期: 2020-12-01

基金资助

贵州省普通高等学校科技拔尖人才支持计划(黔教合KY字〔2016〕086); 贵州省教育厅青年科技人才成长项目(黔教合KY字〔2018〕274); 贵州商学院院级课题(2019YJJGXM08)

Research on a Tang Poetry automatic generation system based on an evolutionary algorithm

  • MU Zhaonan ,
  • LIU Mengzhu ,
  • SUN Jieping ,
  • WANG Cheng
Expand
  • 1. College of Computer and Information Engineering, Guizhou University of Commerce, Guiyang 550014, China;
    2. College of Computer Science, Sichuan University, Chengdu 610207, China;
    3. Guangzhou Huizhi Communication Technology Co., Ltd, Guangzhou 510630, China

Received date: 2019-08-27

  Online published: 2020-12-01

摘要

针对基于演化算法的唐诗自动生成系统展开研究. 研究工作主要有: 使用GloVe(Global Vectors for Word Representation)模型训练词向量, 设计了基于关键词和平仄押韵的初始种群方案、基于语法语义加权值的适应度函数、基于锦标赛算法的选择策略、基于启发式交叉算子和启发式变异算子的演化算法; 给出了基于演化算法的唐诗自动生成模型及系统实现. 实验表明, 根据给定关键词, 该系统初步实现了唐诗的自动生成, 生成的唐诗经人工修改后具有一定的欣赏价值.

本文引用格式

穆肇南 , 刘梦珠 , 孙界平 , 王成 . 基于演化算法的唐诗自动生成系统研究[J]. 华东师范大学学报(自然科学版), 2020 , 2020(6) : 129 -139 . DOI: 10.3969/j.issn.1000-5641.201921017

Abstract

In this paper, research on an automatic generation algorithm for Tang poetry, one of the poetry genres, is carried out. The research work consists of the GloVe(Global Vectors for Word Representation) model to train-word vectors, an initial population scheme based on keywords and peaceful rhymes, a fitness function for grammatical and semantic weights, and a selection strategy used in tournament algorithms; the latter includes heuristic crossover and heuristic mutation operators as well as automatic generation of Tang poetry based on an evolutionary algorithm. Experiments show that by providing keywords the established model and system can achieve the initial goal for automatic generation of Tang poems. After manual modification, the proposed system can generate valuable and appreciable Tang poems.

参考文献

[1] 张建华, 陈家骏. 自然语言生成综述 [J]. 计算机应用研究, 2006, 23(8): 1-3, 13
[2] CHENG W F, WU C C, SONG R H, et al. Image inspired poetry generation in XiaoIce[EB/OL]. (2018-08-09)[2019-06-20]. https://arxiv.org/pdf/1808.03090.pdf.
[3] YU L T, ZHANG W N, WANG J, et al. SeqGAN: Sequence generative adversarial nets with policy gradient[EB/OL]. (2017-08-25)[2019-06-20]. https://arxiv.org/pdf/1609.05473.pdf.
[4] 游维. 基于遗传算法的宋词自动生成研究 [D]. 福建 厦门: 厦门大学, 2007.
[5] 周昌乐, 游维, 丁晓君. 一种宋词自动生成的遗传算法及其机器实现 [J]. 软件学报, 2010, 21(3): 427-437
[6] 曹卫华. 基于进化策略的仿唐诗自动生成系统 [D]. 广州: 广东工业大学, 2011.
[7] 穗志方, 俞士汶, 罗凤珠. 宋代名家诗自动注音研究及系统实现 [J]. 中文信息学报, 1998, 12(2): 44-53
[8] 冯思齐, 吕钢. 利用RNN模型生成中国古典诗歌 [J]. 通讯世界, 2018(2): 361-363
[9] 刘铮扬. 基于深度学习的中国诗歌自动生成算法研究 [D]. 长沙: 湖南师范大学, 2018.
[10] 潘正君, 康立山, 陈毓屏. 演化算法 [M]. 北京:清华大学出版社,1998.
[11] 彭定求, 沈三曾, 杨中讷, 等. 全唐诗 [M]. 北京: 中华书局, 2018.
[12] MITCHELL M. An Introduction to Genetic Algorithms [M]. Cambridge: MIT Press, 1998.
[13] 葛继科, 邱玉辉, 吴春明, 等. 遗传算法研究综述 [J]. 计算机应用研究, 2008, 25(10): 2911-2916
[14] 俞士汶, 段慧明, 朱学锋, 等. 北京大学现代汉语语料库基本加工规范 [J]. 中文信息学报, 2002, 16(5): 46-64
[15] 张忠纲. 全唐诗大辞典 [M]. 北京: 语文出版社, 2000.
[16] 朱武. 基于种群自适应策略的差分演化算法及其应用研究 [D]. 上海: 东华大学, 2013.
[17] 叶汝骏. 论唐代的仄韵五律—兼论仄韵律诗的归属问题 [J]. 武陵学刊, 2017, 42(3): 91-95
[18] 张冬茉, 葛永, 姚天昉. 多语种自然语言生成系统中的预映射句子规划器[D]. 北京: 北京大学, 2004
[19] 胡俊峰, 俞士汶. 唐宋始中词汇语义相似度的统计分析及应用 [J]. 中文信息学报, 2002, 16(4): 39-44
[20] 易勇. 计算机辅助诗词创作中的风格辨析及联语应对研究 [D]. 重庆: 重庆大学, 2005.
文章导航

/