注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

江南仅存的文职老帅

我转

 
 
 

日志

 
 

电脑程序创作的诗作为什么如此让人震撼  

2017-04-16 16:47:26|  分类: 科学观 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
    当围棋人工智能程序阿尔法狗战胜代表真人选手出战的韩国超一流国手李世石后,引起世界关注和轰动。就连从不下围棋也不关心围棋的人,也觉得人工智能技术发展之快,足以让人震惊。
    但是,也有的人从另一方面否认电脑程序比人的智力更高。他们认为,搜索信息、超大规模高速计算和迅速抉择是电脑程序的强项,一般的人难以与之抗衡,可是电脑在属于人的情感与审美领域的文艺创作方面,就远远不如人类了。
    继阿尔法狗大胜李世石后,近日人工智能技术开发的电脑程序在文艺创作领域又有惊人之举,这让一些人会觉得更加难以置信。
    看看下列的诗作:

      1、早梅

     春信香深雪, 冰肌瘦骨绝。
     梅花不可知, 何处东风约。

     2、海棠花

     红霞淡艳媚妆水, 万朵千峰映碧垂。
     一夜东风吹雨过, 满城春色在天辉。

     3、镜

     照影金精映,钗头角黍青。
     白发红袖下, 明月满庭清。

     4、云峰

     入屏出岫势峰拔, 万里云霄一寸崖。
     千古洞天无处觅, 空留松鹤伴寒鸦。

      5、早梅

     春莺早遣香寒薄,雨后风吹柳絮多。
     一夜东窗红树里, 梦魂犹有月明泊。

      6、磬

     蓝田泾水绕瀛洲, 万里沧波一钓舟。
     此去不知人在否, 白云深处有仙楼。

     7、画松

     孤耐凌节护,根枝木落无。
     寒花影里月,独照一灯枯。

     8、夏雨

     雷霆池绿暑云色, 雨洗寒天一夜何。
     万里千峰无限好, 不知人在水晶河。

     9、落花

     红湿胭艳逐零蓬, 一片春风细雨濛。
     燕子不知无处去, 东流犹有杜鹃声。

     10、春雪

     飞花轻洒雪欺红, 雨后春风细柳工。
     一夜东君无限恨, 不知何处觅青松。

    如果不告诉这是谁写的诗,你会相信这是电脑程序创作的吗?而它们真的是人工智能技术研发的程序自动创作出来的诗作。
    3月20日(2016年),清华大学语音与语言实验中心(CSLT)网站宣布,他们的作诗机器人“薇薇”通过社科院等唐诗专家评定,通过了“图灵测试”。所谓“图灵测试”,是指通过对话分辨真实人类和人工智能的试验,通过了“图灵测试”就意味着人类无法通过语言对话分辨出人类和人工智能。据CSLT网站公布的结果,“薇薇”创作的诗词中,有31%被认为是人创作的。不过,在本次比赛中,“薇薇”创作古诗的水平还是未能超越现代人类诗人,双方的比分为2.72:3.20(满分5分)。
    尽管这些电脑程序创作的诗作还不够完美,有的甚至都不押韵,有的在意境或者与诗题的贴切上还有瑕疵,但是就整体水平来说,已经达到较高的水准。读了这些电脑创作的诗词,让人感到相当的惊愕。
    学习格律诗词的人,都要走模仿前人作品的必由之路。而历代的诗词作品,也的确有着一定的规律可循,例如用韵和用字。电脑程序具有广泛搜索信息和根据一定的要求自动加以处理的能力,一旦电脑从古代数十万首诗词作品中找到了相应的规律,例如使用哪些韵律和哪些常用文字,就会迅速从巨量的诗词作品中自动加以筛选,重新排列组合,按照格律诗的格律,形成规定的字数、规定的平仄以及符合韵律要求的韵脚字。而这些重新组合而成的新诗词作品,看起来就会像是真人写的一般,让人读后叹为观止。
    但是,这样一来,问题也就产生了。
    电脑技术的发展是无止境的,对文字的处理能力就是无限提高的,而古代的诗词作品却是数量有限的,一般常见的或者刊刻入集的总数也到不了上百万首。以无限对有限,一旦人工智能技术破译了诗词创作的“密码”,从古今大量诗词作品中找到了一定的用韵与用字规律,那么电脑借鉴这些诗词作品进行再创作,就应该不是很困难的。而当电脑创作出无数的类似李杜苏辛风格的诗词作品时,我们又该如何面对和评价呢?
    还有一个让人惊叹的现象,就是如今懂得诗词格律旧韵的人不是很多,而电脑程序只要按照编程要求输入旧韵的韵脚字及诗词韵书的韵目,并且按照旧韵的要求区分平声字和仄声字,产生出来的就是按照旧韵创作的格律诗词作品,这让很多至今不懂旧韵的当代诗人会感到尴尬。从这个角度看,电脑程序多创作一些使用旧韵的诗词作品,还有传承传统文化的功能,这是值得肯定和看重的。
    随着电脑和人工智能技术的飞速发展,过去看来很难的事情,可能会变得非常的简单易学。例如,今后的孩子如果借助电脑程序的辅助教学学习下围棋,可能在很短时间内就会使用古今最复杂的技战术,而不必花很多时间才能达到专业棋手的水平。也就是说,很多专业棋手用了很长时间的苦修才能达到的悟性与棋艺,现在在电脑程序的帮助下,不必花费那么多的功夫和心血就能达到了。同样,过去学着作诗要熟读大量的古人名作,揣摩作品的意境和写法,熟悉韵律的使用,而到了今天如果有电脑程序帮忙,大概用几年时间就能让一般人能够写出水平尚可的格律诗词了。
    如果将来的某一年,中央电视台再举办中国诗词大会,参赛的选手不仅能把古今诗词作品倒背如流,还能出口成章挥笔成诗,写出的风格就跟李杜苏辛似的,大抵那也并不令人奇怪的。(倚松聽風

附: 汉语诗歌的机器创作

在我国,自上个世纪80年代始,就有不少个人和研究机构陆续开展了汉语诗歌的自动创作研究。在1984年我国首届青少年计算机程序设计竞赛中,上海育才中学14岁的学生梁建章就成功编制了“计算机诗词创作”程序。该程序共收入500多个词汇,以山水云松为主题,平均不到30秒钟就能创作一首五言绝句诗,可谓高产“诗人”。下面题为“云松”的诗就是该程序产生的:

    銮仙玉骨寒,松虬雪友繁。大千收眼底,斯调不同凡。

很有古诗韵味。

另外,辽宁省建设银行工程师艾群也有电脑创作的诗作“发表”,其中的“北方的思念”和“乡情”尤为让人叫绝。“北方的思念”为:

雨巷盼望孤独/故乡的依稀揉白了/模糊的坐标/全是橡树的风景

思念你/心的座/甚至去了/美丽的春色,重回/北方的思念。

而“乡情”全诗如下:   

夜空  长长/ 日历交融了墙,/ 久远的威风上/人迷失在充满生机的故乡。

    以看到的背影拒绝回声,/唇急给于心中,/自无束的情里/ 拂过无声的落叶。

你还别说,真有那么一点思乡情浓的味儿。

很明显,上述的机器诗歌之所以有那么一点诗情画意,当然是源于人们的选择和解读,所谓“三分诗七分读”。从这个意义上讲,机器创作诗歌,困难不在于组合搭配出好的诗句,而是如何在创作的诗句中进行评判,使得机器总能创作出好的诗句,从而真正保证机器产生诗歌的质量。

另外,自九十年代至今,厦门的林鸿程先生独立开发的“稻香老农作诗机”一直在不断的升级和完善中(http://www.poeming.com/web/);而2006年出现的“猎户星免费诗歌自动制作机”更是在国内的网络和诗坛引起了一场轩然大波(http://www.dopoem.com/)。民间机器作诗的研究热情远远胜过学术研究。作为对比,学术界的研究成果很少,除了有关文献给出的研究工作外,还有就是产生较大影响的“一种宋词自动创作的遗传算法及其机器实现”一文(周昌乐发表在2010年《软件学报》第3期)。

那么机器创作诗歌的主要方法是什么呢?从国内外已有的研究看,采用的计算方法主要有词语堆砌法、基于模版的方法、基于模式的方法、基于实例的方法、神经网络的方法以及遗传算法的方法等等。

必须指出,机器诗歌优劣的评价是基于所创作大量诗歌的平均水平的。从以上几首机器诗歌不难看出,机器创作诗歌的最大困难还是诗词的语义问题,以及如何自动评判机器所作诗歌的优劣程度。因此,如果能够建立语词之间的语义搭配一致性,再加上设计一个好的诗歌优劣评判函数,可以发现诗词句子的创作过程本质上就是一个不断优化解的过程,而这正是遗传算法的计算原理。因此,目前国内外大多数比较成功的机器诗歌系统,往往都是采用遗传算法作为基本策略的。

比如,我们早期开展的中国古典律诗自动创作研究(参见周昌乐《心脑计算举要》第六章),就采用了遗传算法的计算策略,并加上必要的一些改进,比如引入网状关系词库、词对映象结构等数据基及其形成的算法。结果,基于诗歌语句群体上,经过一段时间的运行,就可以创作如下质量(统计意义上)更好的诗歌。

1 清明传语愁送客,两岸千里欲渡河。茫茫春光催碧草,晓露琼楼阑珊色。

2 白沙平舟夜涛声,春日晓露路相逢。朱楼寒雨离歌泪,不堪肠断雨乘风。

可以看出,虽然诗歌句子与句子之间的意思仍然改进不大,但是词语之间的搭配关系有了明显的改进。我们认为这主要是因为采用了改进的遗传算法,增加了词语搭配之间的规律性。如果在此基础上再考虑句子之间语义搭配问题,那么,句子之间的意义关联性也同样可以得到改进。关键是要找到句子意义关联描述的适当方法,这正是需要进一步研究解决的问题。

正是因为看到了问题的所在,在全面构建的全宋词语料库的基础上了,加上风格、情感、句法与语义等全方位因素的考虑,我们又开发出了一个产生较大影响的宋词自动创作系统。其中,当输入关键词“菊”和词牌“清平乐”,系统创作宋词的一个例子如下:

相逢缥缈窗外又拂晓长忆清弦弄浅笑只恨人间花少

黄菊不待清尊相思飘落无痕风雨重阳又过登高多少黄昏

输入关键词“饮酒”和词牌“西江月”,系统创作宋词的例子则是:

        饮酒开怀酣畅,洞箫笑语尊前。欲看尽岁岁年年,悠然轻云一片。

        赏美景开新酿,人生堪笑欢颜。故人何处向天边,醉里时光渐渐。

应该说,效果都还是相当不错的。

到此,或许读者会问,如何来判断机器诗歌的好坏呢?特别是如何能够认定机器创作的诗歌可以达到人类诗歌的水平呢?对于像诗歌这样涉及到主观审美价值的评判问题,难道还有什么客观标准吗?!

通常,对于人工智能而言,要认定机器是否达到人类的智能水平,通行的方法就是采用图灵测验的途径来进行。对于诗歌而言,所谓图灵测验就是指,将人类的诗歌与机器的诗歌混在一起让人们去判别哪一首是人类作的,哪一首又是机器作的?如果都能正确判别,那么说明机器诗歌难以鱼目混珠。反之,如果在很大的概率上,人们都会判别错误,那么就说明机器诗歌可以达到乱真的地步。比如就如下两首主题一样的《点绛唇》,读者能判断出哪首是机器作的吗?

1)点绛唇?佳人:

       人静风清,兰心蕙性盼如许。夜寒疏雨,临水闻娇语。

           佳人多情,千里独回首。别离后,泪痕衣袖,惜梦回依旧。

    2点绛唇?念佳人

           娇颜似花,佳期如梦天一方。人海茫茫,何处诉衷肠。

           一夜东风 ,红杏满庭芳!思欲狂?巾短情长,无语寄斜阳。

    当然,爱好思辨的读者或许还会从根本上来考虑这个判定问题,将如何评介机器诗歌创作分为三种立场:(1)只看结果不看过程:仿生学思想;(2)只看过程不看结果:要像人一样创作;3)又看结果又看过程:完美主义。而图灵测验仅仅适用于第一种立场,并不适应于后面两种立场。

其实,机器的“创造力”在于人,我们之所以被机器的“好诗”所倾倒,并不是机器具有如何高明的创作能力,而是我们人类赋予了机器诗歌的魅力。因为诗歌在于解读,所谓“三分诗七分读的含义”说的正是解读者的参与才赋予了被解读诗歌的意义。一首诗歌的字符串本没有所谓的意义,是人们用心去解读才赋予了诗歌的意义,这正是阐释美学与接受美学的观点。

因此最后我们必须清楚,即使机器创作了再优美感人的诗歌,也不能说明机器具有什么优美感人的意境,这意境的感悟,永远属于人。

  

                                周昌乐, 2012621

  评论这张
 
阅读(5)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017