赞
踩
文本生成是最近研究的热点,他的生成源有很多,如:图片、文本、视频等。本文想针对一些特殊场合的需要关键词的文本生成工作,在这里把思路记录一下。这里使用的是传统方式,有机会会尝试深度学的方式。
(1)依赖的语法选择
如果想让句子读起来通顺,就需要一定的语法框架,但是常规的语法会有较多的问题,如主语,能够做主语的成分很多,如代词、名词甚至短语,所以生成起来不好控制,建议使用词性序列作为语法序列。
(2)关键词在词性序列上填充
在这没有考虑一个词多个词性的情况,是根据词典的方式查询的词性。
(3)备选集合生成
每种词性都会对应相应的词的集合,没有被关键词填充的位置,可以用来作为备选。
(4)最有路径选取与最优句子
找出最像句子的路径,然后重复生成多个句子的备选,选出最优的句子。这里使用语言模型做的。
效果:
key word :"孩子", "淘气"
这些 孩子 这么 淘气 呀
key word :"孩子", "可爱"
什么样 的 孩子 最 可爱 呀
一些想法:
语法模板的选择目前是随机选择,会有几率生成不出好的句子,需要对语法序列进一步归纳总结。
关键词可以通过语义进行扩展(如词嵌入)生成出更加丰富的句子。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。