首页 > 要闻 > 正文

绘图机人工智能系统根据大纲写长故事

导读 在本周于Arxiv org发表的一篇预印论文中,来自微软、艾伦人工智能研究所和华盛顿大学的科学家描述了绘图机,一种通过跟踪画线学会将轮廓转

在本周于Arxiv.org发表的一篇预印论文中,来自微软、艾伦人工智能研究所和华盛顿大学的科学家描述了绘图机,一种通过跟踪画线学会将轮廓转化为故事的人工智能系统。PlotMachines(其代码可以在GitHub上找到)可以促进能够编写案例研究、新闻文章和脚本的系统的开发,而无需描述人物和事件的短语,从而节省了公司的时间和金钱。

虽然有可以生成歌词的故事、文章甚至AI系统,但大多数都是针对特定领域量身定制的,不能很好地适应新的任务。而且,他们不擅长写长文章。即使是最复杂的模型也会忘记剧情元素,重复自己。

正如研究人员解释的那样,写故事需要遵循情节,故事是由人和事件以连贯的叙事方式编织而成的。对机器来说不容易。由于输入只提供剧情的粗略元素,因此模型的责任是丰富元素在故事不同部分之间的交织方式。

在开发PlotMachines的过程中,团队创建了多个数据集,这些数据集基于目标叙事的现有故事数据集,并与自动构建的输入轮廓相匹配:

维基百科,一个由从维基百科获取的电影、电视和书籍情节组成的语料库。

写作提示是从Redditsubedit/r/写作提示中收集的故事生成数据集。

纽约时报,一个包含新闻文章的数据集。

轮廓提取,通过算法从维基百科、文字记录和纽约时报中提取的绘图点列表。

接下来,研究人员设计了绘图机,他们将其描述为基于开放人工智能GPT模型的变压器。像所有神经网络一样,变压器包含分层排列的功能(神经元),这些功能可以传输数据信号并调整连接的强度(权重)。但是,Transformers也要注意,这意味着每个输出元素都连接到每个输入元素,它们之间的权重是动态计算的。

给定轮廓作为输入,绘图机将编写五个段落(引言、三个正文段落和结论),并更新存储矩阵以跟踪轮廓中的绘图元素。每个段落的话语信息有助于保持故事开头、中间和结尾的风格差异(记忆也可以观察到目前为止已经写了什么),而语境表征可以确保在创建新段落时使用前面的元素。

定性来说,研究人员表示,经过训练后,PlotMachines以设定一个场景(例如“20世纪50年代初,核武器试验继续……”)开始故事,并以一个明确的收尾动作(例如……,影片骑着humperdinck和毛骑到日落)结束。事实上,他们发现了一个在《纽约时报》语料库上训练的新闻生成PlotMachines模型,该模型非常强大,他们计划仅选择性地与研究社区共享,以防止恶意参与者创建和传播误导性故事。

在实验中,PlotMachines模型的变体建立在OpenAIGPT-2架构上,该架构包含总共4.6亿个参数(变量)。与几个基准相比,它获得了更高的召回基础研究(ROUGE)和BLEU分数,表明它具有出色的摘要和机器翻译功能。在两项涉及负责阅读和审查PlotMachine生成的故事的人类团队的独立评估中,其在“叙事过程”和“概述使用”等类别中的基准排名超过了基线。

“我们提出了具有大纲条件的故事生成任务:给定大纲作为描述故事中出现的关键人物和事件的一组短语,任务是生成与所提供的大纲一致的连贯叙事.这就要求模型的作者根据潜图的动态跟踪潜图的动态,同时生成整个故事。”"分析表明,绘图机可以有效地根据轮廓线写出更紧凑的叙述."

免责声明:本文由用户上传,如有侵权请联系删除!

标签:

Copyright @ 2015 -2023 太行之窗 All Rights Reserved. 网站地图 | 百度地图 .