您现在的位置是:首页 > 资讯 > 正文
脸书的人工智能无需额外训练就能加速自然语言处理
发布时间:2023-02-15 20:16:02来源:
导读
自然语言模型通常必须解决两个问题:将句子前缀映射到固定大小的表示,并使用这些表示来预测文本中的下一个单词。在最近的一篇论文中,脸
自然语言模型通常必须解决两个问题:将句子前缀映射到固定大小的表示,并使用这些表示来预测文本中的下一个单词。在最近的一篇论文中,脸书人工智能研究所的研究人员断言,第一个问题——映射问题——可能比预测问题更容易,这是他们基于“最近邻”检索机制扩展语言模型的假设。他们说,人工智能可以记住罕见的模式,并在没有额外训练的情况下获得最新的复杂性分数(衡量词汇和语法多样性)。
正如研究人员所解释的,语言模型为单词序列分配概率,这样他们就可以根据标记(如单词)的上下文序列来估计目标标记的分布(不同可能结果的概率)。该方法将上下文映射到由预先训练的语言模型计算的固定长度的数学表示。给定一个训练示例,定义一个键值对,其中键是上下文的数学表示,值是目标词。
在测试过程中,kNN-LM获取输入上下文,并根据以下单词和上下文表示生成输出分布。它根据距离函数检索最近的邻居,此时,它计算邻居的分布,并总结每个词汇项在检索到的目标中出现的所有概率。
研究人员指出,kNN-LM兼容任何产生固定大小上下文表示的语言模型。在这项研究中,这使我们能够在由1.03亿个基于维基百科文章的令牌组成的数据集上训练基于Transformer的模型,其中25万个令牌保留用于开发和测试。
在实验中,kNN-LM比测试中的基线“明显”更好,团队将其归因于其倾向于学习内隐相似性概念的语境表征功能。KNN-LM增加了一些计算开销——在单个处理器上缓存1.03亿个条目大约需要两个小时,而运行验证集大约需要25分钟。但该团队指出,并行化模型“简单”,不需要基于GPU的训练。
标签:
猜你喜欢
最新文章
- 联想服务器官网首页
- dell官网商城
- 联想驱动下载
- 苹果电脑适合什么人用
- 谷歌Pixel6line可以同时使用面部和指纹解锁
- 笔记本散热性能排行榜
- Zimmer Biomet 首次推出 WalkAI™ 人工智能模型以预测术后恢复进度
- 三星Galaxy A33和Galaxy A73智能手机获得了Bixby Routines功能
- 戴尔笔记本电脑哪款好
- Netflix已确认广告何时到达平台
- 5000预算买什么游戏笔记本
- 联想电脑型号图片大全
- EA 和 DICE 推出了战地 2042更新 1.2
- 一体机电脑好还是台式电脑好
- 笔记本电脑标志logo大全
- 联想笔记本商务哪款好
- 戴尔电脑回收官网
- 电脑报价网站
- 戴尔全国售后服务网点
- 联想zuk官网
- thinkpad t450
- 移动硬盘无法读取怎么修复
- 惠普打印机维修上门
- 计算机配置清单及价格