查看原文
其他

科普 | 听不懂“梗”怎么办?谷歌这个语言模型为你解释笑点

大数据文摘 语言服务 2022-07-01
点击上方“语言服务” 可以订阅


来看一个笑话。


我本该在下午5点开始写论文。 但后来我就开始玩这个很酷的新语言模型,玩了10分钟,10分钟后,突然就晚上9点半了!


这个笑话可能比较简单,大家一听就懂,不就是说“快乐的时光总是觉得很短暂”嘛。


不过,你能想象这里面说的“很酷的新语言模型”,居然也能听懂这个笑话?


不仅能听懂,它甚至还能一本正经地解释这个笑话:


这个笑话是关于当你开心的时候,时间过得多么快。 这个人本来应该在下午5点开始写一篇论文,但他们却开始玩语言模型。 他以为自己只玩了1分钟,但实际上是4.5小时。 


这个能力的背后就是谷歌的新模型——Pathways Language Model (PaLM),一个可以解释笑话的模型,有了它,世界上就再也没有难懂的梗了。




论文地址:

https://arxiv.org/pdf/2204.02311v2.pdf


长按二维码即可下载


PaLM,5400亿参数,让世上没有难懂的梗


当然了,PaLM的设计之初,肯定不会只是想解释解释笑话。


去年,Google Research宣布了对PaLM的设想,PaLM会是一个单一的模型,可以在高效率的情况下推广到各个领域和任务。


在“PaLM: Scaling Language Modeling with Pathways”论文中,Google Research详细介绍了 Pathways Language Model (PaLM) ,这是一个5400亿参数的Transformer模型。


PaLM可以实现在多个TPU v4 Pods中高效地训练单个模型。Google Research在数百个语言理解和生成任务上对PaLM进行了评估,发现它在大多数任务上都达到了最先进的few-shot性能,在许多情况下都有很大的优势。


这其中就包括解释笑话的笑点在哪里。


事实上,解释笑话并非易事,这需要对多步逻辑推理、综合知识和深层语言理解的复杂组合的场景生成明确的解释。


但是凭借着强大的语言处理能力,PaLM还是很好地胜任了这项任务。


甚至是冷笑话,PaLM也能很好地识别出来。比如别人问你:“斑马和雨伞有什么区别?”你可能会期待什么有意思的回答,但是答案是:“一个是和马有关的有条纹的动物,另一个是你用来阻止雨水落到你身上的装置。”


这种无厘头的冷笑话,PaLM给出的解释是:


这个笑话是一个冷笑话(anti-joke)。笑话是答案是显而易见的,笑点在于你期待一个有趣的答案。




PaLM甚至能从emoji中猜出电影名字


除了解释笑话,PaLM在许多非常困难的任务上显示出突破能力。


Google Research对29项广泛使用的英语自然语言处理(NLP)任务进行了评估。在29个任务中的28个任务中,PaLM 540B超过了之前的大型模型,如GLaM、 GPT-3、Megatron-Turing NLG、 Gopher、 Chinchilla和LaMDA,这些任务包括问答任务、完形填空和句子完成任务、  Winograd-style任务、上下文阅读理解任务、常识推理任务、 SuperGLUE任务和自然语言推理任务。




除了英语自然语言处理任务外,PaLM 在多语言自然语言处理基准(包括翻译)方面也表现出色,尽管只有22%的学习语料是非英语的。


另外,研究人员还在最近发布的包含150多个新语言建模任务的Beyond the Imitation Game Benchmark(BIG-bench)上探讨了PaLM的能力,并发现PaLM实现了突破性的性能。



PaLM在几个BIG-bench任务上展示了令人印象深刻的自然语言理解能力和生成能力。例如,该模型可以区分因果关系,在适当的背景下理解概念组合,甚至可以从emoji中猜出电影名字。




对于发展PaLM的未来愿景,Google AI Blog在报道中写道,希望实现“一个单一的人工智能系统能够概括成千上万的任务,理解不同类型的数据,并以非凡的效率完成这些工作”。


参考报道:

https://www.vice.com/en/article/k7w9jv/google-is-teaching-ai-to-explain-your-jokes-to-you

https://ai.googleblog.com/2022/04/pathways-language-model-palm-scaling-to.html

https://arxiv.org/pdf/2204.02311v2.pdf


本文来源:大数据文摘



老规矩

觉得长知识的

点赞为敬


#今日话题

你认为笑点还可以什么模型来解释

咱们留言区见



科普


科普 | 拼音“o”读“欧”还是“窝”?教育部语信司这样回复

科普 | 嗯?这么多年“嗯”的拼音我一直弄错了?

科普 | 为什么很多人喜欢在聊天句尾加“哈”? 

科普 | 想要表达真正开心地笑,得用几个“哈”?

科普 | 男导师的妻子叫“师母”,那么女导师的丈夫怎么称呼?

科普 | 为什么可以说“我爸爸”“我妈妈”,却不能说“我狗”?

科普 | 反差萌!“虎”作姓氏时不念“hǔ”,而念“Māo”?

科普 | “牛轧糖”的“轧”到底读“gᔓzhá”还是“yà”?

科普 | 身份证上的“Ⅹ”到底怎么读?

科普 | 儿童语言中的可爱语法

科普 | 为什么大人和儿童交流总是喜欢叠词词?

科普 | 为什么冬奥顶流“冰墩墩”的英文名是Bing Dwen Dwen?

科普 | 高亭宇说的“格路”是什么意思?没有东北话十级真翻译不出来!

科普 | 2022国际母语日:联合国进一步明确母语定义,精确到方言层级

科普 | 大脑为什么要删除3岁前的记忆?竟和语言有关! 

科普 | 语言学领域有哪些有趣又有料的笑话?

科普 | 你的语言正在出卖着你的性格

科普 | 北京野生动物园的声明为啥火了?我们用语言学知识分析一下

科普 | 王力宏深夜发文回应,我硬生生揪出了三十多处错误

科普 | 思聪真的是舔狗吗?让我们用语言学分析一下

科普 | “拿来吧你”是什么梗?让我们用语言学知识分析一下

科普 | “躺平”是什么梗?如何看待年轻人“躺平”的现象?

科普 | “煤气灯效应”是什么梗,用英语怎么说?

干货 | 电影《我和我的父辈》的英文名为啥是这个? 

干货 | 电影《长津湖》的英文名为啥是这个? 

科普 | 看《长津湖》学英语:三八线为什叫38th parallel? 

干货 | 《你好,李焕英》英文名为何用这个?

科普 | 潮流语言的终级迷惑:“yyds”为什么从去年火到今年?

科普 | 110为啥读成“幺幺零”?这些数字的“土味发音”你听过吗?

科普 | 圣诞节为什么拼写成Xmas?圣诞快乐可以说成Happy Christmas吗?

科普 | 为什么“人民大学”译为Renmin University,而不是People’s University?

科普 | 孔子学院全球门户网站上线!孔子的英文名为何是Confucius?

科普 | “No.”并不是Number的缩写,而是这个词

科普 | “别cue我”的cue在英语里到底是什么意思?

科普 | “AA制”里的两个“A”分别是什么意思?科普 | A4纸的A、2B铅笔的B都是啥意思?

科普 | 为什么睡觉用“zzz”表示?

科普 | “人民币”的缩写竟然不是RMB?原来我们错了这么多年!

科普 | 今天,你emo了吗?emo是什么梗? 

科普 | 《自然》最新研究:日语、韩语或都发源于中国东北

科普 | 为什么说“元宇宙”的“元”是个糟糕的翻译?

科普 | “社交牛B症”是什么梗,用英语怎么说? 

科普 | App,Emoji,YouTube……这些词我们一直都读错了?

科普 | Mojito译成“莫吉托”是标准的中式翻译错误

科普 | 《三十而已》《二十不惑》爆火!剧名为何这样翻译?

科普 | 乘风破浪的姐姐们A爆了!这里的“A”是什么意思?

科普 | 7-ELEVEn,n 为什么是小写?

科普 | “PK”“VS”“K.O”分别是哪些单词的缩写

科普 | 为什么奥运会裁判报分时把1∶0称为one love?

科普 | “月亮”的英语竟然不是 moon!

科普 | 这些“动物”可以当动词用,你知道吗?

科普 | 我们为什么要学习一门外语?

科普 | 英语专八相当于什么水平?

科普 | 汉字为什么是“方块字”?

科普 | 为什么汉字序顺不影响读阅?

科普 | 普通话冷知识:古人说的“普通话”是怎样的?


语言服务资源共享



学术资讯分享

学术资源共享

学术交流共进

还有实用干货和更多福利

尽在语言服务资源共享群

欢迎加入


在【语言服务】公众号对话框

回复“资源共享

获取进群方式


语言服务

15万+语言学人已关注

微信号:Language-service

投稿邮箱:yuyanfuwu@yeah.net

投稿交流、商务合作、著作出版

欢迎后台留言

点击阅读原文

获取更多科普趣文


大家都“在看”,就差你啦~

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存