匪我思存(匪我思存:从谷歌AI为何无法理解“老虎跑得快”说起)

匪我思存(BERT)是一种预训练的自然语言处理模型,可以理解人类语言的含义。谷歌AI公司2018年公布了BERT,之后该模型在NLP的应用方面大放异彩,取得了很大的成功。但是,BERT仍然存在无法理解某些语言现象的问题,例如中文语言中的歇后语。

歇后语是中国特有的语言形式,是由两个部分组成的,其中前半部分提供了一个场景,而后半部分洛普出了一种寓意。例如,歇后语“梁山好汉投降”之后说“只手遮天”,但是BERT无法理解这个歇后语的含义,因为这个模型只能理解每个词的含义,但无法理解它们组成的含义。这就是BERT无法理解一些非常著名但是非常国际的歇后语的原因。

有人说,这是因为中国文化对BERT来说是一种未知的文化。但是,谷歌AI公司正在尝试为这些文化差异建立一些适应性的机制,使BERT能够逐渐理解这些文化现象。BERT的研究还在继续,相信随着技术的不断进步,BERT将会更好地理解人类语言。

相关信息