一举刷新50多个NLP任务基准，并登顶 SuperGLUE 全球榜首，百度ERNIE 3.0知识增强大模型显威力！

2021-07-06 15:19:37

近日，百度ERNIE升级到3.0，重磅发布知识增强的百亿参数大模型。该模型除了从海量文本数据中学习词汇、结构、语义等知识外，还从大规模知识图谱中学习。

ERNIE 3.0一举刷新54个中文 NLP任务基准，其英文模型在国际权威的复杂语言理解任务评测SuperGLUE上，以超越人类水平0.8个百分点的成绩登顶全球榜首。ERNIE 3.0同时具备超强语言理解能力以及写小说、歌词、诗歌、对联等文学创作能力。

目前ERNIE 3.0已在百度文心官网开放，用户可体验ERNIE 3.0创作的不同形式的内容，实现更多有创意、有价值的应用。

论文链接：https://arxiv.org/pdf/2107.02137.pdf

Demo 链接：https://wenxin.baidu.com/wenxin/ernie

ERNIE 3.0知识增强大模型：百亿级预训练中首次引入大规模知识

近一年来，以GPT-3、Switch-Transformer 为代表的大规模预训练模型，带来了人工智能领域新的突破，由于其强大的通用性和卓越的迁移能力，掀起了预训练模型往大规模参数化发展的浪潮。然而，现有的大规模预训练模型，主要依赖纯文本学习，缺乏大规模知识指导学习，模型能力存在局限。

ERNIE 3.0的研究者进一步挖掘大规模预训练模型的潜力，基于深度学习平台飞桨的分布式训练技术优势，首次在百亿级预训练模型中引入大规模知识图谱，提出了海量无监督文本与大规模知识图谱的平行预训练方法（Universal Knowledge-Text Prediction）。通过将大规模知识图谱的实体关系与大规模文本数据同时输入到预训练模型中进行联合掩码训练，促进了结构化知识和无结构文本之间的信息共享，大幅提升了模型对于知识的记忆和推理能力。

ERNIE 3.0 中的文本与知识平行预训练

ERNIE 3.0统一预训练框架：同时具备语言理解和语言生成能力

百度研究者提出了将通用语义表示与任务语义表示相结合的模型框架，该框架融合自编码和自回归等不同的任务语义表示网络，既可同时处理语言理解和语言生成任务，还能做无标注数据的零样本学习（Zero-shot Learning）和有标注数据的微调训练（Fine-tuning）。此外，ERNIE 3.0在持续学习框架的基础上，增加了任务语义表示网络，加速模型进化。