GPT-4

发布时间：2023-06-14 15:19:24

获取锅炉报价

发布求购信息

1 简介本文根据openAI的2023年3月的《GPT-4 Technical Report 》翻译总结的。原文地址：https://arxiv.org/pdf/2303.08774.pdf原文

1 简介

本文根据openAI的2023年3月的《GPT-4 Technical Report 》翻译总结的。

原文地址：https://arxiv.org/pdf/2303.08774.pdf

原文确实没有GPT-4 具体的模型结构，openAI向盈利组织、非公开方向发展了。也没透露硬件、训练成本、训练数据、训练方法等。不过也透露了一些思想，比如提出了根据模型小的时候，预测模型大的时候的表现。

GPT-4开始多模态了，支持图片和文本输入，输出文本。GPT-4模型还是沿用AR模型的思路，transformer模型，在一个文档中预测下一个token。GPT-4除了预训练，增加了强化学习微调，即使用了Reinforcement Learning from Human Feedback (RLHF) 。

GPT-4在一些考试如司法考试上取得了top 10%的成绩。而GPT-3.5的成绩在底部10%。

2 预测扩展性

GPT-4是非常大的训练成本，它不能灵活进行特定任务的微调。为此，我们开发了一个基础结构和优化的方法，可以根据模型小的时候，预测模型大的时候的表现。比如使用千分之一到万分之一的GPT-4计算成本就可以预测GPT-4的效果。

loss预测可扩展性

提出了下面公式，可以通过小模型预测GPT-4的loss。

如下图，设GPT-4计算成本为1，x轴前面的就是小模型，y轴是损失loss。随着模型增大到GPT-4，损失loss可以通过小模型进行预测。

HumanEval验证数据集上能力的预测扩展性

提出了下面公式，可以通过小模型预测GPT-4的能力。

其中k和a是正常数，P是验证数据集的一个问题集合子集。

如下图，设GPT-4计算成本为1，x轴前面的就是小模型。随着模型增大到GPT-4，大模型能力可以通过小模型进行预测。

3 GPT-4能力

如下图，GPT-4比GPT-3.5更好的通过各种学术和专业考试。