报告阅读|ChatGPT调研报告(哈工大版)
这篇报告是由哈工大自然语言处理研究所所撰写的,主要从GPT的技术原理、应用场景等角度对GPT进行详细介绍。ChatGPT与目前的数据库
这篇报告是由哈工大自然语言处理研究所所撰写的,主要从GPT的技术原理、应用场景等角度对GPT进行详细介绍。
ChatGPT与目前的数据库、搜索引擎等相比,最显著的可能就在于它打破了知识传播的局限。报告中指出,其是全新一代“知识表示和调用方式”。
整体上,ChatGPT的核心算法可以分为“实现基础的 Transformer 模型、激发出其所蕴含知识的 Prompt/Instruction Tuning 算法、其涌现出的思维链能力、以及确保其与人类意图对齐的基于人类反馈的强化学习算法。”
看完后,我比较关注的一个是提示学习与指令精调,这部分与基于人类反馈的强化学习算法的应用,使得模型与人类需求对齐。
在指令精调中,openai使用的一部分是来自通过其api获取的真实人机交互的数据;另一部分,仍是组建了一个标注团队,来进行相关数据集的梳理与标注。
另一个关注点在于思维链(COT),通过在小样本提示学习的示例中,插入一系列中间推理步骤,提升模型推理能力。可以理解为将人类解决问题的思维过程“step by step”的喂给模型。
上述这些核心算法环境,在已有大规模样本的基础上,还是需要基于人工标注团队所形成的高质量数据集,如openai所使用的模型微调数据集,包括新闻文章的摘要数据集、问答数据集等。
报告在给出GPT的核心算法和技术原理的同时,也指出了目前GPT尚存的一些问题,如大规模语言模型自身的局限性,包括模型的时效性,大规模模型的训练成本,模型回复的可信性等;此外,还有数据泄露风险、基于标注团队进行精调和引导的标注人员自身偏见问题以及GPT在多数问题上“不确定”式的回答方式等。(需要报告的可戳)