ChatGPT 是什么?

1 ChatGPT 简介

ChatGPT 是 Chat Generative Pre-trained Transformer 的缩写,是由 OpenAI 开发的基于大型语言模型的聊天机器人,于 2022 年 11 月 30 日推出,它使用户能够改进和引导对话达到所需的长度、格式、风格、级别细节和语言。连续的提示和回复(称为提示工程)在每个对话阶段被视为上下文。(摘自:维基百科)

ChatGPT是一种人工智能模型,它可以处理自然语言任务,如文本分类、问答、对话等。它最常见的应用是生成内容、查找信息、问答、以及帮助组织数据。ChatGPT是由OpenAI开发的,它使用了大量的预训练数据和深度学习技术,能够理解人类的自然语言输入,并以符合语法和逻辑的方式生成有意义的回答。ChatGPT可以根据用户提供的prompt内容返回特定信息给客户。Prompt可以是问题、说明、描述、或其他文本序列。ChatGPT是一个非常有用的工具,可以帮助人们更好地理解自然语言,同时也可以帮助人们更好地处理自然语言任务。(by bing/GPT4)

2 什么是大语言模型 LLM?

大语言模型是一种深度学习模型,它可以处理自然语言任务,如文本分类、问答、对话等。它最常见的应用是生成内容、查找信息、问答、以及帮助组织数据。大语言模型主要针对的是人类语言,同时,也包括代码等不同机器语言,甚至已经开始涵盖DNA等基因语言。

为了更好的理解LLM,让我们来结构大语言模型(Large Language Model)的名称:

  • Large 大:意味着大语言模型接受了巨大量的数据集的训练。例如,生成式预训练Transformer版本3(GPT-3)的训练数据集包括超过1750亿个参数以及45TB的文本数据集。
  • Language 语言:意味着LLM主要以语言为基础进行操作。
  • Model 模型:意味着LLM用于在数据中查找信息或根据信息进行预测

3 敲黑板

3.1 那么 AI 到底是否理解你的输入?

ChatGPT是一种大型语言模型,它可以预测下一个单词或字符的概率分布,但它不会像人类一样理解含义。(by bing/GPT4)

3.2 ChatGPT 的精准度取决于什么?

  1. ChatGPT3. 5 和 4 的区别:本质是你的训练和调教。GPT-4比GPT-3大10倍,估计参数数量在120层、1.8万亿左右。所以为什么GPT4 的版本比 GPT3.5更聪明。也解释了为什么 ChatGPT 古诗词能力不及国内的百度等,毕竟百度是中国胃。跟你的训练有很大的关系。同理 Claude 1(100k) 和 Claude 2(200k)的区别也很大。有条件,用高版本。
  2. 提示词Prompt: Prompt简单的理解,是机的桥梁,起到一个很好的人机互动作用。提示词工程,尤其是文生图,就更加关键了。这个需要系统的学习。有迹可循的规则。未来一定有一种职业,叫做提示词工程师。
  3. 结果的可靠性:用的过程,往往会发现,有些时候很靠谱,有些时候一本正经胡说八道。其实上面说了,本质是算法、概率分布,无法理解具体的含义。结果是不可控的,本质是算法,是概率游戏。(个人理解)

参考内容:

  1. 中国人民大学高瓴人工智能学院:大语言模型综述
  2. 深入浅出理解概率统计语言模型 - 知乎
  3. 大语言模型是什么?LLM的七大主要功能总结 - 澳鹏appen
  4. 大语言模型(LLM)综述,全新升级版!-腾讯云开发者社区-腾讯云
  5. 一文读懂“大语言模型” - 知乎
  6. 【Google出品】大语言模型简介 AI入门__bilibili
  7. 【Google出品】生成式 AI 官方教程__bilibili

发表回复