主题
概念知识
A
B
C
ChatGPT
ChatGPT,它是一款用于聊天的产品,而它背后使用的大语言模型是GPT。
Cloud Desktop
云桌面。可以使用被人打包好的环境和软件,这个打包好的东西叫做镜像。
Closed-source Model
闭源模型。开放模型权重,可以下载到自己电脑部署的模型,叫做开源模型。但是现在开源模型只是开放了权重,而不开放训练代码和训练数据。所以,准确的说叫开放权重模型。
Connectionism
联结主义,先什么都不管,弄一个非常复杂的函数,然后根据计算出来的预测值与真实值的误差,不断调整里面的位置参数,这个函数叫住模型。
Context
上下文。不同的模型有不同的上下文的长度限制,越大就越能记住前面的信息,上下文从另外一个角度理解也可以叫提示词。
D
E
Emergence
涌现,大语言模型爆火的产品是2023年ChatGPT。
F
Fully Open-source Model
完全开源。有了模型、权重,可以下载到本地进行部署和使用了,很少有人要重新训练它。不依赖他人的服务,而是把模型下载到本地进行使用的过程叫做私有化部署。
Function
函数,万物皆函数,x -> y => f(x) = y
。早期人们用符号主义的思想找到精确的函数,试图解释一切原理叫做符号主义。
Fine-tuning
微调,参数调整好后,根据参数的输入计算输出结果的过程,叫做推理。
G
Generative AI
生成式AI。当然除了文本,也包含图像、声音、视频等。这里每一个分割成最小粒度的词叫做Token。
GPT
Generative Pre-trained Transformer,它是一个系列,开发这个模型的公司是 OpenAI。
H
I
Image
镜像。
大语言模型的本质就是一个大函数,根据前面的一句话持续不断地计算下一个词是什么,这种基于输入内容自动生成新内容的人工智能系统,叫做生成式AI。
Inference
推理。前面这些概念在大模型时代到来之后,逐渐变得火热起来,当模型参数量足够大的时候,对话能力有了质的提升,产生了一定的推理能力。这种量变引起质变而突然出现的且之前没有能力的现象,叫做涌现。
J
K
L
Large Model
大模型,用于自然语言处理的大模型叫做大语言模型。
Large Language Model
大语言模型,调整参数的过程叫做模型的训练。
M
Model
模型,模型里的参数叫做权重。
N
O
Open-weight Model
开放权重,比如DeepSeek、LLaMA等。不但开放了模型结构和权重,还开放了训练代码的模型,叫做完全开源。
P
Pretraining
预训练,基于预训练的模型继续训练,让模型学习具体任务的方式叫做微调。
Prompt
提示词。
Private Deployment
私有化部署。私有化部署依赖很多复杂的环境置,就是要装很多依赖的软件和工具包,而且还需要性能较为强劲的GPU的支持,对于仅仅需要尝鲜的个人,专门为此去买台电脑不太合适,就有了云桌面。
Q
R
S
Symbolish
符号主义后来遇到了瓶颈,后来人们转用联结主义思想。
T
Token
Token。对话时,所有给到大模型的信息叫做上下文。
Training
训练,事先训练好一个基础模型的方式叫做预训练。
U
V
W
Weight
权重,如果模型里的参数量特别大,就叫做大模型。
X
Y
Z
产品-模型-公司
国内
产品 | 模型 | 公司 |
---|---|---|
DeepSeek Chat | DeepSeek-V2 | 深势科技 |
通义千问 | Qwen 系列 | 阿里 |
腾讯混元助手 | 混元大模型 | 腾讯 |
豆包 | 词言、云雀等 | 字节跳动 |
Kimi Chat | Moonshot V1/V2(自研) | 月之暗面 |
国外
产品 | 模型 | 公司 |
---|---|---|
ChatGPT | GPT-3.5、GPT-4、GPT-4 Turbo | OpenAI |
Copilot | GPT-4 | GitHub + OpenAI |
Claude | Claude2/3 | Anthropic |
Gemini Chat | Gemini 1.5(前身 PaLM) | Google DeepMind |
Perplexity | Mixtral / Claude / GPT-4(多模型) | Perplexity(聚合型) |
Poe | GPT / Claude / LLaMA / Gemini等 | Quora(聚合型) |
一个模型需要还有训练它的代码,有了代码就可以训练出一组权重,有了权重就可以推理,就可以对外提供服务了。不开放源代码,也不开放权重,只对外提供服务的模型叫做闭源模型。如 ChatGPT、Claude、Gemini等。