Skip to content

概念知识

A

B

C

ChatGPT

ChatGPT,它是一款用于聊天的产品,而它背后使用的大语言模型是GPT

Cloud Desktop

云桌面。可以使用被人打包好的环境和软件,这个打包好的东西叫做镜像

Closed-source Model

闭源模型。开放模型权重,可以下载到自己电脑部署的模型,叫做开源模型。但是现在开源模型只是开放了权重,而不开放训练代码和训练数据。所以,准确的说叫开放权重模型

Connectionism

联结主义,先什么都不管,弄一个非常复杂的函数,然后根据计算出来的预测值与真实值的误差,不断调整里面的位置参数,这个函数叫住模型

Context

上下文。不同的模型有不同的上下文的长度限制,越大就越能记住前面的信息,上下文从另外一个角度理解也可以叫提示词

D

E

Emergence

涌现,大语言模型爆火的产品是2023年ChatGPT

F

Fully Open-source Model

完全开源。有了模型、权重,可以下载到本地进行部署和使用了,很少有人要重新训练它。不依赖他人的服务,而是把模型下载到本地进行使用的过程叫做私有化部署

Function

函数,万物皆函数,x -> y => f(x) = y。早期人们用符号主义的思想找到精确的函数,试图解释一切原理叫做符号主义

Fine-tuning

微调,参数调整好后,根据参数的输入计算输出结果的过程,叫做推理

G

Generative AI

生成式AI。当然除了文本,也包含图像、声音、视频等。这里每一个分割成最小粒度的词叫做Token

GPT

Generative Pre-trained Transformer,它是一个系列,开发这个模型的公司是 OpenAI

H

I

Image

镜像。

大语言模型的本质就是一个大函数,根据前面的一句话持续不断地计算下一个词是什么,这种基于输入内容自动生成新内容的人工智能系统,叫做生成式AI

Inference

推理。前面这些概念在大模型时代到来之后,逐渐变得火热起来,当模型参数量足够大的时候,对话能力有了质的提升,产生了一定的推理能力。这种量变引起质变而突然出现的且之前没有能力的现象,叫做涌现

J

K

L

Large Model

大模型,用于自然语言处理的大模型叫做大语言模型

Large Language Model

大语言模型,调整参数的过程叫做模型的训练

M

Model

模型,模型里的参数叫做权重

N

O

Open-weight Model

开放权重,比如DeepSeek、LLaMA等。不但开放了模型结构和权重,还开放了训练代码的模型,叫做完全开源

P

Pretraining

预训练,基于预训练的模型继续训练,让模型学习具体任务的方式叫做微调

Prompt

提示词。

Private Deployment

私有化部署。私有化部署依赖很多复杂的环境置,就是要装很多依赖的软件和工具包,而且还需要性能较为强劲的GPU的支持,对于仅仅需要尝鲜的个人,专门为此去买台电脑不太合适,就有了云桌面

Q

R

S

Symbolish

符号主义后来遇到了瓶颈,后来人们转用联结主义思想。

T

Token

Token。对话时,所有给到大模型的信息叫做上下文

Training

训练,事先训练好一个基础模型的方式叫做预训练

U

V

W

Weight

权重,如果模型里的参数量特别大,就叫做大模型

X

Y

Z

产品-模型-公司

国内

产品模型公司
DeepSeek ChatDeepSeek-V2深势科技
通义千问Qwen 系列阿里
腾讯混元助手混元大模型腾讯
豆包词言、云雀等字节跳动
Kimi ChatMoonshot V1/V2(自研)月之暗面

国外

产品模型公司
ChatGPTGPT-3.5、GPT-4、GPT-4 TurboOpenAI
CopilotGPT-4GitHub + OpenAI
ClaudeClaude2/3Anthropic
Gemini ChatGemini 1.5(前身 PaLM)Google DeepMind
PerplexityMixtral / Claude / GPT-4(多模型)Perplexity(聚合型)
PoeGPT / Claude / LLaMA / Gemini等Quora(聚合型)

一个模型需要还有训练它的代码,有了代码就可以训练出一组权重,有了权重就可以推理,就可以对外提供服务了。不开放源代码,也不开放权重,只对外提供服务的模型叫做闭源模型。如 ChatGPT、Claude、Gemini等。

如有转载或 CV 的请标注本站原文地址