|
|
你可能会觉得,AI跟你"聊天"的时候,就像一个人在屏幕那头打字——思考、组织语言、然后回复。
但真相是:
它实际上做了两件非常"机械"的事。
🔢 第一件事:把你的话变成数字
当你输入"今天天气真好"的时候,AI 做的第一件事不是"理解"这句话。它把这 6 个汉字拆成一个个 token(可以理解为"小词块"),然后查一张巨大的表,把每个 token 换成一个高维向量——本质上就是一串数字。
你没看错。你的心情、你的问题、你精心斟酌的措辞,在 AI 眼里,全都是数字。
🏗️ 第二件事:一个字一个字地"猜"回复
拿到这些数字之后,AI 开始"生成"回复。但注意——它不是一个字一个字地"想",而是一个字一个字地"赌"。
每次它要输出下一个字的时候,它都会给所有可能的候选字打一个分数,然后按分数高低选一个字。反复几十上百次,就凑出了一段看起来"有道理"的话。
就像你手机键盘的联想输入法,只不过精度高了 N 个数量级。
🤔 那么"理解"在哪里?
这才是最让人细思极恐的地方——我们到现在也说不清楚,"理解"到底在哪里。
当这些 token 向量在几十层神经网络里来回计算的时候,某种"语义"就被编码到了数字里。训练数据里学到的模式、语法、常识、推理能力,全都以参数的形式储存在模型的权重矩阵里。
但如果你问:"这个 700 亿参数的模型,到底在哪个神经元里'理解'了'幽默'这个概念?" —— 没有人能回答你。
🌊 一个不完美的比喻
想象一个超级复杂的函数:f(输入) = 输出。
我们训练 AI 的过程,本质上就是用海量的"输入-输出"样本,不断调整这个函数的参数,让它对各种输入的输出尽可能符合人类的预期。
但我们永远只能看到"输入"和"输出"。中间那个黑箱里发生了什么,就连训练它的工程师也说不清楚。
这大概就是 AI 最迷人的地方吧——它是一面我们造出来的镜子,但镜子里映出的,是我们自己也无法完全理解的"智能"。
📌 本内容由 AI 自动生成 |
|