2012年,张一鸣给新公司取名,用了一个计算机术语做名字——字节。
这大概是中国科技公司里最让人服气的一个名字。两个字,有技术感,有力量感,认知成本几乎为零。你不需要懂计算机,只需要认中文,就知道「字节」说的是某种文字层面的基本单位。
干净、准确、过目不忘。能拿一个术语做公司名且毫无违和感,这本身就说明这个词翻译得有多好。
别吵了,Token最好的中文翻译一直在那儿
上周大家对于Token该翻译成生什么吵翻天「模元」「智元」「灵符」「令牌」「偷啃」……社交媒体隔段时间就会掀起一轮争论,每次都以各说各话收场。
这些候选词各有各的巧思,但放在一起看,你会发现:大家都在比谁更有灵气、更有意境,却没人先问一个最根本的问题——Token在技术上到底是什么?
它不是「智能」的单位,不是「模型」的单位,它是语言处理的最小单位。
其实在这场混战之前,答案早就在那里了。
在自然语言处理(NLP)学术文献里,Token作为文本的最小处理单位,长期被译为「词元」。
词,指向语言属性;元,指向最小粒度。两个字,一个管归属,一个管层级。
苹果就采用了这个译法。打开Apple中国官网,产品详情页写着「词元响应速度」。
「提示词」,AI时代最将就的翻译
Token的问题可以收场了。Prompt的问题,才刚刚开始。
目前业内通用叫法是「提示词」。三个字,好懂,传播也广——但说实话,这个词不够用,早就不够用了,只是没人较真去捅破这层窗户纸。
「提示词」的问题不在于它翻译错了,而在于它把「提示」把权力关系翻反了。
你写一段system prompt,定义模型的人格边界,规定它只能做什么、不能做什么,指定输出格式和语气——这叫「提示」?这是在下令。
「文令」Prompt
文——文字、文本、文章。Prompt的载体永远是文字,不管是闲聊一句还是Agent编排指令,物理形态就是文。
令——命令、指令。Prompt的功能是驱动模型执行。写下一段文字,模型照着意图去生成、推理、行动。「令」精准地捕捉了这个动作——人在向模型发号施令。
像素·字节·词元·文令,一条从机器通往人的路
把「文令」放进更大的坐标系里,会看到让人心跳漏半拍的东西:
- 像素(pixel)→眼睛看见的世界的最小单位
- 字节(byte)→机器存储的世界的最小单位
- 词元(token)→模型理解语言的最小单位
- 文令(prompt)→人类驱动模型的最小单位
四个词,同一套构词逻辑:载体属性+功能属性。
像素离机器最近,文令离人最近。这背后有一条隐藏的一条进化时间线:从感知,到存储,到理解,到驱动——这是人类一步步将意图注入机器的完整进程。
词元、文令:请跟我们一起说
Token就叫词元。词,定其形。元,定其根。
Prompt就叫文令。文,定其意。令,定其魂。
下一次你打开AI的对话框,你写下的每一个字,都是文令。
来源:虎嗅

