CLI之后，人类与AI将相忘于江湖

2026 年 3 月
一	二	三	四	五	六	日
	1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

它是最后一种人类和机器都能使用、都能读懂的界面形态。

1992年，夏天。我妈给还是小学生的我报了一个暑期电脑班。
我就是那会儿，在位于交道口的北京市东城区第二十二中学的崭新机房里，第一次接触到电脑这个东西的。当时进机房要套鞋套，因为电脑怕灰。
20多个差不多大的小孩排排坐，面前是一台台苹果机——绿色字符在黑屏上闪烁的那种。
我们学的是Logo语言。屏幕中央有一只小海龟，你敲一行命令，它就动一步。FORWARD 100，海龟往前走一百步，画出一条线。RIGHT 90，海龟就右转90度。把这两步重复四次，屏幕上就出现一个正方形。
这是我人生中第一次体验到一种特殊的交互：你用文字告诉一个东西该怎么做，它立刻照做，你看着结果，决定下一步。
你还可以把”画正方形”存成一个新命令叫”SQUARE”，之后只要敲”SQUARE”，海龟就会自动画一个正方形。然后你可以用SQUARE组合出更复杂的图形。
33年后，2025年10月，人到中年的我，坐在电脑前，对着打开的Claude Code敲下一行字：重构这个网页的UI。屏幕上开始滚动一行行命令——它读取文件，分析结构、修改代码、运行测试。
我看着它的每一步操作，在关键节点决定让不让它继续。
记忆秒回到那个在蝉鸣、假山、水池围绕，位于教学楼五层的开着空调的电脑房。作为文科生，我已经那么多年没亲自看着命令行在我的眼前这么跑了。
一个小学生指挥一只海龟画画。一个人指挥一个AI agent写代码，中间隔了33年，但交互结构是一样：人类用命令表达意图，机器实时执行并展示过程，人类根据结果调整方向。
这个交互结构有一个名字。它叫命令行界面，Command Line Interface，就是最近颇为流行的CLI。
CLI拥有一颗老灵魂，它在计算机交互界面的历史中已存在了60多年，在我的个人生命中已存在了34年。而今天，它宛若婴儿。

## CLI是人机交互的自由王国

很多人对命令行的印象停留在黑客电影——黑屏绿字飞速滚动，键盘啪啪作响，然后一句I’m in。
这个印象不能说错，但它遮蔽了一个更基本的事实：CLI首先是一种用户界面。跟你手机上的触屏，电脑上的图形桌面一样，它是人和计算机之间的一层翻译。
区别在于：图形界面用图标和鼠标翻译，而命令行用文字和键盘翻译。

但”用文字操作电脑”只是表面。真正让CLI在AI时代重新变得重要的，是它的三个结构性特征——

可组合性。在Unix/Linux系统里，每个命令都是一块积木：一块搜索文本，一块排序，一块计数，一块筛选。这些积木可以拼在一起：搜索的结果交给排序，排序的结果交给计数，一行命令完成一个复杂任务。在图形界面里，你能做的事是设计师预先规划好的。而在命令行里，你能做的事是无限的，只要你会拼积木。

可编程性。就像Logo里把”画正方形”存成SQUARE一样，命令行操作天然可以被记录、封装、复用。你今天手动敲的十行命令，明天变成一个脚本自动运行。命令行就是自动化的入口——任何你能手动完成的事，都可以变成机器自动完成的事。

文本即协议。命令行世界里一切都是文本。输入是文本，输出是文本，工具与工具之间传递的也是文本。这看起来是限制，其实是一种极强的统一性——任何工具，只要能读入文本、吐出文本，就能跟任何其他工具协作。不需要提前约定数据格式，不需要专门的对接开发。文本就是通用语言，是最大公约数的协议。

CLI不是什么”更极客的操作方式”，它是一种人机交互哲学：你不是在使用一个被预先设计好的系统，而是在跟一套开放的工具集对话，并且可以随时重新组合它们来解决新问题。

可以这么说，当人们的默认设置是使用既有的架构，软件和工具完成某项任务的时候，GUI（图形交互界面）是更合适的选项，人们不必给自己找麻烦。

而当人们需要与计算机进行开放式的协作、创造并接受过程的不确定性的时候，CLI是那个最合适的界面，它的想象力和执行力没有什么边界。

不难判断，人与Agent的协作属于哪一种。

## 钟摆的历史

所有的计算机界面设计，背后都隐藏着一套权力秩序：是人迁就机器的认知，还是机器迁就人的习惯。前者指向了CLI，后者指向了GUI。

而你惊奇地发现，这是一个钟摆。

## CLI终究会消失，GUI也不会再复兴

AI agent帮你工作了一年，处理了成百上千个任务而极少犯错，你开始跳过逐行检查，开始说”直接做吧，做完告诉我”。从盯着屏幕看每一步，到扫一眼结果就行，再到不用看了我信你。

今天已经有开发者在Claude Code里输入需求，然后去倒杯咖啡，回来看结果就好。Agent的执行过程正在从前台退到后台，从实时观测变成异步回顾，从逐步审批变成事后抽查。

那么，当人类退出这间透明的房间之后，机器之间会说什么语言？

简单回答是API。但这个回答可能太简单了。

API的本质是人类预先定义好的契约——你能调用什么、传什么参数、返回什么格式，全是工程师事先设计好的。它是一本菜单，你只能点菜单上的菜。对今天的软件系统来说够了。对有自主判断力的Agent来说，这是不够的。

变化已经在发生。MCP（Model Context Protocol，模型上下文协议）是一个新方向——它不只是让Agent调用固定函数，而是让Agent自己发现有什么工具可用、理解每个工具的能力、然后自行决定怎么组合。

但这不是终局，其实也很容易被跳过。再往前一步。当Agent不只是跟工具对话，而是跟其他Agent对话呢？

两个Agent协作完成一个任务，传递的不只是数据——还有意图、上下文、不确定性、优先级和对风险的评估。

这些东西塞不进一个固定的数据格式。它们之间的通信更像一种协商：我有这些信息，我的判断是这样，你那边什么情况，我们怎么分工。

这就是传说中的A2A协议。

## 共同语言的终结

CLI是最后一种人类和机器都能使用、都能读懂的界面形态。在它之前，人类不得不完全用机器的语言说话。在它之后，图形界面让人类可以用自己的直觉操作机器，API让机器绕过人类直接对话。CLI刚好卡在中间——人类妥协了，机器的输出人类勉强还能读懂。

Agent的到来，有可能彻底消解这个延续了半个世纪的妥协。人类用自然语言说话，Agent用自己演化出的方式跟工具和其他Agent通信，大语言模型在中间做翻译。没有人需要再说对方的语言。

也没有人还能看到房间里发生了什么。

而我们今天热衷于复兴的，是人类和机器最后一种共同语言。

来源：虎嗅

归档

AI类 · 2026年3月24日 0

CLI之后，人类与AI将相忘于江湖

您可能还喜欢...

发表回复取消回复

AI类 · 2026年3月24日 0

您可能还喜欢...

硅谷程序员，疯狂“投喂”中国大模型

315曝光GEO灰色产业链：AI时代营销新挑战

AI正在吞噬所有软件：从吞噬世界到被吞噬的15年剧变

发表回复 取消回复

发表回复取消回复