肇鑫的日常博客

日常

也来预测一下AI的发展趋势

2026年了,好多人都在给自己设定计划,展望未来。AI无疑还是今年的主题,但是对于AI会如何发展,每个人看到的风景是不一样的,而我,想把我这一年来使用AI的感受以及未来趋势的看法说出来。

过去一年,我开始使用AI辅助编程,一开始只是简单的代码补全,有时能补对,有时补不对。后来我开始使用Claude Sonnet 3.5,逐渐感觉到AI辅助编程的乐趣。再后来Claude Sonnet 4.0来了,但是随之而来的是GitHub Copilot for Xcode不再支持中国地区的用户使用Claude的模型。好在很快,我又有了Grok Code Fast 1可以使用。同时GitHub Copilot for Xcode又支持了OpenRouter,这样就让我尝试了使用更多的模型,包括不少国产的模型。

GitHub后知后觉地提供了Copilot CLI,我在收购了GitHub Copilot for Xcode必须前台,以及经常写错文件的bug后,开始使用Copilot CLI,后来又因为GLM出了订阅的编程套餐,又开始尝试使用Claude Code。期间我还尝试过其它别家的产品,好多都浅尝则止,没有最终留下。

目前,我使用的主要是Claude Code + GLM 4.7,Copilot + gpt-5.1-codex-max/Grok Code Fast 1, GitHub Copilot for Xcode以及qwen-code。

展望未来

展望未来之前,我们必须要先回顾一下历史。

计算机发展的历史

谈到计算机,抛开前期的算盘、手动计算尺、机械计算机器之外,大家公认的最早的计算机是美国的电子管计算机。从它开始算起,计算机经历了电子化,小型化,移动话,最终演变成了现在的无处不在的计算设备,除了传统的服务器、台式机、笔记本,还包括手机、游戏机、智能摄像头、智能网络设备、智能家电、智能宠物、智能机器人等等等等。

与之对应的,编程手段也从最初的纸带打卡器,到机器语言、汇编语言,到更高级的c语言,面向对象的C++,面向网络的javascript等等等等。

至于应用方式,早期的计算机主要用于计算,这也是它的名字计算机的由来。而随着计算机算力的增加,人们不仅仅将计算机用于计算,还用于其它更为通用的功能,比如文字处理、表格处理、数据库、游戏、音乐、视频等等。

而为了处理这些计算之外的数据,人们必须将其它的数据转换为数字,这样才能被计算机进行处理。而这个过程被称作建模。关于建模,最经典的书籍就是算法与数据结构。建模其实就等于算法+数据结构。

未来

从上面的论述,我们不难看出,计算机的发展经历了从专一功能,向通用功能的转变。使用的手段就是建模。而现如今,有了AI,建模已经可以通过提示词,让大模型自动分析数据,自主建模了。这也就是说,编程的自动化已经基本实现了。

AI目前比较擅长文本处理,而对于其它的数据,比如图片、视频、声音等的处理,相比于文字,就要差很多。

过去一年,为了补足大模型的不足,多种工具涌现。从一开始的tool_use,到后来的agent,skill,但是其实你从编程角度看,这些概念其实也非常简单。

tool_use其实就是调用函数,这是大模型和传统编程的结合。tool_use就是大模型调用一段函数,提供函数所需的参数,并且获得返回值并使用。

agent和skill其实需要一起来理解。agent是名词,skill是动词。一个相当于编程里的class,一个就是method/action。也就是一个是负责出力的主体,一个是负责具体做什么的函数/动作。而这两个其实只是大模型提示词进行的不同描述。这些都是在大模型内部进行的,已经没有传统编程了。

简单来说,就是以前,我们的应用获取资源,是通过操作系统,大部分时间每个应用都是各自为政。而现在有了大模型,我们面对的是整个世界。我们需要通过agent和skill将大模型与整个世界连接起来。这个闭环一旦形成,目前存在的硬件架构、操作系统、网络等鸿沟就不复存在,唯一区别的是你使用的模型是哪个。

机遇和挑战

从上面的论述,我们不难得出结论。随着agent和skill数量的增多,大模型的能力会越来越强大。可现在的问题是,大模型是收费的,而开发agent和skill则不赚钱。这样下去,所有的钱会都被上游,也就是拥有模型的公司赚走了。而处于下游的人,不仅要面临激烈的竞争,并且也很难获得持续性的收入。

我想这也就是为什么那些美国科技公司都拼命砸钱,想要在AI市场上争夺第一的缘故吧。因为这个市场,目前的确就是赢家通吃。