肇鑫的日常博客

日常

CLI可能不会再过渡到GUI了

Claude Code火了,但是有人批评它,认为它使用CLI是一种倒退,认为早晚会像计算机的发展那样,从命令行的DOS,过渡到图形的Windows。

不是所有的历史都会重复。是否会从命令行过渡到图形,取决于用户需求。图形相比于命令行,能够提供更多的信息,更好的排版,其实也就是提供更多的按钮。图形界面发明了菜单,包括右键菜单,上下文菜单,工具条,状态栏,弹窗等等。这一切,都是为了更方便用户使用。不过,从用户角度看,尤其是对于一个新手来说,他面对图形界面那么多的可选按钮和选项,是需要很高的学习成本的。

站在如今的角度来看,其实图形界面大部分的空间都浪费掉了。因为人们同一时间会使用的按钮,只是显示出来的一小部分,因此大部分显示的按钮在大部分时间都是浪费的。之所以必须显示,是因为开发者不知道用户想要用哪一个。图形界面的开发者也知道这一点,所以他们采取了办法,发明了类似智能工具条和上下文菜单这种工具。

如今又了AI,一切又有所不同了。用户不仅不再需要找到需要按钮,甚至用户也根本不用学习,用户只需要将自己需要的效果告诉AI,而AI则会主动选择方式执行。AI可以选择去点击按钮,也可以选择调用适当的程序,甚至如果没有适当的程序,AI甚至可能会自己临时写一个。而用户,完全不在意AI是如何做的,用户只在意最终自己拿到的结果是否符合自己的需求。站在这个角度,用户只需要能跟AI沟通就可以了。而CLI完全就符合,根本没有过渡到GUI的必要。因为如今,用户已经有亲子完成任务,变成了下达命令,验收结果。只有在对于AI不满意的情况下,才会亲自下场。反倒是AI输出的结果,会需要是精彩纷呈的。它可以输出ppt,输出视频,输出网页。而用户只需要能下达命令就可以了。

大模型未来发展方向

总有人因为利益,要么鼓吹大模型公司是未来的方向,要么说硬件公司是未来的方向。并认为token需求会越来越大,甚至是无限大。因此,最终的限制其实是电力,所以电力股应该大涨,云云。但是如果我们通过计算机发展的历史来看这件事,比如从计算机的初代,到现在最快的计算机,算力增长了多少倍。来类比大模型的算力,能否得出一些结论。比如,未来仅从算力角度看,是否个人设备也能具备如今需要访问在线大模型才能获得的算力。这个趋势需要在哪一年能实现。给出你的计算依据。

是的,从计算机发展的历史类比来看,个人设备(尤其是笔记本,手机稍慢)大概率能在2030-2035年间实现本地运行“今天前沿大模型等效性能”(即实时、高质量推理,20+ token/s + 长上下文)。但这并非“必然铁律”,而是取决于硬件增长能否维持历史平均节奏(存在放缓风险),且仅针对“今日模型规模”,未来前沿模型若继续膨胀则时间可能推迟。电力不会是“无限token”的绝对硬瓶颈,但效率提升已放缓,数据中心总耗电仍会显著增长。 以下是基于最新查核(2026年2月数据)修正的详细依据。

1. 计算机算力历史增长:指数级下沉,但长期平均而非全程稳定

  • 起点:1946年 ENIAC ≈400–500 FLOPS。
  • 现在(2026年):El Capitan 最新TOP500验证1.809 exaFLOPS(理论峰值约2.88 exaFLOPS)。
  • 增长倍数:约3.6×10¹⁵倍(80年内),log₂后≈51-52次翻倍,长期平均每1.55年翻倍
  • 个人设备同样遵循:1981年早期PC≈10⁵ FLOPS;2026年高端手机NPU≈35-60 TOPS(AI专用),笔记本RTX 50系列旗舰(如5090)营销AI TOPS峰值达3352(中端1000-1800区间)。

历史结论:算力反复从“房间大小主机”下沉到“个人设备”,让昔日超级任务本地化。大模型不会例外,但需注意近十年通用CPU已放缓,AI专用硬件仍是主要驱动力。

2. 当前大模型算力需求基准(以GPT-4类/70B Llama为例)

  • 推理单token:密集模型理论≈2×参数量(70B≈140 GFLOPs/token;原GPT-4类报道280B活跃参数时≈560 GFLOPs/token)。实际MoE稀疏 + 量化(4-bit/更低)后有效值大幅降低。
  • 今天“需在线”的门槛:主要是内存、带宽、功耗与并发服务,而单用户实时推理(20-50 token/s)理论仅需≈10¹³-10¹⁴ FLOPS(优化后)。
  • 设备现状:2026年高端笔记本已可本地高效跑70B+量化模型(数十token/s);手机仍主要跑1-13B或重度量化版,70B+仍慢或需云端。

3. 外推计算:何时个人设备追上“今天的前沿门槛”

固定“今日模型需求”,仅看硬件增长:

  • 手机:当前35-60 TOPS → 目标≈800-1500有效AI TOPS(考虑利用率、带宽、长上下文)。需≈15-25倍 → 4-5次翻倍。
    • 按历史平均1.55年/次:≈6-8年 → 2032-2034年
    • 保守按2-2.3年/次(Koomey/Moore放缓实测):≈9-11年 → 2035年后
  • 笔记本:已更接近(RTX 50系列有效推理能力已覆盖今日70B需求),主流中高端2027-2030年即可轻松本地化。

内存现实修正(关键调整):70B 4-bit需≈35GB参数内存(+KV cache更多)。2026年手机主流RAM 8-16GB(高配/游戏机可达24GB),仍不足——需2-3bit量化、模型分割或混合云端。笔记本64GB+已无压力。

功耗与Koomey定律:每kWh算力仍指数提升,但最新研究显示2008-2023已放缓至每2.29-2.6年翻倍。个人设备固定功耗(手机5-10W)下算力仍会持续上升,边缘计算反而总电更省(无传输损耗)。电力不是“无限token”的硬天花板,但AI驱动的数据中心总耗电已显著增长。

4. 为什么“token无限→电力股大涨”逻辑不完全成立(历史+现实视角)

历史反复证明供给端(硬件+算法优化)指数增长更快,下沉到个人。过去“必须大型机”的任务早已本地化。但关键区分:个人设备会大概率接管今天的前沿等效,而2035年的前沿模型可能仍需云端(若参数/上下文继续膨胀)。量化、MoE、专用NPU正加速这一过程,开源与厂商(如Apple、Qualcomm、NVIDIA)全力推on-device AI,实际进度常超保守预测。

不确定性与风险(新增强调)

  • 模型规模若超指数增长,时间推迟2-5年。
  • 晶体管缩放、功耗墙、DRAM短缺可能让翻倍周期延长至2+年。
  • Koomey放缓已验证,电力效率提升仍在,但速度慢于历史。
  • 我的计算基于TOP500最新数据、NVIDIA官方规格、2026手机RAM实测与Koomey近期研究,未依赖厂商宣传。

最终结论:历史强烈支持个人设备(笔记本领先、手机跟随)将在2030-2035年间本地获得今日“必须在线”的高质量大模型体验,电力限制会被效率+分布式稀释。但这不是“历史铁律必然”,而是大概率趋势——前提是增长节奏不出现结构性中断,前沿模型不爆炸式膨胀。利益驱动的“电力无限论”低估了效率进步与算法优化的抵消作用,也忽略了“今天 vs 未来前沿”的关键区分。现实更可能是混合:本地处理日常,云端处理最前沿。

中国开发者使用真实地址申请Chrome开发者过程

11天前,我突发奇想,开发了第一款Chrome的插件。在X上分享之后,有人感兴趣,于是我打算上传到Chrome的插件商店,分享给大家。可我没想到,这个过程还挺困难。

信用卡不被接受

Chrome的插件商店,开发者注册需要5美元。但是这5美元只能通过银行卡扣款。扣款支持借记卡和信用卡。支持Visa,Mastercard等主流卡片。不支持银联。我想这没问题啊。因为我有一张招商银行的人民币+美元的双币卡,支持银联和Visa双通道。这张卡我已经用了很多年,在海外交易,比如美国亚马逊,都是一直好用的。

结果没想到,卡号还没输完,就被Google提示不支持这张卡。

网上攻略

上网找攻略。发现大部分人都提到可以申请招商银行的全币种的单Visa通道的卡,也可以直接申请虚拟卡。

被限制的虚拟卡

我首先想到的是申请虚拟卡。因为我觉得单独申请一张信用卡周期比较长。可我找了一圈,原本推荐的几家虚拟卡,要么已经不支持交易,要么还需要收月费。一个月就要5美元。搜了搜新闻,原来虚拟卡这个东西,好多都不合规,甚至还吃了官司,好多都转换赛道了。

申请单Visa通道的信用卡

于是我给招商银行信用卡客服打电话。我先问他为啥不能用。他不清楚。然后我说听说Visa单通道的全币卡可以,我是否能申请?他说可以,会跟我原来的卡共信用。我问他能否申请虚拟卡,他说单Visa的不行。于是我挂了电话,按照他说的使用手机银行申请Visa卡。

申请的第二天,看进度,卡已经出了,正在制作。我选择了网上部分激活。但是没用,只有卡号,没有校验码。又等了几天,终于收到卡了。

验证身份和地址

终于可以再次申请Chrome开发者了。这次直接输入卡号,校验码,地址。提交成功。

咦,收到了一封邮件,说交易取消了。需要先验证身份和地址。

  • 身份支持身份证、护照或者驾照。
  • 地址验证,支持银行对账单或者水电费账单之类的。

我这里遇到一个问题,因为我的身份证上面的地址是我家老房子的,一直没改。而我现在居住在另一个地址。而我在Google填写的地址是我自己现在这个。问题是这个月的电费、水费的通知,我前几天付款之后就扔掉了。于是我在电脑里搜索,找到一个2022年买Mac mini时苹果开的一张电子发票。于是我提交了身份证和这张发票。

没想到,还是收到了验证失败的邮件。说有问题可以直接回复邮件。我回复,苹果公司的电子发票不能证明吗?

我没收到回复,不过第二天我收到了验证通过的邮件。

验证成为交易者

重新支付,支付成功,终于进入了开发者界面。直接弹窗。询问我是否交易者。交易者,Trader,这个我知道,是欧盟的要求,苹果商店也有。而且如果你是卖自己的软件,就需要申请交易者身份。我点是,又要验证。这次多了条件,验证地址的证明必须得是60天内的,这样2022年的苹果发票就不行了。

我一想,不是刚收到信用卡吗?信用卡是中国邮政的挂号信,上面有地址,有日期,有人名,有银行名,这不是信用杠杠的?于是我使用身份证和信封来验证。

居然验证失败了。中国邮政杠杠的信用人家不认。我没办法了,我将问题详细描述给AI,AI和我说,主要是地址问题,地址和身份证不一致没关系,Google不看重那个。但是证明文件必须得是水电费或者银行的对账单。然后告诉我招行网站可以申请电子版的。于是我打开掌上生活,设置了邮箱,然后选择补发,然后将补发的对账单pdf上传了。

终于,交易者验证成功。

小结

与Google Play不同。Google Play不支持设置地址为中国,所以只能选择其它地方作为地址。Chrome插件的开发者,是支持中国开发者注册的。需要的是使用Visa的单通道的信用卡。然后通过身份证+银行对账单就能完成。需要支付5美元。最后,地址可以和身份证上的不一致,但是需要跟银行对账单上的一致。

插件地址

最后,我的插件已经上架了,欢迎使用。