肇鑫的日常博客

肇鑫 / Owen Zhao

独立开发者,主要开发 iOS、watchOS、macOS 应用。

目前在维护 SleepTapRooster Time,以及 Markdown Writer 相关工具。

最新文章

忙碌的一天

随笔

今天还挺忙碌的。一大早起来,想着把昨天买的内存条装到台式机上,然后再打个游戏试试16G内存升级到32G内存的效果。

换内存

结果没想到第一步就很波折。拼多多买的这个组装机,是七彩虹的H610主板,配七彩虹的DDR4 3200 16GB单条内存。我新买的这个内存条是DDR4 3200 16GB的长城内存,带了个散热马甲。

结果安装上去之后,居然不识别。原本的内存是插在内存2插槽,内存1插槽的内存不识别。我关机,单独将长城的内存条插在内存1上。结果开机之后,虽然主板风扇转,但是显示器不亮。

我怀疑是内存1坏了。关机之后,将长城的内存条拿下,然后换上自带的七彩虹内存。这次开机了。然后,又将长城内存插到内存2上,再开机。这次终于识别出来32GB了。不过进入Windows变得很慢。

进入Windows变慢应该是虚拟内存的问题。因为默认Windows 11会创建内存同样大小的虚拟内存,也就是32GB。

游戏又遇问题

内存装好了。我想着打一把赛博朋克2077吧。结果EPIC应用登录之后,提示我并没有购买过赛博朋克2077,需要购买才能玩儿。

我这就疑惑了。因为我记得我明明是买了啊。而且我都打过几小时了。结果EPIC应用说我的游戏时长为0。

于是我在我的Gmail邮箱搜索EPIC,想要找到我当时购买时的收据。结果居然没搜索到。我很疑惑。我想到我当初还发过微博。于是我在我的微博搜索赛博朋克。找到我当时发的微博是2024年1月2号。

于是我在邮箱搜索我的常用信用卡招商银行的信用卡账单。1月、2月也都没有这笔交易。难道我真的没有购买过吗?

我想到我还有一张工商银行的信用卡,通过工银e生活,我查到1月2号我通过支付宝购买过这个游戏。于是我有打开支付宝,找到了这笔订单。

与EPIC的交涉

我通过EPIC网页的反馈功能,像EPIC发送了询问。并且提供了支付宝订单支付的截图。

EPIC很快就给我回复了。说光有支付宝的订单支付截图不行,还需要有EPIC的收据截图。前面说了我没有找到这个。于是我需要联系另外一方。

与Xsolla的交涉

在支付宝的订单上,可以看到钱是付给了一家叫Xsolla的公司。我在Google搜索到了这个公司的网站。它是一家专门做游戏第三方支付的。通过它的反馈表格,我提交了说明。说EPIC找我要收据。但是我没有。钱是付到你这边的。你能否提供查一下,然后提供给我证明,证明我的确是购买了的。

Xsolla的回复也很快。它说我没有提供订单支付的截图。我回复说,我之所以没提供截图,是因为你们的那个反馈的表单没有上传图片的功能。我在邮件里提供了支付宝的截图。

下午,我收到Xsolla的发来的EPIC的购买确认收据。然后又把这个收据转发给了EPIC。并且告诉EPIC,我当时没有没有收到收据。不过我联系Xsolla,今天给我重新发了这个的收据。目前我还在等EPIC的最后回复。

固态硬盘的问题

因为赛破朋克2077暂时玩不了。我打算玩一下生化危机-村庄。结果读取游戏进度特别慢。我关闭了游戏。测试了一下磁盘速度。我的是1TB的金士顿的固态硬盘,分了两个区,每个512GB。结果C区速度正常。D区(游戏所在区),读取正常,写入只有几MB/s。我查询了一下,发现固态硬盘的Trim是开着的。但是C区有一半的剩余空间。D区只有90几G的剩余空间。于是我又删除了几个游戏。 把D盘的剩余空间变成140G。这次trim被触发了。重新测试D盘速度也正常了。

结论

拼多多购买的PC虽然便宜。但是用起来麻烦事还挺多的。如果碰到一个不熟悉电脑的人。估计用不了多久就需要换新电脑了。

非官方支持的Mac开启macOS 15.1 AI功能和Xcode AI代码补全功能的办法

技术

github上的文档已经写的很不错了。大家按照上面操作基本上就能成功。就是还有一些注意事项,我会在这里提一提。

https://github.com/Kyle-Ye/XcodeLLMEligible/blob/main/README_CN.md

推荐使用禁用SIP自动运行脚本的方法。

注意:Xcode和苹果AI是两个不同的脚本。需要分别运行。
运行Xcode脚本之前,要先安装完成Xcode 16 beta。不然可能会遇到问题。遇到问题,解决办法就是再次运行一遍Xcode的脚本。

禁用/打开SIP的方法

  1. 关闭Mac。
  2. 长按电源按钮,直到屏幕亮起。
  3. 选择设置。
  4. 选择终端。
  5. 输入命令,按照提示操作。
  6. 重启电脑。

关于墙的碎碎念

技术

7月13号的时候,突然翻不了墙了。但是同时http服务或者SSH服务却全都正常。我以为是我前一天升级了服务器导致的。于是选择了重装。结果还是不行。

经过了一天的调试,最终发现,原来是墙封了我的VPS的IP的433端口。没办法,之后重新又开了一台VPS。

又过了快一周的时间,我在推上看到有人说是因为开会的缘故。

记录一下,下一次就不用浪费这么多时间了。

苹果表不能解锁Mac的最佳解决方案居然是……

随笔

上个月苹果买的苹果表s9出现了一个诡异的问题。我的M1 Mac mini安装了双系统,macOS 14.5和macOS 15 beta。二者的内容基本相同,macOS 15 beta是全新安装,然后通过融合助手将macOS 14.5的数据和设置导入。

诡异的问题是macOS 15 beta下苹果表的解锁是好的。macOS 14.5的解锁却无法设置成功,提示Mac无法与苹果表通信。

我在网上找了很多办法,询问了AI,都没能解决这个问题。

这里我要说一下,苹果表一开始是可以和macOS 14.5设置解锁的。不过苹果表刚买来的头3天,电池电量掉的特别快,差不多一个白天电量就需要充电了。和网上说的能用一整天说法差太多。我自我分析之后,认为这是因为我配对了Xcode和手表,导致的。于是我在手表里将开发者模式关闭了。结果发现macOS 14.5就无法连接了。于是我又重新打开开发者模式,结果还是不行。

题外话,续航短的问题倒是解决了。目前佩戴24小时还能剩50%左右的电量。

最终解决

我最初想到的方法是重置设置,但是M1芯片的Mac没有单独恢复设置的方法,只能连系统一起还原。于是我想到,我可以尝试安装新版的macOS,看看安装之后会不会变好。因为14.5已经是最新的稳定版了,于是我选择升级到14.6 beta 3。安装之后,重新设置使用苹果表解锁,结果立刻就成功了。

我所理解的大语言模型(LLM)

随笔

LLM是目前最火的科技词汇。乐观的人认为很快就会有通用的人工智能。但现阶段来说,LLM还没有宣传的那么神奇。那么究竟什么才是LLM的本质呢?

LLM的本质其实就是矩阵数据库。即然是数据库,当然是越大越好。因此,那些为了在本地运行而限缩的数据库,必然会在损失精度的同时损失准确性。我们可以将LLM想象为一部百科全书。完整的版的百科全书,和精简版的,虽然都是百科全书,内容也都是正确的。但是二者的详尽程度,必然不同。

LLM分类

LLM分类有很多种,比如按照功能,有通用类型的、翻译类型的、专注任务类型、偏重于编程的类型的等。但我认为对于普通人来说,最好的分类,是将它分类为联网型和非联网型。

联网型

联网型,顾名思义,就是在回答问题时,LLM会先分析你的问题,然后根据你的问题去搜索引擎搜索,然后利用LLM的归纳总结功能,将排名靠前的搜索结果的网页打开并总结,最终综合这些内容,来回答你的问题。

联网型的优点是实时性强,因为是实时搜索,即便是最新的内容也都可以找到。缺点是,如果LLM对于的问题理解错误,或者搜索到的内容质量不高。回答的质量也就不高。

非联网型

这个是目前的主流形式。LLM的开发商定期更新大模型,你问的问题,如果在它的范围内,它就能回答你。

非联网型的优点是对于它知道的内容,回答质量较高。缺点是,对于它不知道的内容,它就会胡乱回答一气。比如你问它最近有什么电影上映。它回答的可能是一年之前的。

LLM的局限

对于普通的人来说,LLM的最大局限性,就是LLM其实不知道它回答的内容是否正确。是的,它不确定自己回答的内容的是否正确。它只是将它计算过后的最可能正确的结果进行输出。

不过,这其实也可以理解。因为对于普通人来说,自己考试的时候,自己答题,有时候也是不知道是否正确,只是将自己以为正确的答案写出来。

所以,对于LLM,我们态度应该更像是面对人类,而不是面对计算机。即LLM的回答有可能是错误的,而不是一定是正确的。

如何理解LLM

我们可以将LLM理解为是一个人类。它的容量大小,就相当于一个人所掌握的全部知识。因此,容量越大越好。但是容量越大,运行时需要的资源越多,运行速度就越慢。因此,今后一段时间内,提升运行速度,是提升LLM的最佳办法。只有运行速度够快,才能跑更大的模型,模型才能更智能。

但是同时,我们也要意识到。LLM作为单独的一个“人”,它同样存在人的局限。它的回答不一定是正确的。对于它不了解的问题,它甚至可能胡编乱造一个答案。因为它只是将最可能正确的结果进行输出。如果没有正确率高于80%的结果,那么5%的正确率也可能是最高的,一样会输出。因此,对于LLM的一切处理结果,我们都需要审慎对待。

奔跑吧第12季第2集游戏规则探讨以及游戏设定的思考

随笔

昨晚播出的奔跑吧第12季第2集规则描述简单,但是实际上要玩儿起来还是挺有意思的。当然,这期的演员由于自身的原因,没能很好的利用起来这些规则。所以从技巧的角度来说,这个规则完全被他们浪费了。

如何做才对“好人”一方更有利?

游戏中,3颗红豆的被认为是“好人”,2红1黑的被认为是坏人阵营。游戏规则:

  1. 共10人,其中好人7人,坏人3人。
  2. 好人和坏人都可以搜集火柴,然后投票,7根火柴可以燃烧某一个人的一个球。这个球由投票的人自由选择。红球被燃烧冒红烟,黑球冒黑烟。
  3. 每一轮,只要选择用火柴烧球,那么这一轮结束时,所有人需要轮换一轮球。规则是从自己左手边的那个人那里抽取一个球。
  4. 游戏分为前期和后期。
  5. 后期,坏人可以在相思小院通过7根火柴直接杀死一个好人。但,好人可以通过提前烧取自己一个球来保命,或者通过搜集玉佩来保命。

分析规则

  1. 在不考虑互相告知的情况下。总球数一共有30个,黑球3个。因此单次抽中黑球的概率只有3/30,即10%。而一旦轮转,每次有1/3的概率抽中黑球,连续3次抽不中黑球的概率是(1-1/3)^3=0.296,也就是说每轮坏人感染好人概率接近70%。
  2. 10% VS 70%,可以得出结论,只能烧个一次两次的,那么烧球是非常不划算的。好人的策略应该是攒火柴,但是不烧,留到最后一次烧,这样能避免坏人感染。如果好人认同这一点,坏人就只能自己烧球,也就是谁主张提前烧球,谁就是坏人。
  3. 此外,后期的规则中,表面的看好人烧自己的球是为了保命,但是其实烧球对于好人也是有极大好处的。因为好人有3颗红球,坏人只有两颗红球。因此,当好人选择全部烧球时,坏人只有两种选择,要么跟着烧球,要么选择不烧球。
    1. 坏人选择烧球,这会造成总球的减少,使得好人烧球的时候,烧到坏球概率大增。比如如果全员选择烧球,那么选择黑球的概率就会从10%,增加到3/20,即15%。
    2. 坏人如果选择不烧球,那他就暴露了。因为好人即使有玉佩,也应该选择烧球。因为这能增加好人烧坏球时的选中概率。

综上,好人应该尽量搜集火柴和玉佩,不投票,并且每一轮都烧球。而坏人最佳策略要想不暴露,也只能跟着烧球。并且同样不投票。这样两轮之后,场上的局面就会变成每个人都只有1个球,其中好人手里都是红球,坏人手里都是黑球。此时就可以投票了。好人把自己所有的火柴都投出去。只要能选中坏人,那就一定能选中黑球。

关于游戏设定的思考

游戏是木偶相关,说是有十个传奇的木偶。但是其中有3个木偶不是三颗红心,而是两颗红心一颗黑心。有黑心的木偶认为这么多年是人类在压迫和利用木偶,想要反抗。游戏中将这种木偶定义为坏人。

但这样的木偶真的是坏人吗?我们知道,人之所以能操纵木偶,是因为木偶本身是没有意识的。但是现在,黑心木偶变得有意识了。也就是说木偶本身没有意识的这个前提不存在了。新的前提是没有意识的木偶其实是还没有意识。从这个角度,人类对于木偶的操纵就变成利用和压迫。因此,对于有意识的木偶人类应该平等看待,而不是单纯的将他们认为是坏人。

今天购物的两件小事

随笔

小事1

最近喜欢上吃河南开封的兴盛德花生。一开始是买的大包装的,一包400克。要分好几次才能吃完。于是再买就换了一家,买小包装的。每次我都买五香+麻辣的混合装各1斤。买了两次,我隐隐觉得每次都是五香的比麻辣的多。并不是每样各一斤。

于是这次买的时候,我特意看看了一下购买选项,看到写的就是五香+麻辣混合1公斤,并没有说每个是1斤。于是我这次单独下单,每样1斤,而且特意注明,我发现以往都是五香的多,麻辣的少,这次不买混合的,希望两个数量一样。

到货之后,我把花生拿出来一数。五香30包,麻辣25包。这明显差太多了。于是我找客服理论。客服还视图遮掩过去,说他们这个是称重的。我说称重也不能差出去5包啊。都20%。

既然她说是称重的,那我就称重。我小米体重秤称重,减去我的体重。结果五香1.3斤,麻辣0.8斤。因为小米体重秤是体重秤,精准度只有0.1斤。但也可以看出,的确是五香的多了,麻辣的不够。客服不愧是标准河南人,就是执拗,证据都摆在面前了。还和我狡辩说总重量是够的。我说,我是单独下的两个单子,其中一个不足。按照消费法,需要赔偿。她说可以换货或者退货退款。我说我选择赔偿。最后她说只能赔1元。我说按照消费法,最低的赔偿是1000元。我说我本来也没有非要1000元,但是你一开始就不承认有少,还非让我称重。而且你们每次都少,之前我只是没数,就算了。你们都是惯犯。而且,5袋,按照你们的价格至少也是3元。最后赔了2元。我和客服说,我以后买,如果还是这样,我还得找你要赔偿。她承诺找仓库反应这个问题。

消费者说:五香的卖得不如麻辣,那么你可以调整生产计划,少生成五香。而不是糊弄消费者。河南真是不会做生意。

小事2

今天美团买了7样东西。取货时已经装好了,一大包我就拿回来。结果发现多了一样“爆浆鹌鹑蛋”。给团长打电话,和她说如果着急就来我家拿,如果不急,我就明天给她送过去。获得了感谢。

消费者说:不是自己的不能要,这是基本素质。但是就是有人缺乏这种素质。之前我又一次点美团外卖,点的熟食猪头肉之类的。结果外卖员送错了。我给他打电话问他送哪里去了。结果他还送外卖太多,找不到了。最后外卖配送的站点的负责人打电话给我道歉,让我重新下单,微信里里给我发了红包作为补偿。而那个出错的外卖员最终也没有出现。我猜是不是羞愧地离职了?自己点没点外卖不知道吗?心安理得的吃了。这种人真是没有素质。

Ollama运行本地大模型的一些技巧

技术

使用Ollama也有一些时间。从小白阶段,只懂按照命令行运行。到现在会自己从抱抱脸选择官方没有的模型自己进行导入。甚至创建局域网内部的服务器,使用应用调用Ollama的API。是时候总结一下Ollama本地运行大模型的一些技巧了。

运行方式

终端运行

新手一般会使用

ollama serve

启动Ollama,并使用ctrl+c结束运行。

以服务方式运行

我们还可以使用服务的方式运行Ollama。这样Ollama在系统启动之后就会在后台调用,可以随时调用。

brew services start ollama

需要注意的是,如果你是了此种方式。那么每次ollama升级之后,需要使用

brew services restart ollama

重新启动Ollama服务。

服务局域网

默认情况下,Ollama只会关注localhost的11434端口,因此只能从本机访问。局域网的其它电脑无法使用。我们可以修改设置,然后重启Ollama服务。这样局域网内的其它电脑就都可以使用Ollama了。

launchctl setenv OLLAMA_HOST "0.0.0.0"
brew services restart ollama

我们可以这个命令,查看Ollama运行的状态

lsof -i -P | grep ollama

如果你看到的是这个,就证明成功了

ollama      602 zhaoxin    3u  IPv6 0xb435894e8a5320f      0t0  TCP *:11434 (LISTEN)

如果你想固定上面的设置。那么就需要修改/opt/homebrew/opt/ollama/homebrew.mxcl.ollama.plist文件,为它添加:

<key>EnvironmentVariables</key>
<dict>
    <key>OLLAMA_HOST</key>
    <string>0.0.0.0</string>
</dict>

然后停止Ollama服务,并重新开启。注意,我发现用restart不行。必须先stop,然后重新start。不然重启之后,就还是只有localhost。

brew services stop ollama
brew services start ollama

https://github.com/ollama/ollama/blob/main/docs/faq.md
https://github.com/ollama/ollama/issues/3581

模型选择

模型的选择首选是基于功能。不同的模型擅长的领域不同。比如某些模型不支持特定的语言,某些模型具备识别图片的能力,有些模型更擅长编程等。

其次就是版本的选择。总的来说,就是越小的模型,运行时的反应越快,但是同一个模型,越大的模型的输出结果越好。因此,我们需要要在结果准确性和推理速度中作出权衡。一般来说,如果你的电脑只有8GB内存。那么你也就只能选择7B以下的模型,默认模型能跑就不错了。而如果你有16GB内存,那么你最高可以运行13B的模型。而7B模型,也可以选择参数更高的版本比如7B-4bit-K_M之类的。它会标准的标准的4bit性能要好一些。

导入模型

Ollama是llama.cpp的。它支持所有gguf格式模型文件。因此我们在抱抱脸上搜索模型名+gguf,就能下载Ollama官网没有的模型。然后可以通过创建Modefile文件的方式进行导入。格式就是:

FROM gguf文件地址

然后执行

ollama create 模型名 -f Modefile

等一会,这个模型就被导入Ollama了并能使用了。

API调用

下面这段只有程序员需要。

仿OpenAI调用

Ollama支持OpenAI的API的兼容调用方式。这样可以更好复用代码。不过这种方式调用目前只支持chat api的调用。并且不支持Vision。

https://github.com/ollama/ollama/blob/main/docs/openai.md

因此如果你使用下面这两个API的时候,还是需要Ollam的自有API。

ListModels调用

https://github.com/ollama/ollama/blob/main/docs/api.md#list-local-models

Vision调用

https://github.com/ollama/ollama/blob/main/docs/api.md#generate-a-chat-completion