肇鑫的日常博客

日常

我所理解的大语言模型(LLM)

LLM是目前最火的科技词汇。乐观的人认为很快就会有通用的人工智能。但现阶段来说,LLM还没有宣传的那么神奇。那么究竟什么才是LLM的本质呢?

LLM的本质其实就是矩阵数据库。即然是数据库,当然是越大越好。因此,那些为了在本地运行而限缩的数据库,必然会在损失精度的同时损失准确性。我们可以将LLM想象为一部百科全书。完整的版的百科全书,和精简版的,虽然都是百科全书,内容也都是正确的。但是二者的详尽程度,必然不同。

LLM分类

LLM分类有很多种,比如按照功能,有通用类型的、翻译类型的、专注任务类型、偏重于编程的类型的等。但我认为对于普通人来说,最好的分类,是将它分类为联网型和非联网型。

联网型

联网型,顾名思义,就是在回答问题时,LLM会先分析你的问题,然后根据你的问题去搜索引擎搜索,然后利用LLM的归纳总结功能,将排名靠前的搜索结果的网页打开并总结,最终综合这些内容,来回答你的问题。

联网型的优点是实时性强,因为是实时搜索,即便是最新的内容也都可以找到。缺点是,如果LLM对于的问题理解错误,或者搜索到的内容质量不高。回答的质量也就不高。

非联网型

这个是目前的主流形式。LLM的开发商定期更新大模型,你问的问题,如果在它的范围内,它就能回答你。

非联网型的优点是对于它知道的内容,回答质量较高。缺点是,对于它不知道的内容,它就会胡乱回答一气。比如你问它最近有什么电影上映。它回答的可能是一年之前的。

LLM的局限

对于普通的人来说,LLM的最大局限性,就是LLM其实不知道它回答的内容是否正确。是的,它不确定自己回答的内容的是否正确。它只是将它计算过后的最可能正确的结果进行输出。

不过,这其实也可以理解。因为对于普通人来说,自己考试的时候,自己答题,有时候也是不知道是否正确,只是将自己以为正确的答案写出来。

所以,对于LLM,我们态度应该更像是面对人类,而不是面对计算机。即LLM的回答有可能是错误的,而不是一定是正确的。

如何理解LLM

我们可以将LLM理解为是一个人类。它的容量大小,就相当于一个人所掌握的全部知识。因此,容量越大越好。但是容量越大,运行时需要的资源越多,运行速度就越慢。因此,今后一段时间内,提升运行速度,是提升LLM的最佳办法。只有运行速度够快,才能跑更大的模型,模型才能更智能。

但是同时,我们也要意识到。LLM作为单独的一个“人”,它同样存在人的局限。它的回答不一定是正确的。对于它不了解的问题,它甚至可能胡编乱造一个答案。因为它只是将最可能正确的结果进行输出。如果没有正确率高于80%的结果,那么5%的正确率也可能是最高的,一样会输出。因此,对于LLM的一切处理结果,我们都需要审慎对待。

奔跑吧第12季第2集游戏规则探讨以及游戏设定的思考

昨晚播出的奔跑吧第12季第2集规则描述简单,但是实际上要玩儿起来还是挺有意思的。当然,这期的演员由于自身的原因,没能很好的利用起来这些规则。所以从技巧的角度来说,这个规则完全被他们浪费了。

如何做才对“好人”一方更有利?

游戏中,3颗红豆的被认为是“好人”,2红1黑的被认为是坏人阵营。游戏规则:

  1. 共10人,其中好人7人,坏人3人。
  2. 好人和坏人都可以搜集火柴,然后投票,7根火柴可以燃烧某一个人的一个球。这个球由投票的人自由选择。红球被燃烧冒红烟,黑球冒黑烟。
  3. 每一轮,只要选择用火柴烧球,那么这一轮结束时,所有人需要轮换一轮球。规则是从自己左手边的那个人那里抽取一个球。
  4. 游戏分为前期和后期。
  5. 后期,坏人可以在相思小院通过7根火柴直接杀死一个好人。但,好人可以通过提前烧取自己一个球来保命,或者通过搜集玉佩来保命。

分析规则

  1. 在不考虑互相告知的情况下。总球数一共有30个,黑球3个。因此单次抽中黑球的概率只有3/30,即10%。而一旦轮转,每次有1/3的概率抽中黑球,连续3次抽不中黑球的概率是(1-1/3)^3=0.296,也就是说每轮坏人感染好人概率接近70%。
  2. 10% VS 70%,可以得出结论,只能烧个一次两次的,那么烧球是非常不划算的。好人的策略应该是攒火柴,但是不烧,留到最后一次烧,这样能避免坏人感染。如果好人认同这一点,坏人就只能自己烧球,也就是谁主张提前烧球,谁就是坏人。
  3. 此外,后期的规则中,表面的看好人烧自己的球是为了保命,但是其实烧球对于好人也是有极大好处的。因为好人有3颗红球,坏人只有两颗红球。因此,当好人选择全部烧球时,坏人只有两种选择,要么跟着烧球,要么选择不烧球。
    1. 坏人选择烧球,这会造成总球的减少,使得好人烧球的时候,烧到坏球概率大增。比如如果全员选择烧球,那么选择黑球的概率就会从10%,增加到3/20,即15%。
    2. 坏人如果选择不烧球,那他就暴露了。因为好人即使有玉佩,也应该选择烧球。因为这能增加好人烧坏球时的选中概率。

综上,好人应该尽量搜集火柴和玉佩,不投票,并且每一轮都烧球。而坏人最佳策略要想不暴露,也只能跟着烧球。并且同样不投票。这样两轮之后,场上的局面就会变成每个人都只有1个球,其中好人手里都是红球,坏人手里都是黑球。此时就可以投票了。好人把自己所有的火柴都投出去。只要能选中坏人,那就一定能选中黑球。

关于游戏设定的思考

游戏是木偶相关,说是有十个传奇的木偶。但是其中有3个木偶不是三颗红心,而是两颗红心一颗黑心。有黑心的木偶认为这么多年是人类在压迫和利用木偶,想要反抗。游戏中将这种木偶定义为坏人。

但这样的木偶真的是坏人吗?我们知道,人之所以能操纵木偶,是因为木偶本身是没有意识的。但是现在,黑心木偶变得有意识了。也就是说木偶本身没有意识的这个前提不存在了。新的前提是没有意识的木偶其实是还没有意识。从这个角度,人类对于木偶的操纵就变成利用和压迫。因此,对于有意识的木偶人类应该平等看待,而不是单纯的将他们认为是坏人。

今天购物的两件小事

小事1

最近喜欢上吃河南开封的兴盛德花生。一开始是买的大包装的,一包400克。要分好几次才能吃完。于是再买就换了一家,买小包装的。每次我都买五香+麻辣的混合装各1斤。买了两次,我隐隐觉得每次都是五香的比麻辣的多。并不是每样各一斤。

于是这次买的时候,我特意看看了一下购买选项,看到写的就是五香+麻辣混合1公斤,并没有说每个是1斤。于是我这次单独下单,每样1斤,而且特意注明,我发现以往都是五香的多,麻辣的少,这次不买混合的,希望两个数量一样。

到货之后,我把花生拿出来一数。五香30包,麻辣25包。这明显差太多了。于是我找客服理论。客服还视图遮掩过去,说他们这个是称重的。我说称重也不能差出去5包啊。都20%。

既然她说是称重的,那我就称重。我小米体重秤称重,减去我的体重。结果五香1.3斤,麻辣0.8斤。因为小米体重秤是体重秤,精准度只有0.1斤。但也可以看出,的确是五香的多了,麻辣的不够。客服不愧是标准河南人,就是执拗,证据都摆在面前了。还和我狡辩说总重量是够的。我说,我是单独下的两个单子,其中一个不足。按照消费法,需要赔偿。她说可以换货或者退货退款。我说我选择赔偿。最后她说只能赔1元。我说按照消费法,最低的赔偿是1000元。我说我本来也没有非要1000元,但是你一开始就不承认有少,还非让我称重。而且你们每次都少,之前我只是没数,就算了。你们都是惯犯。而且,5袋,按照你们的价格至少也是3元。最后赔了2元。我和客服说,我以后买,如果还是这样,我还得找你要赔偿。她承诺找仓库反应这个问题。

消费者说:五香的卖得不如麻辣,那么你可以调整生产计划,少生成五香。而不是糊弄消费者。河南真是不会做生意。

小事2

今天美团买了7样东西。取货时已经装好了,一大包我就拿回来。结果发现多了一样“爆浆鹌鹑蛋”。给团长打电话,和她说如果着急就来我家拿,如果不急,我就明天给她送过去。获得了感谢。

消费者说:不是自己的不能要,这是基本素质。但是就是有人缺乏这种素质。之前我又一次点美团外卖,点的熟食猪头肉之类的。结果外卖员送错了。我给他打电话问他送哪里去了。结果他还送外卖太多,找不到了。最后外卖配送的站点的负责人打电话给我道歉,让我重新下单,微信里里给我发了红包作为补偿。而那个出错的外卖员最终也没有出现。我猜是不是羞愧地离职了?自己点没点外卖不知道吗?心安理得的吃了。这种人真是没有素质。