Logo
Published on

当我用 AI 工作时,我究竟在做什么?

Authors
  • avatar
    Name
    浩森 Hansen
    Twitter

马上是 2026 年的新春,我仍然想和大家聊聊 AI 的话题,因为我在更深入的研究 AI 之后,我对它有了新的认识。

回想起 Attention Is All You Need 这篇论文还是 2017 年发表的,到现在为止,也还不到 10 年,但是计算机世界因为 AI 的出现正在发生天翻地覆的变化。

我依然在持续跟进 AI 的发展,坚持阅读相关论文,并且一直使用 AI 工作。

截止到 2026 年初为止,我对 AI 的总体观点是:“一个可在指定范围内工作的极佳自动化工具”。

自动化工具

AI 的底层还是机器学习模型,我称之为 2020s 年代的全新计算机算法。既然是算法,那么就是数学。所以 AI 处理任何工作都是基于数学模型计算出来的结果。

别看那些天花乱坠的 AI 应用,眼花缭乱的数学公式,机器学习的核心只是:从已有的大量信息中发现规律,并输出一些像样的东西。

只是随着人类数字化的东西越来越多,信息量已经远远超出了个体人类所能消化的范畴,人们会觉得:AI 就像神一样不可捉摸。

但是,每一次技术革命,人们都会觉得世界被颠覆了,而现在也不例外。

AI 的确善于发现并总结规律,并完成经验的归纳。而如今,Agent 则让归纳得到经验能够应用到新的场景里去。

你用通义千问点奶茶,实际上就是在使用一个自动化工具来帮你处理琐碎的日常事务。

你用 Sora 制作一个视频,实际上也是使用一个自动化生成工具:它在参考了大量专业视频之后,帮你生成了一个不错的视频素材。

我用 claude 写代码,也是一样。

“自动化工具”带来生产力的跃升,已经初现端倪。

受限于:指定范围

但是,超级工具的局限性也很明显。

在我看来,AI 就像人类在之前发明的很多工具一样好用,而今后更加。但是它还是受限于几方面:

  • 受限于已知的经验:AI 要找规律,而规律总是存在于它的训练数据中,训练数据代表的,是已知的经验。
  • 受限于工程师的经验:仅仅是语言模型其实做不了太多事情。Agent 可以做事,是因为工程师在根据用户的需求做了相当多的设计于开发,用户才得以很好使用的。
  • 受限于用户的经验:AI 要能够真正做事,还是需要用户来定义具体的做事方式。用户在具体的场景下指挥 AI 怎么做事,决定了最终结果如何。

还是点奶茶的例子,通义千问通过训练,已经知道了奶茶、外卖是什么,有哪些品牌的奶茶好喝等常识;工程师帮它实现了用户对话、搜门店、奶茶下单的功能;用户给出了需求:我喜欢什么奶茶,送到哪里。

写代码时也是一样,我提出需求,AI 帮我计划一个解决问题的方法。尽管第一个提案往往不是最好的方式,然后我提出修改意见,AI 修改。几轮对话之后,我拿到了我想要的结果。

所以,你看到人的价值了吗?

已知的数据是人的数据,工程师的工作是人的工作,用户的需求是人的需求。以上这些所有的“人的指令”,决定了 AI 最后的给出的结果。

AI 不会替代人,相反,AI 永远无法离开人独立存在

就像汽车是人腿的延伸一样,计算机是人脑计算能力的延伸,AI 是人脑思考能力的延伸。

AI 将思考自动化了,而我们,又能提供什么呢?

我认为 AI 最革命性的地方,在于它将人的“语言思考”自动化了

你在用 DeepSeek 时,可以清晰看到它以语言形式呈现的思考过程。

别忘了,人类能解决抽象问题,也是首先用语言来思考的。只不过这次,科学家利用数学,将这个过程用算法表示出来了。

很多人说 AI 的输出是 “Next-Token Prediction”,也就是在预测下一个词说什么,别看它简单,但实际上它很好的模仿了人类的思考过程。

当老板给我布置任务的时候,我也用了 Next-Token Prediction:根据需求,利用我自己的专业知识,拍一份报告在领导的办公桌上。牛马任务完成!

就连这篇文章的写作,也是 Next-Token Prediction。

不过,我还是利用了我自己熟悉的文本结构、逻辑和语气。这代表了我的思考,AI 只能围绕我的中心思想工作。

如果把 AI 看成是“一个自动思考的系统”,也是一个自动处理信息的封闭系统,那么我的提示词,其实就是对这个系统注入了新的“信息增量”。

从信息论的角度来看,我用我的知识,为这个系统增加了新的信息,让它产出的结果更加准确。

所以,我想大概,最终 AI 无法也抢走我们的工作,只是工作方式被颠覆了。


浩森,于 2026 年腊月廿六