AI会伴随我们走向何方
现状和目前的生态
伴随AI模型的迭代,所有人都在逐渐产生恐慌,与其说我们的工作在逐渐被取代,不如说我们的工作在逐渐变化。所有这些恐慌的来源,无一例外都源自于 同一个源头:AI变得有些过于好用了。
我并不是说,所有关于AI的应用构建都毫无价值,但是很明显一旦AI的专业能力超过某个阈值,那么对应行业遭受的打击都是毁灭性的。数天前的SAAS持股大逃离 的事件所带来的恐慌目前余温尚存,它还在提醒我们,这并不是幻想。
让我举例来讲:
- 如果模型对于文本的注意力可以超过100M上下文,那么我们对于现存的小说AI编排是否还具备意义?
- 如果模型对于音乐的注意力可以超过半小时,那么我们对于现在的音乐AI编排是否还有价值?
- 如果模型对于视频的注意力可以超过半小时,那么现在的AI视频生成工作流对于视频工作是加速产出还是减速?
编码模型的成功毫无疑问激励了所有的AI构建者,也打击了很多传统行业投资人的信息,我要说的是,构建应用并非没有意义,梳理正确的商业模型才是解开问题的关键。
商业模型下的思考
我长期供职在软件工程师的职位上,由于协作的问题,也会经常参与架构和DevOps相关的工作,所以我并非构建商业版图的专家,我只能在我的角度下阐述观点, 这绝对有局限性,但毫无疑问商业模型的思考是必要的,因为商业模型是AI应用落地的基石。
长期以来,AI从传统的机器学习,深度学习模型逐步走到了大语言模型时代,这背后是计算能力的提升,数据量的增加,以及算法的创新。但是很明显,这些大模型 是基础设施而并非完整的应用,有两个非常重要的原因:
- 模型本身不够好
- 场景中的上下文不够丰富
但最近,大模型逐步展现了自己惊人的推理能力和上下文理解能力,这催生新一代关于AI的工作流,和关于大量关于AI工作流的构建想法,这些创意在过去的数年间 展示了更优秀也更可靠的“生产线”竟然能如此的高效,曾经很多耗时数周的任务会被一次对话在数分钟内完成。
但值得注意的是,这让很多人催生了一个幻觉“大模型只是基础设施,而我们需要构建更完善的生产线来盈利”。
换句话说,在这个产业链条中,应用集成商实际上是在围绕大模型构建应用,然后通过应用售卖服务来盈利,但这即便在短期的未来也可预见的不可持续。 那么到底是什么导致了这一点呢?很简单,基础设施优秀的能力让复杂的应用集成价值越来越低,在这个过程中,最终杀死死守传统的殉道者不是人类,而是能录足够优秀 能获取到丰富上下文的模型。
那么这条路线问题到底出在哪?
以下是我的思考:
复杂的集成应用的存活逻辑是这样的:
- 应用集成必须复杂
- 模型的能力必定不会超过现有智能的边界
- 模型的表现不稳定,结果必须难以控制
- 模型的在长上下文中专注能力必须不足
好吧,上述逻辑其实在未来的几年内应该依旧成立,但如果你以此为优势构建自己的商业模型,那么很明显,你在和科技的发展对着干😄。
这样看下来,传统路径确实是死局。但其实我们应该关注的重点其实不在于“工作”而在于“产出”,换句话说交付的“价值”才是真正意义上有效的思考,当你将拥有新的视角。 云计算服务商交付的事实上是算力而非“云”或者“计算”,大模型训练商交付的实际是“算法”而并非“模型”,而应用集成商呢?实际上交付的并非“应用”而是有价值的“生产路径”和 应用模式的“内容价值产出”。事实上这很容易理解,只要生产路径和应用模式中存在雷同点的两家企业,那么必然存在激烈的竞争关系,这并非是应用形态决定的。
让我换句话说,如果你不打算训练模型,也不打算搭建云计算中心,那么你最好比普通人更会用AI解决问题,去构造市场上从未出现,能解决具体问题的应用,这不是996就能解决的问题,它需要新鲜的灵感,需要创造力,需要不断地探索未知的边界。 这并不局限在某个领域里,毕竟很大程度上,应用集成商只是 “给Token一个可信的商业附加值”而已,不过是在加价卖token。
短期可遇见的未来 - MCP & SKILLS & Tool
毫无疑问,对现有工作流的提效的思考在AI相关的社区中已经争论了至少有十年了,大家都是在围绕一个目标展开“如何在已有工作流中将人摘出来”,人才是在全面工作流中最低效的部分。 而Agent作为人工智能最具效率与通用性适配性的选择,目前正处于争论的中心。
基于现有工作流的改造
在出现了claude cowoker 这样的产品之后,Agent不再像原来那样是只有专业的开发者才能用的新鲜玩意了。他已经变成了所有使用电脑的用户都能使用的自动化助理, 如果你的应用必须存在一个服务器,也不一定需要可视化页面去集成它,Agent通过Mcp和Skills就可以直接与你的服务器接口交互,曾经我们需要在网页上点点点才能完成的工作 现在只需要简单对话让Agent去忙就好了,而我们只下命令,判断情况,做决定就可以了。
这个想法源于我曾经做的CI/CD工作流里的一个自动化应用,它通过调用Agent来进行代码审查,但是过了几个月当我打算重新写一个版本并且开源时,我突然意识到,没必要了,一个Skill就能解决。 从代码拉取执行测试,验证功能代码风格,pr评论,所有这些事,你只需要告诉它怎么做,而不是从头构建一个Agent工作流。你所要做的就是提供代码(数据)和交互方法(API)。
换句话说,你已经有很多服务应用了,它们的数据就是Agent最好的上下文,而已经存在的API,就是最好的MCP和Skills,依赖与已有的Agent进行应用skills和Mcp构建,就能极大的加速 自动化的过程,虽然你并没有构建自己的Agent Runtime,但是同样可以完成“给Token一个可信的商业附加值”的使命。
另外一方面,伴随基础设施的升级,很多已经存在的软件工作流也应当被简化或者重构,面对快速的变化进行敏捷的升级也是这个时代每个团队都要面对的挑战。
是的,无论你是何种应用的构建者,你都必须思考这个问题:“我该如何让Agent能顺利的接触到我特定的上下文和应用运行规则?” 通常来说,一个Skill或者Mcp通常都足以搞定这些问题,如果需要深度集成,那么你一定需要构建自己Agent Runtime并且给Agent构建可用的Tool。 我不太同意“软件工程已完工”的结论,正好相反,人类对于软件的升级的需求正处于前所未有的最高峰,而Coding Agent的存在正在加速这一过程,虽然不再需要写那么多的代码,但是作为软件工程师,我们仍然有做不完的工作。
敏捷的原型创新带来的变化
事实上很多资深的工程师很早就意识到了这一点,软件在商业上的成功往往不取决于是否工程完备,体验流畅,而正好相反,快速地低成本的早期商业模型验证才是 关键。而Coding Agent的出现,正将之前之前已经存在软件工程工作流疯狂提速,因此敏捷快速的试错已经不再是“廉价”或“简陋”的代名词,而是一条已经被少数人探索实践的交付路径。 因此少量成本验证突发奇想的工程原型正逐步变得可行,“创新”二字从未变得如此稀有,谁开拓了新的蓝海,谁就能咬下第一口蛋糕。
如果商业模型本身就是“给Token一个可信的商业附加值”,那么对其领域的限制就是事实上的自我束缚,通过现有的技术进行创新从来都是互联网公司的重头戏,我相信未来也一定会涌现相当多出色的团体。
总结
归根结底,我们所处的世界大部分的运行规则,都是基于那个没有AI的世界通过实践进行总结的,这不仅是我们这一辈的挑战,人类的工程史上面对过无数次这样的挑战:文字的出现,驯服的家畜,高效的交通工具,计算机的流行,现在只不过轮到了AI。 每一轮的生产力革命后,我们的分工方式,协作方式,工作方式都会迎来巨大的改变。其实不仅仅是我们的代码,人事架构,企业治理方式,商业模型,所有关于社会协作的一切都没准备好,也都注定要被这场革命所变革。与其花时间在恐惧上,不如加入革命,为推进工业革命试着出一把自己的力。