AI编程工具,如何突破瓶颈

【来源:虎嗅网】

a16z (Andreessen Horowitz)是一家风险投资公司,以其多元化的投资领域著称。其热衷于为其投资公司提供策略和资源协助进而帮助它们取得成功。被投资公司包括Airbnb、Meta和Twitter等。Yoko和Justine为其投资合伙人。本次访谈两位合伙人分享了颠覆传统编程方式的AI编程——Vide Coding编程方式。

从技术极客到全民开发:解码Vibecoding浪潮下的AI编程生态演进

Steph Smith欢迎来到本节目!什么是Vibecoding?为什么它席卷了互联网?

Yoko Li我对“Vibecoding”的理解是:你给编码Agent一套指令后就放手让它自主运行。唯一需要做的就是通过自然语言反馈来引导,比如“我喜欢这个”“这个不太对”“这个很合我胃口”“这个感觉不对”——通过这样直觉化的反馈来塑造代码,这就是所谓的videcoding。

Justine Moore有趣的是,我们看到无论是技术人员还是非技术人员都在使用它。比如一些非常专业的技术人员在推特上分享说,他们不再从零开始编写代码,而是直接去找一个大型语言模型,告诉它自己想要做什么,然后不断修改完善,之后或许会把代码导出到他们喜欢的编辑器里进行编辑,再部署。还有很多人完全不懂技术,纯粹是跟着感觉走,以前根本做不出任何东西,现在完全依赖大型语言模型来为他们编写代码,这真的很酷。

Steph Smith说到这一点,不只是非技术人员在这么做,就连那些技术极强的人也在使用这种有点家长作风的说法。实际上,这个术语是Andrej Karpathy提出的,他本人就是技术大牛,是那些真正帮助人们编写代码的大型语言模型背后的推手,比如帮助整个Reddit社区编写代码的模型就是他主导的。基于此,还出现了许多帮助人们编写代码的公司。那么,究竟是哪些人在参与这一趋势?都有哪些公司被使用?另外,您会如何将这些公司归类,即在这一趋势中是否存在不同的类别?

Justine Moore我们现在可以看到不同的公司服务于不同类型的用户,有一些更偏向于集成开发环境(IDE)的公司,比如Cursor,它们的目标客户是开发者,通过给Agent一个提示,就能让其为你编写或编辑代码,从而让开发者的工作变得轻松许多。

还有一个新的趋势,无论是非技术人员还是技术人员都在使用这些文本转网络应用或文本转网站的公司,它们都在浏览器中运行,比如你直接在网页应用中输入内容,说嘿,我想要一个能追踪我的狗是否被喂食的应用,或者我想要一个网站,让人们能获取我的小本地企业的信息并与我联系”。


然后你会看到一个界面,通常它们在左侧看起来都差不多--输入提示,右侧就会显示生成的内容和界面的样子,然后你可以修改,比如不,我想让这个按钮执行这个操作或者不,我想让设计变成那样。所以,我们已经看到这个领域涌现出了大量的公司。到目前为止,我们看到的最大的几家公司可能是Repl.it代理、LovableBoltVercelVZero。但我们每天都能在这里看到更多的产品涌现出来。

Yoko Li确实能看到不同用户群体开始分化,大家会基于自身需求选择工具。比如作为工程师,我的本能反应是扎根在IDE(集成开发环境)里工作,所有事情都想在IDE里完成——以前可能是传统IDE,现在可能换成Cursor了。但如果是想搭建营销落地页的人,他们更可能选择BoltLovableVZero这些工具,因为它们能快速生成视觉效果出众的素材。这本质上是由使用场景差异和用户的初始技能决定的

Steph Smith能不能具体说说规模?Cursor这两年确实快速崛起,被很多人称为增长最快的公司之一。但其他工具呢?现在它们的用户基数真的达到规模级了吗?还是说整个领域仍处于早期阶段?

Justine Moore这个问题问得好。虽然并非所有公司都公开数据,但BoltLovable确实在社交媒体和播客中提到过——比如两个月内ARR(年度经常性收入)冲到2000万美元,或者单月达成1000万美元ARR,这种增速简直疯狂。这说明市场存在巨大需求:既有新手想通过更友好的方式尝试编程或创造,也有开发者追求更高效率——毕竟Cursor的爆发式增长也印证了这一点。

Yoko Li抛开数据不谈,本质上这些工具解决了真实痛点。像我表弟想做个记录浇花频率的个人应用,这类用户以前根本不可能自己开发,只能找现成APP将就。但现在妙就妙在,他们可以亲手打造专属工具,本地运行无需部署,满足高度个性化需求——这才是根本价值所在。

“Software for one”革命:AI编程工具如何突破动态应用开发边界与瓶颈

Steph Smith个人专属应用(“Software for one”)的概念最近越来越常听到了。我有个出书的朋友总想做个展示销量的个人页面,但学编程始终没坚持下来。所以这些工具的实际能力边界到底在哪?是不是更适合做静态网页、数据看板这类轻量级应用?我的这个理解对吗?还是说其实能开发更复杂的程序?

Justine Moore这和之前帮助非技术人员建站的SquarespaceWix有本质区别。Videcoding产品是真正在生成代码,因此能实现交互性更强的动态功能。比如我用Lovable做过一个书籍推荐网页应用:用户输入童年喜欢的书调用OpenAI API生成三本当下可能喜欢的书将结果存入数据库(数据库配置直接在Lovable里完成)甚至支持Gmail账户登录(通过Google身份验证API)用户还能给书籍评分。


这已经完全超越了静态网站,是真正的动态网页应用。虽然比纯文本指令复杂些——比如添加身份验证时需要分五步操作,还得自己到外部链接复制代码密钥——但像我这样的非技术背景用户居然能搞定。相信这类工具的操作门槛会越来越低。

Yoko Li现在正是用这些工具开发的好时机,因为现成组件生态已经非常成熟。比如支付功能,你肯定不想让编码Agent从零开发Stripe支付系统,虽然很多人试图克隆StripeAirbnb。你只需要让编码Agent集成Stripe支付组件,或者用Clerk组件处理身份验证就行。

Steph Smith这些工具确实很神奇。尤其是让非技术人员也能做出远超过去能力范围的东西。不过我们能不能再深入探讨下时机因素”——为什么现在这类工具突然爆发?LLM的代码能力这么强是否出乎意料?另外能不能讲讲背后的技术积累,是什么基础条件促成了这些工具的诞生?

Yoko Li从最底层来看,基础模型(即底层AI模型)是关键。现在优秀的代码生成工具都依托于强大的编码模型,而模型强大的原因主要有二:首先是Transformer架构等技术突破,更重要的是互联网沉淀的海量代码数据。


如今绝大多数应用都是JavaScript生态的——回想AI爆发前的Stack Overflow,最常见的问题就是为什么我的Node.js应用跑不起来?,而这些问答数据都成了训练素材。再加上Next.jsReact等框架的标准化,相当于在代码抽象层搭建了阶梯,让模型学习现代网页开发变得事半功倍。


另一个重要因素是现代Web开发环境的成熟,现在全栈应用基本都用JavaScript/TypeScript,形成了自洽的运行环境,编码代理可以即时验证代码正确性,这种闭环极大提升了生成效率。

Justine Moore完全同意。补充下基础模型层面的观察:现在AI公司都把代码能力作为核心指标——无论是OpenAI还是Anthropic发布新模型时,代码任务都是重点测试项。对我们这些编程小白来说,最震撼的是LLM学编程的速度远超人类。虽然我还需要给些调试指引,但它能做到的事如果让我自己学,恐怕得花好几年。

Steph Smith确实是这样。或许我们也可以从运作的角度来回答这个问题。有些人可能会认为这就像对基础模型的一次 API 调用。是这样吗?还是说在此基础上还有更多的东西?再进一步探讨的话,这些不同的公司是如何增加价值的。在与基础模型集成之后,它们又是如何在竞争中脱颖而出的?

Yoko Li当我们掀开这些工具的技术面纱,会发现底层系统其实非常精密。用户界面就像Justin说的那样,有代码生成区、预览窗口和指令框,但背后的运作机制复杂得多:首先需要构建执行环境供代理工作调用基础模型处理用户指令按预设标准生成代码在浏览器或网页容器(WebContainer,利用本地计算资源的酷炫技术)里实时运行最后生成预览界面。更重要的是,很多应用离不开数据库支持——数据要么暂存内存/浏览器,要么持久化到类似Supabase的专业数据库里。

Steph Smith关键问题是实际效果如何?这些工具在哪些场景游刃有余?又在什么情况下会彻底崩盘?现在还没完全突破的技术瓶颈是什么?

Justine Moore对我们非技术人员来说,有时简直像魔法——输入指令就能生成可运行的网页应用;有时又是最让人抓狂的事,比如陷入死循环的bug无法自愈。Yoko应该能具体分析故障点。以我的使用经历,主要问题有两个:一是应用复杂度提升后,系统会丢失先前生成的上下文,比如修改某个设计元素,却导致之前10个功能集体崩溃;比如因为你给页面顶部加了一张图片,认证功能就无法使用了。你需要去问现在这个东西不运行了,你能回去把它修好吗?” 二是LLM总迷之自信能修复任何问题,然而实际可能越修越糟。

Yoko Li它们非常乐观。

Justine Moore简直是个乐观主义者”——虽然这种积极态度有时很棒,但当你试到第四十遍发现这个按钮还是没按我说的运行时,它依然元气满满地说这次一定能搞定,简直让人直接找专业程序员接手。不过客观来看,这类工具在处理简单任务时确实可靠(尤其是代码量不大的项目),但遇到复杂需求时短板就暴露无遗。

Yoko Li这期播客来得正是时候——Claude刚发布了新一代编码模型,推特上到处都是一个指令搞定XXX应用的案例。虽然代码生成能力突飞猛进,但基础设施层的问题依然棘手:软件系统天然具有状态依赖性,数据存储位置、鉴权机制、数据库配置、缓存策略、核心逻辑编排这些关键环节,目前工具链还远未做到真正的简化。


不过底层验证机制的突破让我充满期待:过去我们工程师写代码时,每个版本变更都要用SHA哈希值做代码指纹追踪。但现在用AI工具开发,我发现自己不断输入新指令,整个应用代码都可能被重写。只要最终能跑通,我根本不在意前一个版本长什么样。不过这也暴露了新问题:这些工具下一步必须建立可靠性验证体系。是引入自动化测试?还是开发其他验证机制?虽然目前还有明显不足,但我相信技术突破就在眼前。

Steph Smith验证机制确实是可攻克的难关。不如聊聊实际应用场景吧!两位看过那么多项目,能不能具体说说开发者们都在构建哪些类型的应用?这些项目的复杂度和创新性达到什么水平了?

Justine Moore开发的生态确实呈现多元化趋势,最令人兴奋的是现在连个人专属应用都能轻松实现——比如只为单用户服务的定制化工具,这在过去根本是天方夜谭。开发者们正在创造的应用类型之丰富,简直像展开了一幅无限延伸的数字长卷。

Yoko Li我很喜欢这个个人专属应用的说法。

Justine Moore这个标语真棒,应该有公司直接拿来当slogan!在消费者端,用例可谓千奇百怪——既有像Yoko表弟开发的植物喂养追踪器,也有爸爸们用AI生成包含孩子名字和兴趣的定制睡前故事,每晚都能自动朗读新故事。简而言之,任何你能想到的个人化需求现在都能轻松实现。更值得注意的是,企业级应用也开始萌芽:许多为本地商家建站的小型代理机构,过去依赖Squarespace这类网站搭建平台,现在纷纷转向Repl.itBolt等工具。因为这些平台能极速完成项目开发,让接单价2000美元的小单也变得有利可图——这在过去根本无法想象。

Yoko Li是的,专业工程师其实在使用另一套工具链。虽然他们也会用Cursor起手开发,但涉及营销落地页等场景时,往往会切到LovableBolt这些视觉化平台。根本区别在于:工程师能自行处理界面渲染,而营销人员需要开箱即用的所见即所得效果。正如Justine所说,营销代理们现在之所以敢接海量小单,正是因为工具的效率革命打破了规模不经济的魔咒。其长尾需求的商业价值总和,已远超过去专注头部客户的传统模式,这才是他们集体从Squarespace以及Wix离开的根本动因。

定价革命与用户分层:AI编程工具如何突破同质化困局重构开发范式

Steph Smith这种生态演进确实精彩。但当前这些工具同质化严重,就像您刚才提到的,可能只有设计能力算是个差异化点。您认为未来市场会如何细分?这些公司又该从哪些功能维度突破?

Justine Moore现在的产品都在追求大而全”——清一色的文本指令框,试图通吃从编程小白到资深工程师的所有用户。我们有望看到他们在构建功能和关注客户群方面进行更多细分。比如,可以根据终端用户的技能水平进行细分,像我这样的普通消费者,如果只是想做一个简单的网站或者一些好玩的东西给朋友看,我可能想在手机应用上完成,比如新的 Repel.it 应用有AI Agent,操作超级简单,展示给我的代码复杂程度都会非常不同。


这与那些为工程师设计的产品不同,工程师们可能只是想在会议期间向团队展示一些效果。更深层的差异化将体现在控制维度。就像我们之前多次谈到设计,如今大多数工具都是这样,你可以说,我想要一个具有这种风格的网站或网络应用程序,然后你可以稍微调整一下颜色或者移动一下按钮,但对于真正的设计师来说,通过文字来传达这些想法实在是太令人沮丧了。所以我们预计会看到更多的人加入类似Figma的功能,这样你就可以对设计拥有真正的精细控制。

Yoko Li这个现象其实很有意思。很多人总在说要让全民学编程,比如鼓吹我妈都能用AI工具学写代码建网站了。但作为从业多年的工程师,我必须唱个反调:在AI如此强大的今天,代码早已不是普罗大众需要的抽象方式。真正的命题应该是——找到最适合普通人的软件构建旋钮:是自然语言指令?是Figma式设计工具?还是拖拽搭建?


当我们访谈非技术背景用户时发现,他们根本不想学编程,只关心能否快速实现需求。过去的无代码工具(比如Squarespace)太过僵化,现在的新工具则允许更精细化的控制。因此下一步的进化方向,就是探索如何在零代码全代码之间,找到更灵活的新范式——既保留自然语言的易用性,又能突破传统无代码平台的局限。

Steph Smith这个抽象层级的问题提得精准!就像使用英语交流也有不同层级——有人能说不会写,有人看不懂字母却能理解语义。说到定价,这些工具的性价比简直惊人——用户过去根本做不出来的东西,现在能创造巨大价值。目前各家公司的定价策略如何?该对标Wix这类传统建站工具,还是需要开创全新定价模式?

Justine Moore定价确实值得玩味。目前主流是按用量计费:免费赠送一定token,超出后需订阅月付套餐。但问题在于——即便技术人员也搞不清开发一个网站到底要消耗多少token。我们完全没概念:是1005000?还是5万?这取决于LLM的效率:反复调试会烧掉大量token,一次成功则消耗极少。理想的定价模式应该更透明——让用户提前预判开发和维护成本。长远来看,价值定价才是王道:比如电商客户年营收千万级,自然愿意支付数十万年费维护系统;而个人用户显然承担不起这个价位。

Yoko Li传统定价有两条路径,虽然并不绝对但趋势明显:工具是被机器调用还是人工使用。机器调用(如API、数据库)多用消耗型定价;人工操作(如Figma、Canva)则按席位收费。我完全赞同Justin的观点——token计量绝非长久之计。个人用户更在意生产力跃升愿付月费,企业客户则应打包团队协作等功能溢价收费。

从被动编码到主动创造:AI工具如何重写规则?

Steph Smith说到行业巨头,这些快速做到百万美元ARR的新锐公司能活下来吗?像GoogleFigma这种已经坐拥设计师生态的巨头,如果开始集成AI功能,会不会直接碾压新兴玩家?这些初创公司真的有防御能力吗?

Yoko Li我们基金投资了很多潜力新秀,比如Figma也在我们组合里,他们正在AI设计领域大展拳脚。但对比谷歌这类巨头——用过Google Docs的人都知道,他们在AI原生办公软件上的进展迟缓。根本问题在于大公司组织结构割裂:谷歌内部有AI部门和非AI部门各自为战,这种机制注定做不出真正的AI驱动产品。这正是我们看好创业公司颠覆机会的原因。

Justine Moore这个赛道最妙的是在创造增量市场,就像AI绘画没有取代摄影师,反而让普通人也能创作艺术。未来在这一领域我们会看到像Figma这样的产品,它们拥有庞大的用户基础,是真正成熟的产品的出现。它能通过设计代码一键转换的功能巩固优势。另一方面,像我这样从不打开Figma的用户,会催生全新的工具生态。随着模型能力跃升,整个市场的蛋糕每天都在变大——更多用户入场,更多场景被解锁,这才是最令人兴奋的地方。

Steph Smith这正是最关键的突破——参与技术创造的人群规模史无前例。在“videcoding”AI编码出现前,全球只有不到1%的人掌握编程技能。而现在,正如Yoko所说,普通人无需学习代码也能借助AI实现创意。最后能否请二位展望下未来趋势?无论是现有工具的进化方向,还是尚未出现的新形态工具,哪些可能性最让你们兴奋?

Yoko Li即便对开发者群体,我也期待新一代工具的革命。比如取代Git这类传统版本控制系统,出现真正AI原生的开发管理工具。虽然具体形态尚不明确,但可以确定的是——两年后我们习以为常的开发方式,会像现在看待两年前的Cursor那样显得陈旧。整个开发者生产力工具生态必将经历范式级重构。

Justine Moore从消费端看,两个方向让我心跳加速:首先是服务集成的一键化,现在搭建完整应用还需要在BoltStripe、数据库等服务间反复横跳,未来如果能实现全栈式自动装配,将极大释放非技术用户的创造力;其次是交互方式的革新,现有文本指令虽强大但不够直观——设想能上传Instagram主页截图、Spotify听歌记录或收藏的网站设计,让AI直接生成风格匹配的应用界面,这种视觉化创作方式会让Z世代和Alpha世代用户爱不释手。

Steph Smith等他们发现代码能让网页元素动起来,绝对会掀起创作狂潮!

Justine Moore我预感会迎来一波90年代复古美学复兴——比如鼠标划过屏幕拖出彩虹轨迹,或者那些如今没人做的趣味特效。这算是我个人的小预测吧。

Yoko Li太妙了!这相当于把情绪板应用的创作链路打通,而不只是指令应用

Steph Smith其实交互应该是双向的。我先生最近开始玩氛围编程,有天看他操作时发现:他居然会让AI“给我展示这个数据的五种可视化方案”——这种指令我根本想不到!更震撼的是AI开始主动建议:要不要试试这种设计?而不只是被动执行命令。这种智能体的主观能动性会改变创作范式。

Yoko Li说到范式革新,最近有个值得单开播客讨论的现象:开发者们正在疯狂构建MCP(模型上下文协议服务器)。简单来说,MCP能扩展编码Agent的能力边界——比如在Cursor里开发个MCP服务,教会AI Agent发送邮件功能,之后选中文字就能直接调用。这可能是下一代API的雏形。随着ClerkSupabase等组件库与MCP工具链的融合,这些平台的扩展性正在指数级提升,插件生态的爆发指日可待。

Steph Smith精彩!听完这场对话,我已经等不及要打开编辑器玩转videcoding了!

原文:Vibecoding is Here - How AI is Changing How We Build Online  https://www.youtube.com/watch?v=xxA-M3HrKrc

本文来自微信公众号:Z Potentials,作者:a16z,编译:Julie Qiao

本站部分内容来源于网络,如果你是该内容的作者,并且不希望本站发布你的内容,请与我们联系,我们将尽快处理!

暴涨近19倍!泡泡玛特再创新高 算力概念盘中强势上扬

成交量、成交额呈现大幅增长趋势——一季度我国黄金市场稳健运行