首富从AI浪潮开始 第215节
江松然一瞬间陷入了自我怀疑。
他不确定他和赵文渊之间哪个人不对劲。
明明他的论文和刚才的交谈都显示出他是一个务实的计算机科学家,现在说出来的话却像一个画大饼的骗子?
而且就算你要骗,你去骗骗投资人,骗骗领导也就罢了,也没必要骗我吧?这怎么骗得过?
赵文渊看了江松然一眼,似乎看出他神色不对,微微一笑。
“江博士,对我们的开发流程感到好奇吗?”赵文渊开口道。
“愿闻其详。”江松然耐着性子说道。
赵文渊把自己的椅子推给江松然,说:“你坐。”
然后他拉了另一把椅子过来自己坐下。
赵文渊把桌面上的文档关掉,打开代码编辑器和终端,在终端里运行了编程智能体。
赵文渊一边敲键盘,一边给江松然解释。
“我们用的是「算子打靶法」,韩总定的路径。”赵文渊说,“先选一个算子,设个基准,一般是N卡同类实现的百分之八十。然后让智能体生成初版,跑测试,不达标就根据测试报告再迭代一轮。”
江松然把目光从赵文渊脸上移开,落到屏幕上。
他刚才听见“智能体”三个字的时候没在意,以为是某个跑测试的脚本,或者哪个开源的代码生成模型套了个壳。
但是他看见赵文渊在终端里打开了一个新的算子文件夹,是空的。
两人之前看过别的文件夹了,每个里面都有十几轮的迭代记录,每一轮记录都对应着代码、测试报告、性能分析报告。
赵文渊打了一段提示词,大意是生成这个算子的国产适配,以及其他一些技术细节的约束,然后把提示词发了出去。
终端里出现了一串绿色的思考过程,一行一行地描述智能体的运行状态:
智能体先是拆解任务、规划步骤。
然后是代码生成,几百行的算子核心,CUDA风格但是面向国产卡的适配代码,很快就生成完了。
再然后是自动写测试用例,覆盖各种边界情况。
最后是跑测试。
测试用例一个一个跑,前面三十多个都是绿色的PASS。
跑到一个标记着“performance benchmark”(性能基准)的测试,输出变成了黄色——
【Functional: PASS】
【Performance vs Nvidia: 67.3%】
【Threshold: 80%】
【Status: FAIL(below threshold)】
江松然看的真切:功能实现了,但是性能没达标。
测试失败了。
但这不代表个流程不惊人。
江松然现在心里的想法不好形容。
首先他松了一口气——如果看着以前要花几个人月的项目五分钟就被做出来,他可能会吓死。
但是,第一次迭代能达到N卡的67.3%已经很惊人了。
而这仅仅花了不到五分钟。
赵文渊把鼠标停在屏幕上的输出上,向江松然解释道:“没过基准,但是我们同时也有完整的分析报告,下一步往哪个方向调整,非常清晰。工程师只需要想好下一轮的方向,变成新的提示词,再丢回去跑一轮就行。”
江松然没说话。
他从刚才开始,倒吸的那一口气憋在胸口,憋了半天才吐出来,到现在还没喘匀气。
江松然不是被这一轮算子适配的哪个具体数据震惊了。
适配数据当然也惊人,但更让他震惊的是拿到这个结果的过程。
那是一个会自己拆解任务、自己写算子适配代码、自己生成测试、自己跑性能分析的东西。
那是个新范式、新工具。
不是代码补全,不是一问一答的聊天界面。
——是介入式的,能自主编排多步骤、复杂任务的编程工具。
“Agentic programming。”江松然喃喃道。
他不是做这个方向的,但他回国之后还听硅谷的朋友提起过,这是最近在硅谷的AI公司、大模型团队中讨论的最热门的话题。
每个相关领域的专家都在谈论它。
大家都说这个东西有可能改变人类和计算机交互的方式。
但是在他印象里,还没有人真的把东西做出来。
可是现在,在海城,硅谷一万公里之外,在一个创业公司里,江松然亲眼看见了人们讨论的、“还没做出来”的产品。
而且,这是一个完成度很高的新工具。
这个新工具现在正在做的,是谷歌这种级别的公司也要花几个工程师的团队、几个月的时间去磨的精细活。
江松然咽了一下口水。
他终于把目光抬起来,看向赵文渊。
“赵总,”他听见自己的声音有点干,“这个「智能体」……是哪家公司做的?”
第一百九十八章 期待与你的合作
赵文渊回头看了看江松然的表情,内心暗爽。
天天看别人装逼,今天也让我装一回。
他表面上云淡风轻的说了一句:“是源码科技自己开发的,现在还在内测,估计很快要推向市场了。”
江松然半天没有说话,良久才又开口问道:“你们……咱们自己做的?”
赵文渊看江松然的心理承受能力还可以,就继续往下说:“是的,最早的灵感来源于源码的一款产品,开物。本来是面对没有技术背景的用户,后面是自研的代码大模型,用户完全不用懂代码,不用介入运行,用中文就可以进行迭代。”
赵文渊看了看江松然的反应,觉得他应该已经知道开物了。
“源码的姜总把这个思路应用到开发流程中来,做了这个智能体工具。”赵文渊说完,突然问,“你刚才在下面见过姜总了吗?”
江松然摇了摇头,他刚才直接和沈丛云上来了,没机会接触源码科技那边的员工。
但是他心里知道,能主导这个级别的项目,这个姜总一定是源码科技的核心人物,暗暗期待一睹他的风采。
“有机会介绍你认识,你会喜欢她的。”赵文渊说完,把话题拉回到工作上。
“总之,我们的工作流程就是这样的,把算子适配和迭代的工作分发到每个组员的手上,如果有人进度被卡住了再一起讨论解决的方案。”
江松然点了点头,怪不得他刚才看到的工作模式是那样的。
有这样的工具,就不奇怪了。
这么看下来,这个工具大大的节省了具体实现代码、进行实际测试的时间,但它也不是什么黑科技,更不是黑魔法。
能解决的问题,还是一样能解决,只是更快了。
不能解决的问题,靠这个工具依然解决不了。
对于真正懂原理的人来说,节省下来的时间最多,帮助也最大。
反而对那些本来就一知半解的人来说,即使有了这样的工具用处也不大,解决不了的问题还是解决不了。
能做出十个算子的适配工作,这个技术团队的实力还是很强的。
他相信,凭着自己的技术能力和经验,配合着这套工具,加上这样的团队,把国产显卡的全链路适配做出来,不是没有可能。
江松然暗自点头。
然后他开口指着屏幕上的结果说:“这个算子暂时不用做到百分之八十。”
赵文渊一愣,问:“为什么?”
“因为咱们现在缺的不是这个算子的单点性能。”江松然指了指屏幕,“它能跑,功能正确,性能有67%。如果目标是出论文,当然要把它调到80%以上,但如果目标是三月初跑通第一批国产卡集群,现在最应该做的不是继续死磕这个点。”
赵文渊的表情认真起来。
“那应该做什么?”
“跑端到端。”
江松然把屏幕上的几个文件夹点开。
“把已经达标的这些算子拉出来,先组一条最小链路。模型可以小,分片可以小,数据可以用假的,但是链路必须完整,完成端到端的调试。”
他一边说,一边在旁边的白板上写了起来。
模型加载、前向、反向、梯度同步、优化器更新、检查点备份、恢复。
江松然把七个步骤写在白板上,中间没有任何停滞。
他这几年做的全部事情都在这条链上,对这些知识、和实践中可能遇到的问题,全都已经烂熟于心了。
