首富从AI浪潮开始第251节

　　林绍峰紧接着讲了具体的测评标准，包括公开测试集、内部自建题库、第三方公开任务集，和企业真实场景脱敏数据。

　　“国产大模型最大的问题，是大家做的比较像。正落到业务场景里，经常听不懂人话。用户说一句‘帮我弄一下这个’，模型不知道‘这个’是什么，用户说‘老板要看’，模型不知道重点应该放在风险、结果还是汇报口径上。”

　　会议室里不少业务线负责人都点了点头，他们对这些场景都深有体会。

　　大部分大模型演示的时候看起来很强，真正接入业务系统，就像一个刚毕业的实习生。

　　做业务的能力比写代码的能力差多了。

　　这也不怪大模型，代码本身是可验证的，对就是对，错就是错，做业务可不是这样，模糊的地方很多。

　　到了问答环节，市场部的负责人先站出来说话了。

　　他知道今天会议的目的，就是为坤元的发布定计划。

　　刚才林绍峰展示的数据很好看，拿出去说是一回事，但是真的有几斤几两，不好说。

　　他还得先弄清楚坤元的真实水平，才好制定相应的计划。

　　“林总，这个成绩很惊人。我不是不信任测评，但是咱们能不能搞个演示，看看真实场景的效果？”

　　市场部负责人的这句话一问出来，吕云的目光就转了过来。

第二百二十七章让AI听懂中国

　　听了这个问题，林绍峰轻轻吸了一口气，然后微微一笑，说道：“当然可以。”

　　现场演示有风险，因为你总能发现测试的时候测不到的东西。

　　不是对自己的产品有足够的信心，一般是不会做现场演示的。

　　不过，话又说回来，现在是内部会议，演示就算出问题了，也只是在内部丢脸，要是真在发布会上现场演示出了问题，那是要上新闻、上热搜的。

　　林绍峰又扫了一眼吕云和郑晓波，两人都很专注地看着这边，他把刚才那口气吐出来，打开了坤元的交互界面。

　　既然要进行现场演示，他准备的材料当然已经私底下跑了很多次了，但是大模型的特点就是不可预测，懂得都懂。

　　输入：【就快双十一了，帮我把这份备货方案过一遍，看看有没有问题。】

　　然后上传了附件，附件是一份备货预案的文档，几十个SKU的库存计划、仓储分配、物流时效节点全都在里面。

　　坤元处理之后，输出里没有列出所有风险。

　　而是只列出了三条。

　　头部爆款SKU在主仓的备货量按照去年销售曲线估算，峰值时段可能断货；华南仓到主力配送区的物流时效节点恰好在第一天的晚上，高概率会有延误；还有两个促销组合的定价存在漏洞，导致某些商品折上折后低于成本价。

　　每一条后面，都还带了修复建议，全是可以在几天内完成的具体动作。

　　作为对比，林绍峰把同一份附件和同样的提示词发给了ChatGPT。

　　ChatGPT的回复非常详尽——从仓储布局到长期供应商关系，从流量预测模型到客服应急预案，洋洋洒洒写了十几条。先不说给出的答案是不是正确，光这个体量的文本就让人看了头皮发麻，不想读。

　　林绍峰把两个输出并排放在大屏幕上。

　　“这是我们团队里的研究员找电商部门的小伙伴要来的真实案例，他们看过输出之后，觉得坤元的输出更好。”林绍峰说到这，转向了电商部的VP，“许总，您觉得呢？”

　　许总没想到自己会被点名，愣了一下，但是反应很快，笑了一下，回答道：“当然，从我的角度上看，坤元的回答明显更实用一些，我希望现在就能给运营团队的同事们都安排上。”

　　会议室里响起了一阵低笑声，连吕云的脸上都挂上一点笑意。

　　“当然，这件事GPT也可以做到。”

　　林绍峰话锋一转，说道：“但是想要这个效果，提示词就得这么写——”

　　他切了一下屏，是另外一个文档，屏幕上出现了一段提示词：

　　【请分析以下备货方案，要求：

　　只列出三天内可以解决的问题；

　　按照对双十一峰值销售的影响程度从高到低排序；

　　每条问题后附出具体可执行的动作建议；

　　忽略需要长期优化的结构性问题。】

　　“按这个提示词，GPT大概率也能输出差不多的结果。”

　　林绍峰停顿了一下，环顾了一下在座的人。

　　“但问题是，这段提示词是研究员和运营专员花了二十分钟写出来的。”他说，“大部分用户想的就是：双十一快到了，帮我看看有没有问题。他不会知道要说「只看三天内能解决的」，要说「按影响程度排序」，要说「忽略结构性问题」。他只想直接要一个有用的答案。”

　　会议室里安静了下来，有些人的表情明显带着思考。

　　“用户说的是「就快双十一，帮我过一遍」，他没有说只看几天内能解决的、只看影响峰值的、结论要可执行。但坤元知道「就快」这个时间窗口意味着什么，知道双十一备货的语境下「有没有问题」问的是什么问题。”

　　“这是对中文业务场景的理解，这种理解摆脱了提示词的限制。”林绍峰总结道。

　　这样一比较，即使两者在解决复杂问题的方面不相上下，坤元模型在交互这一块已经胜出了。

　　如果是公开演讲，这里可能会有掌声，但这是内部会议，没人鼓掌。

　　这个演示做完之后，市场负责人没有再提出新的问题。

　　他已经在想该用什么样的宣传词来抓人的眼球了。

　　这次，是有真东西的。

　　林绍峰其实还准备了其他的几个演示例子，但是没人提出，他也没有拿出来。看来刚才的那个演示已经足够证明坤元的价值了。

　　停顿了一会儿，林绍峰又补充了一句话。

　　“还有一件事。”他扫了一眼在座的各事业部VP、业务线负责人，“坤元是独立研发，独立部署，数据都在鼎盛自己的服务器上，这解决了最大的一个隐患。每年双十一的备货方案、定价策略，这些东西，传给外部的AI，你们放心吗？”

　　听了这句话，吕云微微点了点头，然后终于开口问出了他的第一个问题，却和演示的内容无关：“这个项目的技术负责人是谁？”

　　林绍峰犹豫了一下，技术的方向和进度都是刘大海定的，但是在训练的最后阶段，因为两人对数据质量的判断产生分歧，被他报到郑晓波那，换去别的项目了。

　　这种层次的变动，虽然审批线上不会过吕云，但要说他一点儿也不知道，林绍峰也不相信。

　　“坤元的技术架构和方向，主要是首席科学家刘大海博士带队攻关的。”他紧接着补充道，“整个团队最近都很辛苦，才把坤元做出来。”

　　“嗯，那他怎么没在场？”吕云说这话的时候，转头看了郑晓波一眼。

　　吕云的声音并不严厉，但是林绍峰的心里咯噔了一下。

　　林绍峰正要回答，郑晓波却先开口了：“刘博士最近调到另一个项目上攻坚了。坤元交付在即，琐事比较多，但是技术团队的整体推进没有停下来。”

　　吕云又点了一句：“下次做这种汇报，技术负责人还是要在场。”

　　然后不等有人回答，他转开了话题：“完成度可以，讲讲发布的计划吧。”

　　郑晓波接到了信号，站起身来，走到屏幕前。

　　林绍峰自觉地退到了一边，用电脑把刚才展示数据的幻灯片又调了出来。

　　郑晓波指着屏幕上的测评数据，说道：“这次发布会，不能当做一个普通的技术发布来做，大家有什么想法，都可以提出来。”

　　然后他转向市场部负责人：“市场部这边有什么想法，先说说。”

　　市场部负责人站起来：“郑总，按照国际上的发布惯例，先放技术报告，公布测评数据，再做一个线上直播发布会，安排媒体做深度解读，邀请生态合作伙伴站台。”

　　郑晓波听完，摇了摇头：“太平庸。”

　　他看了吕云一眼，又对所有人说道：“国内现在没有能站上第一梯队的大模型，鼎盛今天能拿出坤元来，就是一个宣言：互联网时代鼎盛是第一个，AI时代，鼎盛还是第一。”

　　众人都听明白了，郑晓波是对坤元寄予厚望，准备靠它让鼎盛站到全球AI的叙事中心去，和OpenAI、谷歌一个级别。

　　而且吕云在场，郑晓波当他的面说这些话，说明这也是吕云的意思。

　　“一个星期之后开发布会，从现在就开始预热，把坤元的测试数据发出去，但是不要公布坤元是我们的模型。等到发布会的那天，再把它公布出来。”郑晓波说，“发布会当天，媒体、合作企业，都做到最高规格，我们要讲好一个故事。”

　　说到这，郑晓波的神情严肃起来：“过去，大模型听得懂英文世界的指令，却听不懂中文世界的复杂表达。坤元要解决的，就是这个问题。”

　　他要把模型能力和民族情绪、产业情绪、职场痛点全部连在一起。

　　“发布会的主题就叫——让AI听懂中国。”

　　这话一出，全场安静。

　　林绍峰听完也是心头一震，这个叙事太强了。

　　同时心里也有点儿激动——中国第一、世界前列的大模型，世界第一的中文意图理解能力，是他带的团队做出来的，这个想法让他不得不激动。

　　林绍峰扫了坐在会议室的程远一眼。

　　提高模型能力的关键标注数据，是由源智科技这家企业共享过来的，他们也在训练自己的大模型吗？

　　转念一想，大模型训练涉及各个方面的资源和能力，不是只靠标注数据。即使大家的标注一样，模型能力的上限也不一样。坤元倾鼎盛之力做了大半年，他对坤元有信心。

　　想到这，刚才的激动盖过了他内心的一点儿隐隐的忧虑。

第二百二十八章铁证如山

　　鼎盛的发布会宣传声势很大，还学着苹果的样子，做了一个犹抱琵琶半遮面的海报，发布什么产品完全保密，只在上面写了几句云里雾绕的标语，和一个日期：2027年3月8日。

　　公开宣传虽然保密，韩路一已经知道他们要发布的是什么了。

　　坤元，通用大模型。

　　甚至都不需要他用到视界。

　　鼎盛的公关团队在业内派出去很多内测账号，就连马小飞都拿到了一份。签好保密协议，现在准备好测评视频，等发布会之后发出去，还有广告费拿。

首节上一节 251/298下一节尾节目录 txt下载

上一篇：这个导演不讲规矩

下一篇：返回列表

首富从AI浪潮开始 第251节

推荐阅读

首富从AI浪潮开始第251节