首页 > 都市言情> 首富从AI浪潮开始

首富从AI浪潮开始 第251节

  林绍峰紧接着讲了具体的测评标准,包括公开测试集、内部自建题库、第三方公开任务集,和企业真实场景脱敏数据。

  “国产大模型最大的问题,是大家做的比较像。正落到业务场景里,经常听不懂人话。用户说一句‘帮我弄一下这个’,模型不知道‘这个’是什么,用户说‘老板要看’,模型不知道重点应该放在风险、结果还是汇报口径上。”

  会议室里不少业务线负责人都点了点头,他们对这些场景都深有体会。

  大部分大模型演示的时候看起来很强,真正接入业务系统,就像一个刚毕业的实习生。

  做业务的能力比写代码的能力差多了。

  这也不怪大模型,代码本身是可验证的,对就是对,错就是错,做业务可不是这样,模糊的地方很多。

  到了问答环节,市场部的负责人先站出来说话了。

  他知道今天会议的目的,就是为坤元的发布定计划。

  刚才林绍峰展示的数据很好看,拿出去说是一回事,但是真的有几斤几两,不好说。

  他还得先弄清楚坤元的真实水平,才好制定相应的计划。

  “林总,这个成绩很惊人。我不是不信任测评,但是咱们能不能搞个演示,看看真实场景的效果?”

  市场部负责人的这句话一问出来,吕云的目光就转了过来。

第二百二十七章 让AI听懂中国

  听了这个问题,林绍峰轻轻吸了一口气,然后微微一笑,说道:“当然可以。”

  现场演示有风险,因为你总能发现测试的时候测不到的东西。

  不是对自己的产品有足够的信心,一般是不会做现场演示的。

  不过,话又说回来,现在是内部会议,演示就算出问题了,也只是在内部丢脸,要是真在发布会上现场演示出了问题,那是要上新闻、上热搜的。

  林绍峰又扫了一眼吕云和郑晓波,两人都很专注地看着这边,他把刚才那口气吐出来,打开了坤元的交互界面。

  既然要进行现场演示,他准备的材料当然已经私底下跑了很多次了,但是大模型的特点就是不可预测,懂得都懂。

  输入:【就快双十一了,帮我把这份备货方案过一遍,看看有没有问题。】

  然后上传了附件,附件是一份备货预案的文档,几十个SKU的库存计划、仓储分配、物流时效节点全都在里面。

  坤元处理之后,输出里没有列出所有风险。

  而是只列出了三条。

  头部爆款SKU在主仓的备货量按照去年销售曲线估算,峰值时段可能断货;华南仓到主力配送区的物流时效节点恰好在第一天的晚上,高概率会有延误;还有两个促销组合的定价存在漏洞,导致某些商品折上折后低于成本价。

  每一条后面,都还带了修复建议,全是可以在几天内完成的具体动作。

  作为对比,林绍峰把同一份附件和同样的提示词发给了ChatGPT。

  ChatGPT的回复非常详尽——从仓储布局到长期供应商关系,从流量预测模型到客服应急预案,洋洋洒洒写了十几条。先不说给出的答案是不是正确,光这个体量的文本就让人看了头皮发麻,不想读。

  林绍峰把两个输出并排放在大屏幕上。

  “这是我们团队里的研究员找电商部门的小伙伴要来的真实案例,他们看过输出之后,觉得坤元的输出更好。”林绍峰说到这,转向了电商部的VP,“许总,您觉得呢?”

  许总没想到自己会被点名,愣了一下,但是反应很快,笑了一下,回答道:“当然,从我的角度上看,坤元的回答明显更实用一些,我希望现在就能给运营团队的同事们都安排上。”

  会议室里响起了一阵低笑声,连吕云的脸上都挂上一点笑意。

  “当然,这件事GPT也可以做到。”

  林绍峰话锋一转,说道:“但是想要这个效果,提示词就得这么写——”

  他切了一下屏,是另外一个文档,屏幕上出现了一段提示词:

  【请分析以下备货方案,要求:

  只列出三天内可以解决的问题;

  按照对双十一峰值销售的影响程度从高到低排序;

  每条问题后附出具体可执行的动作建议;

  忽略需要长期优化的结构性问题。】

  “按这个提示词,GPT大概率也能输出差不多的结果。”

  林绍峰停顿了一下,环顾了一下在座的人。

  “但问题是,这段提示词是研究员和运营专员花了二十分钟写出来的。”他说,“大部分用户想的就是:双十一快到了,帮我看看有没有问题。他不会知道要说「只看三天内能解决的」,要说「按影响程度排序」,要说「忽略结构性问题」。他只想直接要一个有用的答案。”

  会议室里安静了下来,有些人的表情明显带着思考。

  “用户说的是「就快双十一,帮我过一遍」,他没有说只看几天内能解决的、只看影响峰值的、结论要可执行。但坤元知道「就快」这个时间窗口意味着什么,知道双十一备货的语境下「有没有问题」问的是什么问题。”

  “这是对中文业务场景的理解,这种理解摆脱了提示词的限制。”林绍峰总结道。

  这样一比较,即使两者在解决复杂问题的方面不相上下,坤元模型在交互这一块已经胜出了。

  如果是公开演讲,这里可能会有掌声,但这是内部会议,没人鼓掌。

  这个演示做完之后,市场负责人没有再提出新的问题。

  他已经在想该用什么样的宣传词来抓人的眼球了。

  这次,是有真东西的。

  林绍峰其实还准备了其他的几个演示例子,但是没人提出,他也没有拿出来。看来刚才的那个演示已经足够证明坤元的价值了。

  停顿了一会儿,林绍峰又补充了一句话。

  “还有一件事。”他扫了一眼在座的各事业部VP、业务线负责人,“坤元是独立研发,独立部署,数据都在鼎盛自己的服务器上,这解决了最大的一个隐患。每年双十一的备货方案、定价策略,这些东西,传给外部的AI,你们放心吗?”

  听了这句话,吕云微微点了点头,然后终于开口问出了他的第一个问题,却和演示的内容无关:“这个项目的技术负责人是谁?”

  林绍峰犹豫了一下,技术的方向和进度都是刘大海定的,但是在训练的最后阶段,因为两人对数据质量的判断产生分歧,被他报到郑晓波那,换去别的项目了。

  这种层次的变动,虽然审批线上不会过吕云,但要说他一点儿也不知道,林绍峰也不相信。

  “坤元的技术架构和方向,主要是首席科学家刘大海博士带队攻关的。”他紧接着补充道,“整个团队最近都很辛苦,才把坤元做出来。”

  “嗯,那他怎么没在场?”吕云说这话的时候,转头看了郑晓波一眼。

  吕云的声音并不严厉,但是林绍峰的心里咯噔了一下。

  林绍峰正要回答,郑晓波却先开口了:“刘博士最近调到另一个项目上攻坚了。坤元交付在即,琐事比较多,但是技术团队的整体推进没有停下来。”

  吕云又点了一句:“下次做这种汇报,技术负责人还是要在场。”

  然后不等有人回答,他转开了话题:“完成度可以,讲讲发布的计划吧。”

  郑晓波接到了信号,站起身来,走到屏幕前。

  林绍峰自觉地退到了一边,用电脑把刚才展示数据的幻灯片又调了出来。

  郑晓波指着屏幕上的测评数据,说道:“这次发布会,不能当做一个普通的技术发布来做,大家有什么想法,都可以提出来。”

  然后他转向市场部负责人:“市场部这边有什么想法,先说说。”

  市场部负责人站起来:“郑总,按照国际上的发布惯例,先放技术报告,公布测评数据,再做一个线上直播发布会,安排媒体做深度解读,邀请生态合作伙伴站台。”

  郑晓波听完,摇了摇头:“太平庸。”

  他看了吕云一眼,又对所有人说道:“国内现在没有能站上第一梯队的大模型,鼎盛今天能拿出坤元来,就是一个宣言:互联网时代鼎盛是第一个,AI时代,鼎盛还是第一。”

  众人都听明白了,郑晓波是对坤元寄予厚望,准备靠它让鼎盛站到全球AI的叙事中心去,和OpenAI、谷歌一个级别。

  而且吕云在场,郑晓波当他的面说这些话,说明这也是吕云的意思。

  “一个星期之后开发布会,从现在就开始预热,把坤元的测试数据发出去,但是不要公布坤元是我们的模型。等到发布会的那天,再把它公布出来。”郑晓波说,“发布会当天,媒体、合作企业,都做到最高规格,我们要讲好一个故事。”

  说到这,郑晓波的神情严肃起来:“过去,大模型听得懂英文世界的指令,却听不懂中文世界的复杂表达。坤元要解决的,就是这个问题。”

  他要把模型能力和民族情绪、产业情绪、职场痛点全部连在一起。

  “发布会的主题就叫——让AI听懂中国。”

  这话一出,全场安静。

  林绍峰听完也是心头一震,这个叙事太强了。

  同时心里也有点儿激动——中国第一、世界前列的大模型,世界第一的中文意图理解能力,是他带的团队做出来的,这个想法让他不得不激动。

  林绍峰扫了坐在会议室的程远一眼。

  提高模型能力的关键标注数据,是由源智科技这家企业共享过来的,他们也在训练自己的大模型吗?

  转念一想,大模型训练涉及各个方面的资源和能力,不是只靠标注数据。即使大家的标注一样,模型能力的上限也不一样。坤元倾鼎盛之力做了大半年,他对坤元有信心。

  想到这,刚才的激动盖过了他内心的一点儿隐隐的忧虑。

第二百二十八章 铁证如山

  鼎盛的发布会宣传声势很大,还学着苹果的样子,做了一个犹抱琵琶半遮面的海报,发布什么产品完全保密,只在上面写了几句云里雾绕的标语,和一个日期:2027年3月8日。

  公开宣传虽然保密,韩路一已经知道他们要发布的是什么了。

  坤元,通用大模型。

  甚至都不需要他用到视界。

  鼎盛的公关团队在业内派出去很多内测账号,就连马小飞都拿到了一份。签好保密协议,现在准备好测评视频,等发布会之后发出去,还有广告费拿。

首节 上一节 251/298下一节 尾节 目录txt下载

上一篇:这个导演不讲规矩

下一篇:返回列表

推荐阅读