首页 > 都市言情> 首富从AI浪潮开始

首富从AI浪潮开始 第244节

  “详细讲讲。”韩路一的身子微微前倾,露出感兴趣的神色。

  “首先,源码科技现有的产品——BugKiller和开物,在国内已经有了一定的市场,而且还在快速增长期,御风作为新产品的加入会促进整体生态的发展。我们不应该放弃这个优势。”

  姜亦心顿了顿,又接着说:“然后,比较现实一点的问题是,我们的团队基本只有在本土制作产品和推广的经验,Kaiwu海外版的推广和本地化工作在很大程度上借助了Nexus的资源。如果想要在现阶段就把御风推广到海外,需要专门组建相关的团队,也势必会分散我们在国内发展的精力。”

  “最后,也是最重要的一点。”姜亦心说到这,看向韩路一的眼睛,脸上露出一丝骄傲的神色,“我觉得御风在编程智能体这个赛道是领先的。这不只是一个产品,还是一套生产力工具,自然应该先服务国内的同行,没必要现在就急着推出去给外人用。”

  听到这,韩路一露出一丝笑容。

  “你说的对。”韩路一说,“无论是开发产品、还是经营企业,我经常遇到的一个问题不是选择太少,而是选择太多。如果是那种明显一好一坏的选择当然好做判断,但是当两个选择看起都好的时候怎么办?”

  韩路一举起两只手,说:“鱼和熊掌往往不可兼得,这个时候,就要从好和好中做出一个选择,这才是考验一个决策者的时候。”

  “所以,遇到困难的选择的时候,想想对源码科技来说,真正重要的是什么。”韩路一一边说,一边放下了一只手,然后把另一只手握成了拳头。

  “科技平权,以人为本。”姜亦心小声的说了出来。

  这句话是源码科技企业文化的核心,即便说不上是天天讲,在各个场合也会被提出来。

  “企业文化也好,核心价值观也罢,不管你叫它什么。”韩路一点了点头,说道,“这个东西真正的用处,是帮你在难以选择的时候做出选择。”

  然后他对着姜亦心笑了一下,说:“总之,我认同你的判断,现在应该把重心放在国内。既然御风是个好工具,让更多的人能够用上,从中受益才是最重要的。钱当然要赚,但是赚钱之外,我们还想做点儿更有意义的事。”

  姜亦心看韩路一认可了,就接着往下说:“产品方面,我有一个想法。现在御风后面使用的是天工模型做代码生成,水星模型做意图理解和任务编排。下一步,我想把御风和模型解耦,把御风做成一个「模型无知」的工具。”

  在工具类产品中,这是一个比较常见的做法,姜亦心一说,韩路一就懂了。

  所谓“模型无知”,就是在工具层和模型层之间构建一层抽象,御风不用知道底层的模型是什么,保持一个对模型“无知”的状态。只要底下负责思考的大模型能够提供一个御风需要的接口,御风就可以随时切换不同的模型。

  这样一来,御风就不再依赖于水星模型,也不再依赖于任何一家公司所提供的模型。

  韩路一认同她的想法,但是却没有直接表现出来,而是说:“这是产品层面的决定,你可以独立进行决策,既没有必要问我,也没有必要问苏总。”

  他这番话尽量把语气放和缓,内容却挺硬的。

  接着他又补充道:“小姜,如果要做一个好的管理者,就要勇于做决策,勇于承担责任。把所有的决策都留给上级来做,就失去了作为管理者的价值。”

  “一个坏的决策,要好过没有决策。”

  韩路一说的都是自己这一年来所学到的经验。创业短短一年,他学到的东西比在鼎盛工作的五年还要多。

  姜亦心听到这话,慢慢的点了点头。

  虽然已经升职一段时间了,但是她还在慢慢的适应要承担后果这件事。

  看姜亦心把自己的话听进去了,韩路一又开了个玩笑:“如果御风要做这种平台类的工具的话,那汤圆也是后面模型的备选之一了,希望姜总到时候能给倾斜一点儿流量。”

  “我来就是想问这个。”姜亦心说,“汤圆的进度怎么样了?水星断掉之前,能接入吗?这个问题挺重要的,决定了我们下一步先做哪个模型的适配。”

  韩路一低头看了看电脑屏幕右上角的时间,说:“正好,赵总要来我这同步一下训练的事,你可以一起听听,和御风相关。”

  然后他给刘彧发了个消息:“赵总到了让他直接进来,不用在外面等着。”

  发完信息,他接着和姜亦心说:“我上次之前可能没和你说过,除了训练我们自己的通用大模型汤圆之外,我们还打算在张家口组一个自己的机房,彪哥最近在张家口就是在忙这个事。”

  姜亦心听完露出了有点儿困惑的表情。

  “现在用云服务不是挺好的吗,为什么要做机房?”

  姜亦心有这个疑问也不奇怪,就像十几年前的人对使用云服务感到不放心一样,最近几年入行的互联网从业者,从开始工作的第一天就开始使用云服务,反而会觉得不用云才是不正常的。

  “主要是两个方面的考量,第一是成本方面。”韩路一耐心地给姜亦心解释道,“云服务提供商是要挣钱的,用量小的时候,用云是方便,可是我们现在这个量级,用云服务在成本方面其实很吃亏。”

  “DHH前几年发了个帖子,还火了一阵,就是讲这个的。”韩路一说,“他的公司,光是从AWS和谷歌云迁移到租用的数据中心,就每年省下了两百万美元。”

  DHH就是David Heinemeier Hansson,一个在十几年前很火的编程框架Ruby On Rails(RoR)的发明者,算是个编程界的意见领袖,他最近几年一直在倡导科技公司的去云化。

  “另外一个更重要的原因。”韩路一顿了一下,还是和姜亦心说了,“主要是出于数据安全的考虑。”

  姜亦心突然有种恍然大悟的感觉。

  Nexus的水星模型应该是能看见御风这边发过去的所有提示词的,即使他们看不见御风在本地的源代码,这些提示词也能获得很多信息了。

  怪不得他们抄的这么快。

  “所以,您是怕——”姜亦心没说完。

  韩路一却是摇了摇头:“我不是怕谁会偷,或者谁不会偷。这不重要,重要的是我们不应该把重要的东西假手他人。你听说过「零信任原则」吗?”

  姜亦心摇了摇头,她在网络安全课上学过类似的东西,但是这个名词却是第一次听说。

  韩路一说:“所谓「零信任原则」,就是假设你的系统随时都可能被人入侵,所以不管是谁,都不给默认的信任。每一步通信都需要验证,每一个接入点都要当成潜在的风险点来管理。放到我们这里,就是不管Nexus、或者鼎盛、或者任何云服务商,不管他们值不值得信任,我们都不把核心数据交给他们来处理。”

  姜亦心感觉自己对课堂上学的网络安全又有了新的理解。原来要防的不只是黑客,还有合作方。

  这时,外面突然传来了敲门声。

  “请进。”韩路一扬声说道。

  赵文渊推门走了进来,他看到姜亦心也不意外,点了点头,说了声“姜总”,然后转向韩路一,大踏步走了过来,边走边说:“韩总,退火已经完成了,我已经把公开的测试,和为源码科技准备的测试集都跑过了,比预期的效果还要好!”

  韩路一还没做出反应,姜亦心已经兴奋的说了一句:“汤圆能用了?”

  韩路一和赵文渊一起看向她,然后赵文渊不得不给她泼了盆冷水:“不能用。”

  姜亦心一愣:“你刚刚不是说,那个什么,跑过分儿了?”

  姜亦心是计算机科学的本科,本职工作是编程,平时对AI大模型的了解也主要集中在怎么用,对训练的流程完全不了解。

  赵文渊一听就知道是怎么回事了,想了想,还是给她解释了一下。

  “现在完成的是预训练,这个是基座模型(Base Model)。但是想要能用,还得再经过一个后训练阶段,得到对话模型(Instruct Model)才行。”赵文渊说,“所谓跑分,或者说模型测评,确实是在预训练之后这个阶段进行的,这个时候测试的是模型的逻辑和知识,你可以理解成理综考试。”

  “那这个基座模型,和对话模型有什么区别?”姜亦心问道。

  赵文渊把手里的电脑放在桌子上,打开来,说:“正好给你试试。”

  这个基座模型连个对话框也没有,但是在命令行里还是可以输入文字和输出文字的。

  姜亦心想了想,输了一个问题:“「为之于未有,治之于未乱」是什么意思?”

  很快,模型的回复显示了出来:“「合抱之木,生于毫末」是什么意思?「九层之台,起于累土」是什么意思?「千里之行,始于足下」是什么意思……”

  姜亦心看得目瞪口呆。

  赵文渊在旁边笑道:“怎么样?是不是和你熟悉的AI大模型不一样?”

  确实不一样,姜亦心已经习惯了ChatGPT那种类型的AI,问一个问题,可以给出一长串回答。不过这个回答是不是对的,至少看起来很合理。有不少人都沉迷于和AI聊天,可是这个基座模型看起来好像只能接话,不能对话。

  “实际上,这就是Transformer大模型最一开始的样子,一直到GPT-3时代人们都是这么调用模型的。”赵文渊说道,“你想要问一个问题,就得把它包装成一个特殊的格式,让模型去接你的话,根本不好用。”

  “一直到InstructGPT横空出世,这一波AI的时代才真正到来,从实验室走到了大众。人们都说Transformer是划时代的发明,可我觉得,Instruct理论的提出,重要性不亚于Transformer。”

  看到历史课上的差不多了,韩路一这才插话进来:“你说结果比预期好,到底有多好?”

  赵文渊反倒不着急了,他对着韩路一缓缓的吐出了一个词:“SOTA。”

  SOTA,state of the art。

  意思是,当前最强水平。

  韩路一自己就是个老装逼犯了,哪会不知道赵文渊现在在期待什么。

  可惜,现场的两个人都不是会为他这一个词震惊的人。

  他也不在意,接着问道:“具体的数据呢,拿出来看看。”

  赵文渊看他这么平淡的反应,在心里默默的叹了一口气,乖乖的打开了一个文档。

  各个测评集都和GPT-4不相上下,确实可以说是世界一线了,尤其突出的是在C-Eval(中文综合)和CMMLU(中文知识)两个测评集,GPT都在70%左右,汤圆base直接达到了80%以上。

  考虑到这还只是依靠视界制定的数据清洗规则做出的基座模型,韩路一当牛做马标出来的十万条标注数据都还没用。

  可以预计,汤圆完成训练之后的表现将会非常惊人。

  韩路一想到这,直接和赵文渊说:“事不宜迟,现在就开始后训练吧。”

  当初韩路一刚刚决定要自己做模型的时候,还是开物刚在国内市场做出点成绩,Nexus慕名找上门来寻求合作。韩路一当时判断自有模型将是不可替代的战略资源,没想到,短短的几个月之后,他的预言就成真了。

  模型的训练和部署成了Kaiwu海外版和御风下一步能否顺利发展的关键。

  如果不是韩路一当时果断选择去鼎盛那换算力,现在是无论如何也做不出来的。

  即使如此,接下来也得每一步都顺利,才能可能在Nexus翻脸之前顺利完成迁移。

  同时,鼎盛那边也在虎视眈眈,不得不防。

  韩路一最后又嘱咐了一遍赵文渊:“在鼎盛的集群上训练,只上传之前定好的那85%。”

  赵文渊郑重的点了点头:“我知道,剩下的15%才是我们之后致胜的关键。”

  姜亦心最后问出了自己最关心的问题:“那后训练还要多久啊?”

  赵文渊说:“最快两周,慢的话二十天。后训练我有经验,估算的差距不会太大。”

  会开完赵文渊和姜亦心一起往外走。

  突然,姜亦心放慢了脚步,等到赵文渊出去之后又折回来,问了韩路一一个问题:“韩总,刘秘书的工资是多少啊?这个能问吗?”

  韩路一秒懂,微微一笑:“差不多是你的工资的八成吧,怎么,你也想要个秘书?”

  姜亦心一听,脸就垮了下来:“这么贵啊,那还是算了吧。我自己安排的挺好。”

  姜亦心开门出去,韩路一打开视界又看了她一眼。

  【姜亦心】

  【产品SS|管理B|协作A|稳定S】

首节 上一节 244/298下一节 尾节 目录txt下载

上一篇:这个导演不讲规矩

下一篇:返回列表

推荐阅读