第301章 需要优化算法

“这是mBir算法核心参数啊!”

 晚上10点,沈月紧急召开公司线上会议,让研究院专家看网盘资料。

 研究院有Ai算法团队,几位资深工程师很快做出判断:

 “看上去,正好是攻坚课题需要的。”

 “用于大模型ir算法。”

 “先做了小样本集训练,得到一组效果最优的参数。”

 “有这组参数,可以做大范围训练,得到重建算法需要的大模型!”

 “跑完训练再用模型检验,做低剂量Ct能达到什么重建效果。”

 有人问参数是从哪里来的,沈月说是跟ge私下买的,具体不能透露。

 这是跟王霁商量的口径。

 秘密必须控制在萧家范围内。

 从文件内容可以看出,曹海确实有了突破进展,接下来,萧氏医疗需要继承他的遗志,训练出模型并检验成果。

 沈月问团队:“需要多少算力资源?多久能训练完?”

 研究院主任回答:“最好有3千张卡,按汇总数据量估计,跑2个月吧。”

 为打赢专项攻坚战,卫健委做了大量协调,各医院都提供了数据。

 训练集不是问题,难的是算法。

 以及算力资源。

 毕竟萧氏医疗不是大模型公司,没有这么多gpu卡。

 主任本想开口要1万张,怕被骂狮子大开口,最终打了个3折。

 其实,3千张也是搞不到的。

 别说3千张,1千张都没有……

 沈月沉吟片刻,摇摇头:

 “卡我来弄,你们要赶时间!”

 “第一次专项汇报是9月15号,算周末只有8天时间。”

 “咱们只有一组参数,还不确定效果如何,这样没法汇报……”

 “我听说智愈医疗已经有完整方案,准备开始训练了!”

 “他们有来自西门子的专家,在立项投入、团队资质方面都占优,肯定会宣布一个激进的项目计划,博取认可。”

 “三家竞争企业里,咱们处于下风,首次汇报必须有说服力!”

 研究院专家们都低着头,听说只有8天时间,没人敢吭声。

 王霁对沈月道:

 “时间太紧,3千张卡算力很难搞到。”

 “即便能从各处协调到卡,还需要汇集到一个机房。”

 “从来源地结束任务、下架拔卡、物流、协调上架,半个月就过去了。”

 “腾云也没有这个规模的机房,而且算力都租出去了。”

 “我可以从其他地方找机房,1千张ok,但3千张够呛。”

 Ai训练还没法做到去中心化,得在一个机房训练,否则数据传输的带宽是巨大开销,而且延迟高、任务不稳定。

 想要8天解决,不止是训练量,连算力也很难找到。

 这时,研究院一位工程师开口:

 “除非……”

 “能再优化算法,减少算力需求。”

 “咱们用的是开源mBir算法,也许存在优化的空间。”

 “但我们以使用为主,对里边的原理,没有人特别精通……”

 “如果能找个大牛过一遍算法,没准可以找出优化点。”

 “只要优化2/3执行效率,1千张卡就能当3千张用了。”

 沈月叹了口气:“咱们以前没积累过这方面专家,哪有现成大牛用?”

 算力、时间都是问题,她心气一下低落不少。

 如果3千张卡需要2个月,1千张卡至少要……

 半年!