YL003.COM.百科

YL003.COM

☺来自锦州发布时间:2024年06月03日 16:25YL003.COM

YL003.COM

🧀😋❪

YL003.COM

对大模型推理成本的优化，可通过很多技术手段实现。首先是模型本身，模型结构、训练方法都可以持续改进，包括业界很关注的MoE(混合专家模型)，就是优化推理成本很好的解决方案。其次是工程上的优化。大模型的调用量越大，优化推理成本的空间也越大。以前的模型都是单机推理，大模型用的是分布式推理。所以如果能把各种各样底层算力用得更好，推理成本就会大大降低。

从浪潮信息发布的“源2.0-M32”开源大模型来看，其基于“源2.0”系列大模型已有工作基础，创新提出和采用了“基于注意力机制的门控网络”技术，构建包含32个专家(Expert)的混合专家模型(MoE)，并大幅提升了模型算力效率，模型运行时激活参数为37亿，在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。

🍎（撰稿：韦涛贤）

本文来自网友发表，不代表本网站观点和立场，如存在侵权问题，请与本网站联系。未经本平台授权，严禁转载！

展开

打开YL003.COM,阅读全文

支持楼主

79人支持

阅读原文阅读 8503回复 6

全部评论

默认
最新
楼主

梁翠育☐LV3六年级
2楼
《庆余年2》为什么长公主和皇后都说“范闲必须死”？是女人的嫉妒心还是对庆帝的报复？🌮
2024/06/03 来自沈阳
5回复
🈁浦翠之LV3大学四年级
3楼
京津冀地区生产总值10年跨5个万亿元台阶🈚
2024/06/03 来自镇江
0回复
申影燕💅LV5幼儿园
4楼
六月人民好书榜 | 消夏：走进600年的故宫和藏着生趣与乡愁的北京胡同| 消夏：走进600年的故宫和藏着生趣与乡愁的北京胡同🍖
2024/06/03 来自东莞
1回复
梅月翰LV7大学三年级
5楼
6月2日-5日，北京地铁1号线八通线天安门东站D口临时封闭☡
2024/06/03 来自黔南
2回复
司马进琳🈳🧒LV3大学三年级
6楼
共赴“山海之约”——渝港合作书写开放新篇章✛
2024/06/03 来自株洲
7回复
夏青达LV8大学四年级
7楼
对交易的思考➔
2024/06/03 来自芜湖
赞回复