昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE 性能强劲成本更低

心灵探险家 06-04 305

默认

摘要： 点击上方蓝字关注我们韩国宣布正式成立宇宙航空厅并计划在年前实现登陆月球年前实现登陆火星仔细看韩国人说的登月实际是实现月球车登陆登陆火星应该也是这个意思另外韩国已经与美国达成协议参与...

点击上方蓝字关注我们韩国宣布正式成立“宇宙航空厅”（KASA），并计划在2032年前实现登陆月球、2045年前实现登陆火星。仔细看韩国人说的“登月”，实际是实现月球车登陆，登陆火星应该也是这个意思。另外，韩国已经与美国达成协议，参与到美国主导的载人月球探测“阿尔忒弥斯登月计划”。尽管韩方尚未宣...

6月4日消息:在大模型技术迅速发展的背景下，昆仑万维公司开源了一个具有里程碑意义的稀疏大型语言模型。这个模型不仅在性能上表现出色，而且还大幅降低了推理成本，为应对大规模密集型LLM带来的挑战提供了有效的解决方案。

Skywork-MoE模型特点:

开源和免费商用:Skywork-MoE的模型权重、技术报告完全开源，且免费商用，无需申请。

推理成本降低:该模型在保持性能强劲的同时，大幅降低了推理成本。

稀疏模型:Skywork-MoE是一个专家混合模型（MoE），通过将计算分配给专门的子模型或“专家”，提供了一种经济上更可行的替代方案。

支持单台4090服务器推理:是首个支持用单台4090服务器推理的开源千亿MoE大模型。

技术细节:

模型权重和开源仓库:模型权重可在Hugging Face上下载，开源仓库位于GitHub。

推理代码:提供了支持8x4090服务器上8bit量化加载推理的代码。

性能:在8x4090服务器上，使用昆仑万维团队首创的非均匀Tensor Parallel并行推理方式，Skywork-MoE可以达到2200tokens/s的吞吐量。

模型性能和技术创新:

参数量:Skywork-MoE的总参数量为146B，激活参数量22B，共有16个Expert，每个Expert大小为13B。