IT之家 5 月 25 日消息正配配资,面壁智能联合清华大学、OpenBMB 开源社区,今天正式发布并开源其在低比特大模型训练方向的最新成果 ——BitCPM-CANN。
官方表示,这是中国首个完全基于国产算力平台(华为昇腾)实现端到端训练并开源的三值(1.58-bit)大模型。从量化算子、训练算法到全链路框架,BitCPM-CANN 均在华为昇腾上原生完成,包含 0.5B、1B、3B、8B 四个模型尺寸,与同尺寸 MiniCPM4 全精度家族逐项对照评测,性能表现优异。

相比传统 BF16 精度,BitCPM-CANN 在推理阶段释放约 6 倍显存红利,同时将模型能力保留率维持在 90%–97.2%。

官方表示,对手机产业来说,6 倍的显存红利意味着,一个 8B 参数的 BitCPM-CANN 大模型,可以轻松运行在当前主流旗舰手机之上。
此外正配配资,面壁智能基于 MindSpeed × Megatron-LM 主干搭建了完整的低比特训练底座,包含环境适配、32K 长序列支持、并行策略、融合算子等完整工程体系。从此,所有面向昇腾的低比特训练工作,都可建立在同一套公共基础设施之上。
元股证券BitCPM-CANN 0.5B / 1B / 3B / 8B 全系列模型权重现已开源,IT之家附链接如下:元股证券:ygzq.hk ]article_adlist--> 声明:新浪网独家稿件,未经授权禁止转载。 -->
汇通财经APP讯——中东局势再度紧张成为近期全球市场波动的核心驱动因素。伊朗宣布重新关闭霍尔木兹海峡,使这一全球最关键的
2026-04-21
配资炒股 炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 来源:国资小新 小新说 习近平总书记
2026-03-20
美国与伊朗冲突进一步升级的风险令交易员保持谨慎,市场已再度笃定欧洲央行将进行三次、每次25个基点的加息;相比之下,上周四
2026-04-08
配资网站 今天是世界地球日。日前,“我们的力量,我们的地球——2026地球合伙人领导力峰会”在上海举行。围绕生物多样性保
2026-04-23
汇通财经APP讯——美国总统特朗普于周日(4月12日)下令对霍尔木兹海峡实施海军封锁,这一举措令中东冲突快速结束的希望大
2026-04-15