BitNet.cpp

BitNet.cpp

NaN分钟 ·
播放数0
·
评论数0

BitNet.cpp是微软开源的高效推理框架,专为1.58位三值量化大模型设计,首次实现单CPU流畅运行千亿参数模型。其核心创新是将权重限制为{-1,0,+1}三元表示,计算时用位运算替代浮点乘法,极大降低存储与能耗需求。