当前位置: 首页 > news >正文

几B大模型的空间存储大小

1. 前言

砚上三五笔,落墨鹧鸪啼

关于大模型总是会出现几B,然后想知道他们的存储空间大小分别是多少。还有描述一些显卡的TFLOPS是怎么计算的。这里做一个简单的记录。

如有不对,欢迎评论区指正!

2. 正文

2.1 精度类型

包括FP64:64位双精度浮点型 8字节 double

FP32:32位单精度浮点型 4字节 float 32

FP16:16位单精度浮点数 2字节 float 16

INT8: 8位整数 1字节 int8

INT4: 4位整数 0.5字节 int4

2.2大模型参数量

比如一个7B的大模型,采用FP32,则占用存储空间大小为:7x4 GB,即28GB的存储大小。
比如一个70B的大模型,采用FP16,则占用存储空间大小为:70x2 GB,即140GB的存储大小。
但实际的存储大小肯定不是这么简单,真实情况往往比上面更大,因为还包括:

  • 优化器状态(训练时需要 2–3 倍显存)

  • 额外索引、分片信息

  • KV cache(推理时存上下文)

2.2大模型量化

2.3 对称量化

在对称量化过程中,原本浮点数的值域会被映射到量化空间(quantized space)中一个以零为中心的对称区间,量化前后的值域都是围绕零点对称的。

引用自:https://zhuanlan.zhihu.com/p/1899107168172630461

image
假设给出上面的一组浮点数的参数。那么根据最大的绝对值范围做归一化。然后乘以127.

image

量化误差。衡量量化后和解量化后的浮点数之间的误差。

这里其他的量化方法就不再赘述。上述的引用链接的博客写的非常全面,可以对一个参考。

3. 后记

To be continued.......

http://www.hskmm.com/?act=detail&tid=8913

相关文章:

  • hbase安装与配置
  • 发喷山火(volcano)+CF2119F Volcanic Eruptions 解题报告
  • matlab免费下载安装激活教程(附安装包下载)MATLAB R2025a超详细下载安装教程
  • Spring Boot + flowable 完美结合,快速实现工作流 - 教程
  • Pyfluent 执行Meshing工作流
  • EF Core 与 MySQL:日志和调试详解
  • 使用镜像源解决github拉取代码问题 - GD
  • 日记
  • 主机连接虚拟机和hbase的命令
  • 类和面向对象
  • PHP转Go系列 | PHP8 这些新函数让你眼前一亮
  • 代码随想录算法训练营第二天 |209.长度最小的子数组,59. 螺旋矩阵 II
  • mac更新or安装homebrew失败
  • Typescript中闭包的原理 - 教程
  • CF2048H Kevin and Strange Operation
  • Hadoop本地库加载问题分析与解决方案
  • GO基础总结
  • Visual Studio 离线安装0x80131509
  • Oracle备份恢复:backup as copy保留文件名不变化,只更改路径名
  • 读书笔记:数据库中的预连接神器:位图连接索引
  • 故障处理:CRS无法随操作系统自动启动故障案例分享
  • 02020401 EF Core基础01-EF Core简介和开发环境搭建、实体类、配置类、继承DbContex的类、Migration包的使用
  • 专用通路方式
  • typeof()
  • 【未完成】2025.9 做题记录
  • 2025.8 做题记录
  • 关于 “Thinking Machines Lab首次发长文” 的一些知识的学习和补充
  • CF1630F 题解 | 网络流
  • 攻防世界-secret-galaxy-300 - xxx
  • 实用指南:LeetCode 面试经典 150_哈希表_单词规律(41_290_C++_简单)