< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

模型压缩一半，精度几乎无损，TensorFlow推出半精度浮点量化工具包，还有在线Demo

鱼羊 2019-08-06 12:35:22 来源：量子位

鱼羊发自凹非寺

量子位报道 | 公众号 QbitAI

近日，TensorFlow模型优化工具包又添一员大将，训练后的半精度浮点量化（float16 quantization）工具。

有了它，就能在几乎不损失模型精度的情况下，将模型压缩至一半大小，还能改善CPU和硬件加速器延迟。

这一套工具囊括混合量化，全整数量化和修剪。

如何量化模型，尽可任君挑选。

压缩大小，不减精度

双精度是64位，单精度是32位，所谓的半精度浮点数就是使用2个字节（16位）来存储。

比起8位或16位整数，半精度浮点数具有动态范围高的优点；而与单精度浮点数相比，它能节省一半的储存空间和带宽。

比起双精度和单精度浮点数，半精度浮点显然没有那么适合计算。那么问题来了，为什么要主动降低精度呢？

因为实际上，很多应用场景对于精度的要求并没有那么高。在分布式深度学习中，模型可能会有成千上万个参数，体积一个赛一个的大，如果能把所有常量值都用16位浮点数而不是32位浮点数来存储，那么模型大小就能压缩至一半，还是相当可观的。

体积压缩了，精确度难道不会损失吗？

降低浮点数精度，当然会带来精确度的损失，但是不必担心，这样的损失小到可以忽略不计。

在ILSVRC 2012图像分类任务上分别测试标准的MobileNet float32模型和float16模型变体，可以看到，无论是MobileNet v1还是MobileNet v2，无论是top1还是top5，fp16模型的精度损失都小于0.03%。

再试试对象检测任务，fp16变体比之标准模型，几乎没有精度损失。

而无论是MobileNet v1还是MobileNet SSD，fp16变体的体积都比标准模型的大小降低了约一半。

小体积，高精度，有什么理由不试试半精度浮点量化工具呢？

便捷使用

想要把你训练过的32位模型转成16位，操作并不复杂。只需设置两行关键代码。

在TensorFlow Lite converter上把32位模型的优化设置设为DEFAULT，然后把目标规范支持类型设置为FLOAT16：

import tensorflow as tf
converter = tf.lite.TFLiteConverter.from_saved_model(saved_model_dir)
converter.optimizations = [tf.lite.Optimize.DEFAULT]
converter.target_spec.supported_types = [tf.lite.constants.FLOAT16]
Tflite_quanit_model = converter.convert()

模型转换成功之后就可以直接运行了。

默认情况下，模型是这样在CPU上运行的：把16位参数“上采样”为32位，并在标准32位浮点运算中执行操作。

这样做的原因是目前很多硬件还不支持加速fp16计算。在未来，有更多硬件支持的情况下，这些半精度值就不再需要“上采样”，而是可以直接进行计算。

在GPU上运行fp16模型更简单。

TensorFlow Lite的GPU代理已经得到加强，能够直接获取并运行16位精度参数：

//Prepare GPU delegate.
const TfLiteGpuDelegateOptions options = {
 .metadata = NULL,
 .compile_options = {
 .precision_loss_allowed = 1, // FP16
 .preferred_gl_object_type = TFLITE_GL_OBJECT_TYPE_FASTEST,
 .dynamic_batch_enabled = 0, // Not fully functional yet
 },
};

如果你感兴趣，TensorFlow官方还给出了教程demo，打开文末Colab链接，你就可以在线训练一个16位的MNIST模型啦。

传送门

官方指南：

https://www.tensorflow.org/lite/performance/post_training_quantization

Colab链接：

https://colab.research.google.com/github/tensorflow/tensorflow/blob/master/tensorflow/lite/g3doc/performance/post_training_float16_quant.ipynb

— 完 —

TensorFlow 半精度浮点工具包

鱼羊

SpaceX一上市，连食堂阿姨都要成百万富翁了。。。2026-06-12
马斯克SpaceX路演PPT：60页，值1.77万亿美元2026-06-08
刚刚，李飞飞亲自下场定义世界模型2026-06-04
DeepSeek V4还能更省！新工具缓存命中率高达99.82%，2折稳定到手2026-05-25

模型压缩一半，精度几乎无损，TensorFlow推出半精度浮点量化工具包，还有在线Demo

压缩大小，不减精度

便捷使用

传送门

相关阅读

谷歌官方TensorFlow开发者认证来了，吴恩达：学我的课，报名费五折

最好用的音轨分离软件spleeter：处理一首歌仅几秒，上线一周收获2.4k星 | 附实测

PyTorch大更新！谷歌出手帮助开发，正式支持TensorBoard | 附5大开源项目

Python实现“鸟脸识别”系统，看看什么鸟最贪吃～初学者也能学会

PyTorch统治学术论文，TensorFlow只占4%，LeCun：还能为啥？

Keras将死于谷歌之手？reddit网友写“送葬文”，引发热议

热门文章

GPT-5.6首批实测来了！精准狙击Mythos

英特尔锐炫™ Pro B70 GPU亮相MPTS2026，共探大视听时代AI创作新范式

中国第一、全球第二！HiDream-O1-Image-1.5 登顶文生图榜单，超越谷歌、英伟达

3D创作迎来ChatGPT时刻：Meshy发布全球首个3D AI Agent

实测小米最快1T大模型：吞吐量每秒1000+ Tokens，Vibe Coding七秒交付

模型压缩一半，精度几乎无损，TensorFlow推出半精度浮点量化工具包，还有在线Demo

压缩大小，不减精度

便捷使用

传送门

相关阅读

谷歌官方TensorFlow开发者认证来了，吴恩达：学我的课，报名费五折

最好用的音轨分离软件spleeter：处理一首歌仅几秒，上线一周收获2.4k星 | 附实测

PyTorch大更新！谷歌出手帮助开发，正式支持TensorBoard | 附5大开源项目

Python实现“鸟脸识别”系统，看看什么鸟最贪吃～ 初学者也能学会

PyTorch统治学术论文，TensorFlow只占4%，LeCun：还能为啥？

Keras将死于谷歌之手？reddit网友写“送葬文”，引发热议

热门文章

GPT-5.6首批实测来了！精准狙击Mythos

英特尔锐炫™ Pro B70 GPU亮相MPTS2026，共探大视听时代AI创作新范式

中国第一、全球第二！HiDream-O1-Image-1.5 登顶文生图榜单，超越谷歌、英伟达

3D创作迎来ChatGPT时刻：Meshy发布全球首个3D AI Agent

实测小米最快1T大模型：吞吐量每秒1000+ Tokens，Vibe Coding七秒交付

Python实现“鸟脸识别”系统，看看什么鸟最贪吃～初学者也能学会