深度神经网络中的模型量化经过@aibites
1,319 讀數

深度神经网络中的模型量化

2023/09/25
6m
经过 @aibites 1,319 讀數
tldt arrow
ZH
Read on Terminal Reader

太長; 讀書

量化是将值从连续范围转换为较小的离散值集的过程,通常用于深度神经网络中以提高各种设备上的推理速度。此转换涉及将 float32 等高精度格式映射到 int8 等低精度格式。量化可以是均匀的(线性映射)或非均匀的(非线性映射)。在对称量化中,输入中的零映射到输出中的零,而不对称量化会改变这种映射。比例因子和零点是量化的关键参数,通过校准确定。量化模式包括训练后量化(PTQ)和量化感知训练(QAT),其中QAT通过微调提供更好的模型精度。它涉及使用伪量化器来使量化与微调所需的可微性兼容。
featured image - 深度神经网络中的模型量化
Shrinivasan Sankar HackerNoon profile picture

@aibites

Shrinivasan Sankar

I am an AI Reseach Engineer. I was formerly a researcher @Oxford VGG before founding the AI Bites YouTube channel.

react to story with heart
Shrinivasan Sankar HackerNoon profile picture
by Shrinivasan Sankar @aibites.I am an AI Reseach Engineer. I was formerly a researcher @Oxford VGG before founding the AI Bites YouTube channel.
Read my stories

相關故事

L O A D I N G
. . . comments & more!