< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

华为开源只用加法的神经网络：实习生领衔打造，效果不输传统CNN | CVPR 2020 Oral

十三 2020-03-16 12:59:29 来源：量子位

晓查发自凹非寺
量子位报道 | 公众号 QbitAI

没有乘法的神经网络，你敢想象吗？无论是单个神经元的运算还是卷积运算，都不可避免地要使用乘法。

然而乘法对硬件资源的消耗远大于加法。如果不用乘法，全部改用加法应该可以让运算速度大大提升。

去年年底，来自北京大学、华为诺亚方舟实验室、鹏城实验室的研究人员将这一想法付诸实践，他们提出了一种只用加法的神经网络AdderNet（加法器网络）。一作是华为诺亚方舟实习生，正在北大读博三。

如今，这篇文章已经被CVPR 2020收录（Oral），官方也在GitHub上开放了源代码。有兴趣的同学不妨前往一试究竟。

加法器网络简介

加法器网络的核心在于：用L1距离代替欧氏距离。

L1距离是求两点之间坐标差值的绝对值之和，因此全程不涉及乘法。

在这种新的定义下，反向传播中用到的求偏导数运算也变成了求减法。梯度下降的优化过程也被叫做符号SGD（signSGD）。

在加法器网络的新定义下，特征向量的空间分布也和CNN有很大的不同。

那么AdderNet的实际效果如何呢？

在CIFAR-10的图像分类任务中，AdderNet相比当初Bengio等人提出的加法神经网络BNN性能有大幅提升，并且已经接近了传统CNN的结果。

开源代码

官方的AdderNet基于Python3和PyTorch。

先按照PyTorch的官方文档准备ImageNet数据集，运行程序评估它在验证集上的效果：

python test.py —data_dir 'path/to/imagenet_root/'

AdderNet可以在ImageNet数据集上达到74.9％的Top-1准确度和91.7％的Top-5准确度。

或者将CIFAR-10数据集下载到本地，测试一下它在CIFAR-10上的效果

python test.py —dataset cifar10 —model_dir models/ResNet20-AdderNet.pth —data_dir 'path/to/cifar10_root/'

不过AdderNet仍需自己训练，官方表示将很快发布预训练模型。

现阶段的AdderNet并非没有缺陷，作者在项目主页中说，由于AdderNet是用加法过滤器实现的，因此推理速度较慢，需要用CUDA编写才能提高速度。

这与作者希望提高神经网络运算速度的初衷还有一段距离。

但这篇论文的作者表示，今后还会继续加法器神经网络的研究，发表更多的成果，让我们一起期待这项研究取得新的进展吧。

华为诺亚实验室实习生领衔打造

AdderNet这篇文章的一作名叫陈汉亭，毕业于同济大学数学系，现在在北京大学信息科学技术学院攻读博士学位，同时在华为诺亚方舟实验室实习。

在硕博连读的前三年中，他已经以一作身份发表了5篇论文，其中一篇《Data-Free Learning of Student Networks》被ICCV 2019收录，另外它参与多篇论文还被NeurIPS、IJCAI、ICML等顶会收录。

传送门

源代码：https://github.com/huawei-noah/AdderNet

论文地址：https://arxiv.org/abs/1912.13200

华为实习生神经网络

十三

豆包搜索，走出了豆包2026-07-28
北京说Agent已经能造世界，杭州却说它是刚发明的电灯泡2026-07-25
妙啊！无人机直连卫星传Token2026-07-18
1.5B开源通用VLA模型，冲进具身智能第一梯队2026-07-20

华为开源只用加法的神经网络：实习生领衔打造，效果不输传统CNN | CVPR 2020 Oral

加法器网络简介

开源代码

华为诺亚实验室实习生领衔打造

传送门

相关阅读

玩大的！中国联通与华为宣布合作：进军低轨卫星

27万，华为发布首款轿跑SUV，打的就是Model Y，余承东：ADS断代领先

超68万元总奖金池！2025华为软件精英挑战赛启动报名

25万！问界拿掉激光雷达，同日比亚迪成功「会师」华为！

23999元起，鸿蒙「折叠屏」电脑来了！展开比手机还薄

华为盘古718B模型最新成绩：开源第二

热门文章

合肥又押中AI独角兽：多模态赛道，3个月融了21亿

国产世界模型登顶李飞飞团队榜单！适配国产昇腾算力、代码权重全开源

世界模型“六小龙”在WAIC吵起来了！行业红利就在非共识里

全新统一流式架构，Vivix灵动时刻正式发布首个实时互动模型

菲尔兹奖得主王虹，也发过NeurIPS