< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

Python实现“鸟脸识别”系统，看看什么鸟最贪吃～初学者也能学会

梦晨 2021-03-04 13:08:17 来源：量子位

已开源

梦晨发自凹非寺
量子位报道 | 公众号 QbitAI

网友cldud1245是一个鸟类爱好者（以下简称喂鸟哥），最近打算自学Python。

拥有其他语言编程经验的他，可不打算按部就班从Hello World做起，一上来就挑战图像识别！

他用一个摄像头对着自家后院的喂鸟器，拍到来觅食的鸟就尝试判断鸟的种类，并通过Twitter机器人实时发布判断结果。

运行第一天就拍到了17次！最多的时候每十几分钟就有鸟来光顾。

其中卡罗莱纳山雀总共来过8次，就是还不能准确判断是否是同一只。

使用的技术都是开源的！

喂鸟哥把代码放到了Github上开源，只有一个文件、三百多行。来看看他是怎么实现的吧！

作为初学者，他使用的都是已存在的开源项目，没有自己训练新的模型。

目标检测模型使用的是随TensorFlow目标检测API发布的SSD Openimages v4。

鸟类分类模型是TensorFlow Hub上由Google发布的基于MobileNet V2的轻量级模型。

图像处理就是经典的Open CV了。

不过鸟类分类模型中给出的结果都是拉丁文学名，为了方便大家看懂他又写了一个爬虫从维基百科上把对应的俗名爬了下来。

另外，该项目Github中有详细的思路解说，感兴趣的话可以去学习一下！

还有进步空间

从Twitter上发布的结果目前看来准确率还有待提高，比如拍到飞行中的鸟识别起来会遇到困难。

有时也会把两只鸟识别成三只。喂鸟哥打算用非极大值抑制 （Non-Maximum Suppression）来修复这个问题。

不过这才是项目运行的第一天。

喂鸟哥使用鸟类百科图册进行测试，结果还是很准确的，所以怀疑摄像头是否还不够清晰

有人建议他，把网友指出正确名称的评论爬取下来，与图片一起再加入数据集进行训练，就可以不断提高精度。

还有人提议下一步要识别鸟的个体身份，看看到底是同一只鸟反复来吃东西，还是只是一个品种的很多只鸟。

One More Thing

回复中有人问到：“但是它能判断照片是不是在国家公园拍摄吗？”

这个梗来自网络漫画网站XKCD在2014年发表的一幅漫画。

如果要判断一张照片是否在国家公园拍摄，只需要判断一下图片的地理标记信息就行了。

但是要判断照片里有没有鸟，则是一个困难的多的问题。

Flickr的工程师看到后接受了这个挑战，用当时刚刚掀起新一轮热潮的深度学习做出了漫画中描述的这款程序Park or Bird（现已停止访问）。

来看看当时的深度卷积神经网络的架构。

随着技术的发展，今天的我们不仅能识别照片中是否有鸟，还能判断鸟的种类，甚至识别鸟的个体身份也不再是天方夜谭。

参考链接：

[1]github项目地址 https://github.com/cmoon4/backyard_birdbot
[2]https://twitter.com/BackyardBirdbot
[3]https://xkcd.com/1425/
[4]https://code.flickr.net/2014/10/20/introducing-flickr-park-or-bird/

梦晨

亚太唯一！阿里云跻身Gartner可观测魔力象限“挑战者”象限2026-07-24
业内首款超算+智算的大规模计算底座，在WAIC上我们找到了2026-07-22
AI语音进入“表演时代”：阿里Qwen-Audio-3.0-TTS登顶全球权威榜单2026-07-20
这，可能是今年WAIC最惊艳的图片！2026-07-19

Python实现“鸟脸识别”系统，看看什么鸟最贪吃～初学者也能学会

使用的技术都是开源的！

还有进步空间

One More Thing

相关阅读

人生苦短，Python会不会被取代？国外网友吵翻天

1行代码实现Python数据分析：图表美观清晰，自带对比功能丨开源

macOS新版本终于删掉自带Python2，这波操作连Python死忠粉都叫好

谷歌官方TensorFlow开发者认证来了，吴恩达：学我的课，报名费五折

人类秒懂，AI崩溃：一个简单测试，就让GPT-5、Gemini等顶级模型集体“翻车”

谁是2020年最强Python库？年度Top10出炉

热门文章

智能体政策新闻相关背景和简要解读

合肥又押中AI独角兽：多模态赛道，3个月融了21亿

国产世界模型登顶李飞飞团队榜单！适配国产昇腾算力、代码权重全开源

长内容创作者苦AI失忆久矣，这个新Agent漂亮填坑！门槛低到只需要会用键盘打字

世界模型“六小龙”在WAIC吵起来了！行业红利就在非共识里

Python实现“鸟脸识别”系统，看看什么鸟最贪吃～ 初学者也能学会

使用的技术都是开源的！

还有进步空间

One More Thing

相关阅读

人生苦短，Python会不会被取代？国外网友吵翻天

1行代码实现Python数据分析：图表美观清晰，自带对比功能丨开源

macOS新版本终于删掉自带Python2，这波操作连Python死忠粉都叫好

谷歌官方TensorFlow开发者认证来了，吴恩达：学我的课，报名费五折

人类秒懂，AI崩溃：一个简单测试，就让GPT-5、Gemini等顶级模型集体“翻车”

谁是2020年最强Python库？年度Top10出炉

热门文章

智能体政策新闻相关背景和简要解读

合肥又押中AI独角兽：多模态赛道，3个月融了21亿

国产世界模型登顶李飞飞团队榜单！适配国产昇腾算力、代码权重全开源

长内容创作者苦AI失忆久矣，这个新Agent漂亮填坑！门槛低到只需要会用键盘打字

世界模型“六小龙”在WAIC吵起来了！行业红利就在非共识里

Python实现“鸟脸识别”系统，看看什么鸟最贪吃～初学者也能学会