- L9 k, Y; Q% u) E! a5 M0 } 去年11月有相关的报道,谷歌用深度学习守卫海洋:如何在 4.5 万张照片中找到一只濒危的“美人鱼”?
1 |( K, |0 \8 a+ ]8 F- S0 b- L
% B1 h# t! _3 ^ 今年TensorFlow-dev-summit中又提到了这个是利用tensorflow自动化构建的海洋生物系统,使用的是大量的高像素的无人机航拍图片,然后在图片中找出到了”海牛“这种濒临物种。 # L5 i8 Q9 `0 @" Y
% C2 e. a/ z) D7 U+ \, I4 A- s 前几天我看到了报道中的内容,然后提问了 用Tensorflow自动化构建海洋生物系统,利用上万的图片训练,找到濒临物种“海牛”是什么原理? - 人工智能 - 知乎 ,后来经过回答者给出了该应用的相关论文《Automating Marine Mammal Detection in Aerial Images Captured During Wildlife Surveys: a Deep Learning Approach》,看了论文后发现,报道有误导,因为报道中给出的图片非常模糊,显得识别的效果非常出人意料,但是在论文中使用的训练数据和人工标注数据其实是非常高像素的无人机航拍图片,如图:
7 Y# @6 K+ r- H, r/ w; |( \$ ] 4 N5 J. A6 w. d
论文使用的方法其实也是非常常规的方法,而且主要也是有非常优质的数据,我们来看看。
* X; s0 M; l$ r' O: ?5 @ 1. 系统概述 2 I0 M' V* [9 U/ U) b$ V, j6 e: b/ Z
$ G7 V) ` g4 Y2 d" R
首先使用Simple Linear Iterative Clustering (SLIC)做图像分割,然后把每一个分割区块看做一个region proposal,然后对候选窗口使用DCNN做one-hot分类。 " q% G; b, D; ^ `: E& a
2. SLIC参数设置 SLIC中最重要的一个参数设置就是把像素分类的个数,论文中设置的个数的计算方式为:$ \, w. N# a0 w/ x) A6 n8 Q& W- ?
' B5 C, O$ E2 J9 m: a# j 其中,w,h分别是整个画面的宽和长,d是一个预测的每个bounding box的长,这个其实可以理解为就是”海牛“在画面中的大小。
) O) z+ b# _% v: v- w 3. CNN结构
: S1 e' D" _/ @$ I 文中的CNN结构对比了两种结构, 第一种是没有使用maxout的结构:
, l4 G$ M/ H- ]0 x- c. p ) I, l+ n# r/ n9 g9 O0 c- q
第二种是使用了maxout的结构: . q9 b. a# l2 y! ?
; a( `8 T0 e4 G 4. 实验结果 9 \1 z3 X2 l4 O
! V& i/ C, ^ m& X
1 x# M+ M+ G8 q# G/ E 准确度其实还不是很高,不过训练还是挺快的,文中用GPU训练,大概就训练了半天,实际应用中,据说可以帮助解决80%的海牛检测。
( m- O9 T z, Q. j3 U$ I6 |4 @ 5. 延伸 [1]实验数据的HDF5格式和python code[2]另外一个关于bowhead whale的研究:《Trends in bowhead whales in West Greenland: Aerial
& \" h% ^: X1 ~/ B6 i( t+ K; K! a, ` surveys vs. genetic capture-recapture analyses》
+ ?# W. |' B$ l; p/ A9 X7 ~4 O5 F ---人工智能应用系列·介绍--- 5 H5 o" g; y H
本系列介绍各领域的一些有趣的人工智能应用,原理可能并没有那么复杂,目的是开拓大家的视野和思路,也许人工智能能做的事情比我们想象的还要多。 专栏地址:人工智能应用系列 - 知乎专栏 (欢迎投稿和关注)& b1 l7 A# R$ ^0 y) a
本人的Live:「跨领域人工智能应用」系列Live的开篇--如何做跨领域人工智能应用 0 x2 f4 q5 J5 {. h& n9 a5 e7 k" B
+ L" _" L) c2 E, D2 R/ M- Y f* ^* ~6 z7 G: o$ A
- M$ @, C9 x) o6 J6 w8 }! G. g6 o% e+ z
|