YOLO v2 Net

conv32 maxpool32 conv64 maxpool64 conv128 conv64 conv128 maxpool128 conv256 conv128 conv256 maxpool256 conv512 conv256 conv512 conv256 conv512 concat maxpool512 conv1024 conv512 conv1024 conv512 conv1024 conv1024 conv1024 conv1024 conv425 reorg route conv64 Dectection 64 32 32 64 64 128 64 128 128 256 256 256 512 256 512 512 512 512 512 128 256 1024 1024 1024 1024 1024 256 1024 425
data · Data
transform param
crop size: 416
mirror: true
data param
source: PASCAL VOC 2007 train + 2012 train & test
batch size: 32
blob shapes
data: [ 1, 3, 416, 416 ]
label: [ 1 ]
activation: leakyrelu
輸入圖片大小: 416x416
輸入圖片數量: 3
模型: Convolution
層數: 0
輸出數量: 32
每次移動: 1
權重大小: 3x3
輸出圖片大小: 416x416
輸入圖片大小: 416x416
輸入圖片數量: 32
模型: MaxPool
層數: 1
輸出數量: 32
每次移動: 2
權重大小: 2x2
輸出圖片大小: 208x208
輸入圖片大小: 208x208
輸入圖片數量: 32
模型: Convolution
層數: 2
輸出數量: 64
每次移動: 1
權重大小: 3x3
輸出圖片大小: 208x208
輸入圖片大小: 208x208
輸入圖片數量: 64
模型: MaxPool
層數: 3
輸出數量: 64
每次移動: 2
權重大小: 2x2
輸出圖片大小: 104x104
輸入圖片大小: 104x104
輸入圖片數量: 64
模型: Convolution
層數: 4
輸出數量: 128
每次移動: 1
權重大小: 3x3
輸出圖片大小: 104x104
輸入圖片大小: 104x104
輸入圖片數量: 64
模型: Convolution
層數: 5
輸出數量: 64
每次移動: 1
權重大小: 3x3
輸出圖片大小: 104x104
輸入圖片大小: 104x104
輸入圖片數量: 64
模型: Convolution
層數: 6
輸出數量: 128
每次移動: 1
權重大小: 3x3
輸出圖片大小: 104x104
輸入圖片大小: 104x104
輸入圖片數量: 128
模型: MaxPool
層數: 7
輸出數量: 128
每次移動: 2
權重大小: 2x2
輸出圖片大小: 52x52
輸入圖片大小: 52x52
輸入圖片數量: 128
模型: Convolution
層數: 8
輸出數量: 256
每次移動: 1
權重大小: 3x3
輸出圖片大小: 52x52
輸入圖片大小: 52x52
輸入圖片數量: 256
模型: Convolution
層數: 9
輸出數量: 128
每次移動: 1
權重大小: 3x3
輸出圖片大小: 52x52
輸入圖片大小: 52x52
輸入圖片數量: 128
模型: Convolution
層數: 10
輸出數量: 256
每次移動: 1
權重大小: 3x3
輸出圖片大小: 52x52
輸入圖片大小: 52x52
輸入圖片數量: 256
模型: MaxPool
層數: 11
輸出數量: 256
每次移動: 2
權重大小: 2x2
輸出圖片大小: 26x26
輸入圖片大小: 26x26
輸入圖片數量: 256
模型: Convolution
層數: 12
輸出數量: 512
每次移動: 1
權重大小: 3x3
輸出圖片大小: 26x26
輸入圖片大小: 26x26
輸入圖片數量: 512
模型: Convolution
層數: 13
輸出數量: 256
每次移動: 1
權重大小: 3x3
輸出圖片大小: 26x26
輸入圖片大小: 26x26
輸入圖片數量: 256
模型: Convolution
層數: 14
輸出數量: 512
每次移動: 1
權重大小: 3x3
輸出圖片大小: 26x26
輸入圖片大小: 26x26
輸入圖片數量: 512
模型: Convolution
層數: 15
輸出數量: 256
每次移動: 1
權重大小: 3x3
輸出圖片大小: 26x26
輸入圖片大小: 26x26
輸入圖片數量: 256
模型: Convolution
層數: 16
輸出數量: 512
每次移動: 1
權重大小: 3x3
輸出圖片大小: 26x26
輸入圖片大小: 26x26
輸入圖片數量: 512
模型: MaxPool
層數: 17
輸出數量: 512
每次移動: 2
權重大小: 2x2
輸出圖片大小: 13x13
輸入圖片大小: 13x13
輸入圖片數量: 512
模型: Convolution
層數: 18
輸出數量: 1024
每次移動: 1
權重大小: 3x3
輸出圖片大小: 13x13
輸入圖片大小: 13x13
輸入圖片數量: 1024
模型: Convolution
層數: 19
輸出數量: 512
每次移動: 1
權重大小: 3x3
輸出圖片大小: 13x13
輸入圖片大小: 13x13
輸入圖片數量: 512
模型: Convolution
層數: 20
輸出數量: 1024
每次移動: 1
權重大小: 3x3
輸出圖片大小: 13x13
輸入圖片大小: 13x13
輸入圖片數量: 1024
模型: Convolution
層數: 21
輸出數量: 512
每次移動: 1
權重大小: 3x3
輸出圖片大小: 13x13
輸入圖片大小: 13x13
輸入圖片數量: 512
模型: Convolution
層數: 22
輸出數量: 1024
每次移動: 1
權重大小: 3x3
輸出圖片大小: 13x13
輸入圖片大小: 13x13
輸入圖片數量: 1024
模型: Convolution
層數: 23
輸出數量: 1024
每次移動: 1
權重大小: 3x3
輸出圖片大小: 13x13
輸入圖片大小: 13x13
輸入圖片數量: 1024
模型: Convolution
層數: 24
輸出數量: 1024
每次移動: 1
權重大小: 3x3
輸出圖片大小: 13x13
層數: 25
讀取第16層輸出結果
輸入圖片大小: 26x26
輸入圖片數量: 512
模型: Convolution
層數: 26
輸出數量: 64
權重大小: 3x3
輸出圖片大小: 26x26
輸入圖片大小: 26x26
輸入圖片數量: 64
模型: Reorganization
層數: 27
輸出數量: 256
輸出圖片大小: 13x13
模型: concat 合併
合併層數: 27 24
層數: 28
輸入圖片大小: 13x13
輸入圖片數量: 1280
模型: Convolution
層數: 29
輸出數量: 1024
每次移動: 1
權重大小: 3x3
輸出圖片大小: 13x13
輸入圖片大小: 13x13
輸入圖片數量: 1024
模型: Convolution
層數: 30
輸出數量: 1024
每次移動: 1
權重大小: 3x3
輸出圖片大小: 13x13
Region ·Region
偵測結果
Layer Type Filters Size/Stride Output size
0 Convolutional 32 3x3/1 416x416
1 Maxpool 2x2/2 208x208
2 Convolutional 64 3x3/1 208x208
3 Maxpool 2x2/2 104x104
4 Convolutional 128 3x3/1 104x104
5 Convolutional 64 3x3/1 104x104
6 Convolutional 128 3x3/1 104x104
7 Maxpool 2x2/2 52x52
8 Convolutional 256 3x3/1 52x52
9 Convolutional 128 1x1/1 52x52
10 Convolutional 256 3x3/1 52x52
11 Maxpool 2x2/2 26x26
12 Convolutional 512 3x3/1 26x26
13 Convolutional 256 3x3/1 26x26
14 Convolutional 512 3x3/1 26x26
15 Convolutional 256 1x1/1 26x26
16 Convolutional 512 3x3/1 26x26
17 Maxpool 2x2/2 13x13
18 Convolutional 1024 3x3/1 13x13
19 Convolutional 512 1x1/1 13x13
20 Convolutional 1024 3x3/1 13x13
21 Convolutional 512 1x1/1 13x13
22 Convolutional 1024 3x3/1 13x13
23 Convolutional 1024 3x3/1 13x13
24 Convolutional 1024 3x3/1 13x13
25 Route 16
26 Convolutional 64 1x1/1 26x26
27 Reorg /2 13x13
28 Route 27 24
29 Convolutional 1024 3x3/1 13x13
30 Convolutional 425 1x1/1 13x13
31 Detection

原圖

結果

第0層卷積結果