-
[DL Basics] 4. Convolution인공지능/부스트캠프 Ai Tech 2022. 2. 12. 09:57728x90
[DL Basics] 4. Convolution In [1]:from IPython.core.display import display, HTML display(HTML("<style>.container { width:90% !important; }</style>"))
많은 용어들을 정확히 정의하고 이해해야 타 연구자들과 커뮤니케이션에서 문제가 없다.
4.Convolution¶
- Continuous convolution
${(f * g)(t) = \int f(\tau)g(t - \tau)d\tau = \int f(t - \tau)g(t)d\tau}$
- Discrete convolution
${(f * g)(t) = \sum_{i=- \infty}^\infty f(i)g(t - i) = \sum_{i=- \infty}^\infty f(t-i)g(i)}$
- 2D image convolution
${(I * K)(i,j) = \sum_m\sum_n I(m,n)K(i-m, j-n) = \sum_m\sum_n I(i-m, i-n)K(m,n)}$
${I}$ : 전체 이미지 공간
${K}$ : 컨볼루션 필터
RGB Image Conv¶
이미지는 가로x세로x채널(RGB)로 구성되어 있다. 이를 Conv filter(Kernel) N개로 연산하면
가로x세로xN 개의 feature map이 생성된다.
4-4. Convolution Arithmetic¶
- Padding (1), Strid(1), 3x3 Kernel
이 모델의 파라미터 갯수는 몇개일까?
3x3x128(커널의 크기) x 64(커널의 갯수) = 73,728
후반부 CNN과 FC(dense layer)이 연결되는 부분의 파라미터 갯수를 확인해보면
13x13x128(Kernel)2 x 2048 2 = 177M
이라는 기존의 CNN의 파라미터 갯수와는 차원이 다른 엄청난 양의 숫자로 증가한다. 그러므로 FC는 줄어드는 추세이다.
4-5. 1x1 Convolution¶
이미지에 1x1 Conv를 곱해주는 이유는 무엇일까?
- 차원축소 : 여기서는 채널을 128에서 32로 줄여준다.
- 파라미터의 숫자를 깊게 쌓으면서 줄이기 위함
- ex) bottleneck architecure : 깊게 쌓으면서 파라미터 숫자를 줄일 수 있다
'인공지능 > 부스트캠프 Ai Tech' 카테고리의 다른 글
[DL Basics] 6. Computer Vision Applications (0) 2022.02.12 [DL Basics] 5. Modern CNN (0) 2022.02.12 [DL Basics] 2. Optimization (0) 2022.02.12 [DL Basics] 1. NN & MLP (0) 2022.02.12 [Data Viz] 2-3. Scatter Plot (0) 2022.02.04