인공지능(AI)

CNN(Convolutional Neural Network)의 기초 개요

더큰돌 2025. 8. 20. 21:38

CNN(Convolutional Neural Network)의 기초 개요

CNN, 즉 합성곱 신경망은 이미지나 시계열 데이터처럼 공간 구조가 있는 데이터를 처리하기 위해 고안된 인공신경망이다. 기존의 완전연결 신경망(Dense Network)은 입력 데이터의 위치나 형태 정보를 무시하는 반면, CNN은 데이터의 위치적 특성과 국소적 패턴을 인식할 수 있도록 설계되어 이미지 분류, 객체 인식, 의료 영상 분석 등 다양한 분야에서 강력한 성능을 발휘한다.

CNN은 여러 층(layer)으로 구성되며, 그 핵심은 합성곱 층(convolution layer)이다. 이 층에서는 ‘필터’ 또는 ‘커널’이라 불리는 작은 행렬이 입력 이미지 위를 움직이며 각 위치에서 특징을 추출한다. 이렇게 추출된 값은 보통 ReLU와 같은 활성화 함수에 의해 비선형성을 부여받고, 이후 풀링(pooling) 과정을 통해 차원이 축소되어 연산량이 줄어들고 중요한 특징만 남게 된다.

이러한 합성곱과 풀링의 과정을 여러 번 반복한 후에는 최종적으로 추출된 특징들을 전개(flatten)하여 완전연결층(Fully Connected Layer)으로 전달하고, 마지막에는 Softmax 함수 등을 통해 분류 결과를 출력한다.

CNN의 역사와 주요 인물

CNN의 개념은 1980년에 일본의 연구자인 쿠니히코 후쿠시마(Kunihiko Fukushima)가 제안한 Neocognitron에서 처음 등장했다. 이는 현재 CNN의 전신으로 평가받는다. 그러나 당시에는 학습 알고리즘과 컴퓨팅 자원의 한계로 실용화에 어려움이 있었다.

이후 1989년, 프랑스 출신의 인공지능 과학자 얀 르쿤(Yann LeCun)이 LeNet-5라는 모델을 개발하면서 CNN의 실용 가능성을 보여주었다. LeNet-5는 주로 손글씨 숫자 인식(MNIST 데이터셋)을 위한 모델로, 오차역전파(backpropagation) 알고리즘을 이용해 학습을 수행한 최초의 CNN 모델이었다. 이 모델은 이후 ATM 수표 인식 등에서 상용화되기도 했다.

하지만 1990~2000년대에는 연산 성능 부족과 대규모 데이터 부족으로 인해 CNN이 널리 사용되지는 못했다. 그러다 2012년, Alex Krizhevsky, Ilya Sutskever, Geoffrey Hinton이 만든 AlexNet이 ImageNet 대회에서 압도적인 성능을 보이며 1위를 차지했고, 이 사건을 계기로 딥러닝과 CNN에 대한 관심이 전 세계적으로 폭발하게 되었다.

CNN의 특징과 활용 분야

CNN은 구조적으로 파라미터 수를 줄일 수 있어 학습 속도가 빠르고, 데이터의 위치나 방향의 변화에도 강건한 특징을 갖는다. 이러한 특성 덕분에 이미지 분류, 얼굴 인식, 자율주행 자동차의 시각 처리, 의료 진단, 음성 인식, 영상 분석 등 다양한 응용 분야에서 활발히 활용되고 있다.

[끝]

'인공지능(AI)' 카테고리의 다른 글

트랜스포머의 역사적 서사  (4) 2025.08.21
RNN(Recurrent Neural Network, 순환 신경망)  (0) 2025.08.21
AI Full Stack  (4) 2025.07.31
인공지능 신경망 서사  (6) 2025.07.31
뇌과학과 인공지능의 만남  (1) 2025.07.14