본문 바로가기
🤖AI

[신경망] 퍼셉트론과 다층 퍼셉트론

by haegomm 2025. 4. 1.

딥러닝 혹은 인공 신경망을 학습하시는 분들께서 가장 먼저 접하게 되는 개념 중 하나는 바로 퍼셉트론(Perceptron)입니다. 퍼셉트론은 신경망을 구성하는 가장 기본적인 단위로, 그 작동 원리와 구조는 이후 학습하게 될 더 복잡한 모델들을 이해하는 데 있어 매우 중요한 기반이 됩니다.


1️⃣ 퍼셉트론이란?

퍼셉트론은 생물학적 뉴런을 수학적으로 단순화한 모델입니다.

인간의 뇌에서 뉴런이 다양한 자극을 받아 일정 기준 이상이 되면 반응하는 것과 같이

퍼셉트론은 여러 입력 값을 받아 계산한 후 특정 조건을 만족할 경우에만 출력 신호를 보냅니다.

입력이 2개인 퍼셉트론

퍼셉트론의 구성 요소

  • 입력값 (x₁, x₂, ..., xₙ): 외부 데이터
  • 가중치 (w₁, w₂, ..., wₙ): 각 입력의 중요도를 나타냄
  • 편향 (bias): 계산값을 조정하는 상수
  • 활성화 함수: 계산된 값이 특정 조건을 만족하는지를 판단
  • 출력값 (y): 결과로 생성되는 이진 값 (0 또는 1)

퍼셉트론의 작동 방식

  1. 여러 입력값을 받아들임
  2. 각 입력값에는 해당 입력의 중요도를 나타내는 가중치를 곱함
  3. 이 값들을 모두 더한 뒤, 편향(bias) 더하기
  4. 최종 계산 결과가 임계값을 초과하면 출력으로 1을, 그렇지 않으면 0을 반환

퍼셉트론의 출력은 두 가지 중 하나입니다.

  • 출력 1: 신호를 보냄
  • 출력 0: 신호를 보내지 않음

이 구조는 마치 전등 스위치처럼 일정 수준 이상의 입력이 들어오면 켜지고💡 그렇지 않으면 꺼지는 원리와 유사하죠!


2️⃣ 퍼셉트론이 가진 한계: XOR 문제

퍼셉트론은 단순한 논리 연산인 AND, OR 등은 잘 처리할 수 있습니다.

하지만 XOR(배타적 논리합)과 같은 문제는 처리할 수 없는 한계를 가지고 있죠.

 

XOR 연산은 다음과 같은 결과를 가집니다:

 

 

XOR은 입력값이 서로 다를 때만 출력이 1이 됩니다.

문제는 이 네 가지 경우를 2차원 평면에 점으로 나타내면 위의 그림에서 보는 것처럼 출력이 1인 점들이 대각선 방향에 위치하게 됩니다.

즉, 출력이 1과 0인 데이터를 하나의 직선으로 나눌 수 없게 되는 것이죠!

 

퍼셉트론은 선형 분류기이므로 직선으로 구분할 수 없는 경우에는 올바른 출력을 내지 못합니다.

 

이러한 한계를 극복하기 위해 다층 퍼셉트론이 필요합니다!

 


3️⃣ 다층 퍼셉트론(MLP)이란?

다층 퍼셉트론은 퍼셉트론을 여러 층으로 확장한 신경망 구조입니다.

MLP는 기본적으로 다음과 같은 세 가지 층으로 구성됩니다.

▪️입력층 (Input Layer)

  • 외부 데이터를 처음으로 받아들이는 층입니다.
  • 입력층의 뉴런 수는 입력 데이터의 특성과 동일합니다.
    예) 28×28 이미지 = 784개의 픽셀 → 입력 뉴런 수 = 784

입력층은 계산을 수행하지 않으며 데이터를 그대로 다음 층으로 전달합니다.

 

▪️은닉층 (Hidden Layer)

  • 입력층과 출력층 사이에 존재하는 층입니다.
  • 1개 이상 존재할 수 있으며, 층 수와 뉴런 수는 조정 가능합니다.
  • 각 뉴런은 활성화 함수를 이용하여 입력을 비선형적으로 변환합니다.

은닉층은 단순히 데이터를 전달하는 것이 아니라

입력값에서 의미 있는 특징을 추출하고 이를 조합하여 더 높은 수준의 표현으로 바꿔줍니다.

 

예를 들어 이미지 인식 문제에서는

  • 초반 은닉층: 선, 모서리 등을 감지
  • 중간 은닉층: 눈, 코 같은 구성 요소 인식
  • 후반 은닉층: 사람 얼굴 전체 인식

이처럼 은닉층이 여러 개로 깊어질수록 더 복잡하고 추상적인 정보를 처리할 수 있게 됩니다!

 

▪️출력층 (Output Layer)

  • 신경망의 최종 예측 결과를 생성하는 층입니다.
  • 뉴런 수는 예측하려는 클래스 수나 출력 차원에 따라 달라집니다.
    예: 손글씨 숫자 이미지를 0부터 9까지 분류하는 문제(총 10개의 클래스가 존재) → 출력층에는 뉴런이 10개 필요

출력층에도 문제의 성격에 따라 적절한 활성화 함수가 사용됩니다:)

 


4️⃣ 층 간 연결 구조

다층 퍼셉트론(MLP)은 완전 연결층 구조를 사용합니다.

즉, 각 층의 모든 뉴런이 다음 층의 모든 뉴런과 연결되어 있습니다. 이 구조 덕분에 모델은 다양한 입력 조합을 고려할 수 있으며 복잡한 문제에 대해 높은 표현력을 가질 수 있습니다.

 

단, 이런 구조는 파라미터 수가 많기 때문에 과적합이나 학습 시간 증가 등의 이슈도 함께 고려해야 합니다.

 


퍼셉트론은 인공 신경망을 구성하는 가장 기초적인 구조로 여러 입력을 받아 간단한 조건에 따라 출력을 결정합니다.

그러나 선형적으로만 구분 가능한 한계로 인해 현실 세계의 많은 문제를 해결하기에는 부족합니다.

 

이러한 한계를 극복하기 위해 등장한 것이 다층 퍼셉트론이며, 은닉층을 통해 비선형적인 문제를 학습하고 처리할 수 있게 되었습니다.

MLP는 현재 딥러닝 모델의 기본 구조로 널리 사용되며 합성곱 신경망(CNN)이나 순환 신경망(RNN) 등도 이러한 개념을 확장한 형태라 할 수 있습니다.


밑바닥 부터 시작하는 딥러닝 책을 읽고 정리하였습니다.

'🤖AI' 카테고리의 다른 글

[신경망] 활성화 함수  (1) 2025.05.31