๐Ÿ“—
JunegLee's TIL
  • TIL
  • python
    • class
    • String Basic
    • regularExpression
    • String function
    • Generator
    • String format
    • getset
    • module
    • while
    • numpy
    • print()
    • matplotlib
    • for
    • Boolean
    • tuple
    • package
    • input(variable)
    • list
    • if
    • file
    • type()
    • pandas
    • function
    • dictionary
    • ๊ตฌ๋ฌธ ์˜ค๋ฅ˜์™€ ์˜ˆ์™ธ
    • builtinFunction
    • Constructor
  • algorithm
    • sort
      • mergeSort
      • insertionSort
      • bubbleSort
      • heapSort
      • quickSort
      • selectionSort
    • recursion
    • Greedy
    • DepthFirstSearch
    • basic
      • DataStructure
    • hash
    • BreadthFirstSearch
  • tensorflow
    • keras
      • layers
        • Flatten
        • Flatten
        • Dense
        • Dense
        • Conv2D
        • Conv2D
    • tensorflow1x
    • tensorflow2x
  • DB
    • setting
    • join
    • subQuery
    • overview
  • deep-learning
    • neuralNetwork
    • perceptron
    • neuralNetworkLearning
    • convolution neural network
    • Gradient Descent
    • Linear Regression
    • backPropagation
    • logistic regression
    • overview
  • textPreprocessing
    • overview
  • java
    • basics
      • generic
      • Variable
      • String
    • theory
      • Object Oriented Programing
  • NLP
    • Embedding
    • Natural Language Processing
Powered by GitBook
On this page
  • ํ•ฉ์„ฑ๊ณฑ ์‹ ๊ฒฝ๋ง (convolution neural network: CNN)
  • ํ•ฉ์„ฑ๊ณฑ ๊ณ„์ธต (convolutional layer) ๊ณผ ํ’€๋ง ๊ณ„์ธต(pooling layer)
  • ์™„์ „์—ฐ๊ฒฐ ๊ณ„์ธต์˜ ๋ฌธ์ œ์ 
  • ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ
  • ํŒจ๋”ฉ (padding)
  • ์ŠคํŠธ๋ผ์ดํŠธ (stride)
  • 3์ฐจ์› ๋ฐ์ดํ„ฐ์˜ ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ
  • ๋ธ”๋ก์œผ๋กœ ์ƒ๊ฐํ•˜๊ธฐ
  • ๋ฐฐ์น˜ ์ฒ˜๋ฆฌ
  • ํ’€๋ง ๊ณ„์ธต
  • ํ’€๋ง ๊ณ„์ธต์˜ ํŠน์ง•

Was this helpful?

  1. deep-learning

convolution neural network

ํ•ฉ์„ฑ๊ณฑ ์‹ ๊ฒฝ๋ง (convolution neural network: CNN)

  • CNN์€ ์ด๋ฏธ์ง€ ์ธ์‹๊ณผ ์Œ์„ฑ ์ธ์‹ ๋“ฑ ๋‹ค์–‘ํ•œ ๊ณณ์—์„œ ์‚ฌ์šฉ๋˜๋Š”๋ฐ , ํŠนํžˆ ์ด๋ฏธ์ง€ ์ธ์‹ ๋ถ„์•ผ์—์„œ ๋”ฅ๋Ÿฌ๋‹์„ ํ™œ์šฉํ•œ ๊ธฐ๊ฒ์€ ๊ฑฐ์˜๋‹ค CNN์„ ๊ธฐ์ดˆ๋กœ ํ•œ๋‹ค

ํ•ฉ์„ฑ๊ณฑ ๊ณ„์ธต (convolutional layer) ๊ณผ ํ’€๋ง ๊ณ„์ธต(pooling layer)

  • ์ง€๊ธˆ๊นŒ์ง€ ๋ณธ ์‹ ๊ฒฝ๋ง์€ ์ธ์ ‘ํ•˜๋Š” ๊ณ„์ธต์˜ ๋ชจ๋“  ๋‰ด๋Ÿฐ๊ณผ ๊ฒฐํ•ฉ๋˜์–ด ์žˆ๊ณ , ์ด๋ฅผ ์™„์ „์—ฐ๊ฒฐ (fully-connected, ์ „๊ฒฐํ•ฉ)์ด๋ผ๊ณ  ํ•˜๋ฉฐ, ์™„์ „ํžˆ ์—ฐ๊ฒฐ๋œ ๊ณ„์ธต์„ Affine ๊ณ„์ธต์ด๋ผ๋Š” ์ด๋ฆ„์œผ๋กœ ๊ตฌํ˜„ํ•˜๊ณ  ์žˆ๋‹ค.

  • ์™„์ „ํ•œ ์‹ ๊ฒฝ๋ง์€ Affine ๊ณ„์ธต ๋’ค์— ํ™œ์„ฑํ™” ํ•จ์ˆ˜์ธ ReLU๊ณ„์ธต (sigmoid๊ณ„์ธต)์ด ์ด์–ด์ง„๋‹ค

  • CNN ์—์„œ๋Š” ์ƒˆ๋กœ์šด ํ•ฉ์„ฑ๊ณฑ ๊ณ„์ธต๊ณผ ํ’€๋ง ๊ณ„์ธต์ด ์ถ”๊ฐ€๋œ๋‹ค. ์ฆ‰, Affine = ReLU ์—ฐ๊ฒฐ์ด Conv - ReLU - (Pooling)์œผ๋กœ ๋ฐ”๋€๋‹ค

  • ๋˜ํ•œ, CNN์—์„œ๋Š” Affine-ReLU์˜ ๊ตฌ์„ฑ์ด ๊ฐ€๋Šฅํ•˜๋ฉฐ, ๋งˆ์ง€๋ง‰ ์ถœ๋ ฅ ๊ณ„์ธต์—์„œ๋Š” Affine- Softmax๋ฅผ ๊ทธ๋Œ€๋กœ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค

  • CNN์—์„œ๋Š” ํŒจ๋”ฉ padding, ์ŠคํŠธ๋ผ์ด๋“œ stride ๋“ฑ CNN ๊ณ ์œ ์˜ ์šฉ์–ด๊ฐ€ ๋“ฑ์žฅํ•œ๋‹ค. ๋˜, ๊ฐ ๊ณ„์ธต ์‚ฌ์ด์—๋Š” 3์ฐจ์› ๋ฐ์ดํ„ฐ๊ฐ™์ด ์ž…์ฒด์ ์ธ ๋ฐ์ดํ„ฐ๊ฐ€ ํ๋ฅธ๋‹ค๋Š” ์ ์—์„œ ์™„์ „์—ฐ๊ฒฐ ์‹ ๊ฒฝ๋ง๊ณผ ๋‹ค๋ฅด๋‹ค

์™„์ „์—ฐ๊ฒฐ ๊ณ„์ธต์˜ ๋ฌธ์ œ์ 

  • ๋ฐ”๋กœ, ๋ฐ์ดํ„ฐ์˜ ํ˜•์ƒ์ด ๋ฌด์‹œ ๋œ๋‹ค๋Š” ์‚ฌ์‹ค์ด ๋ฌธ์ œ์ ์ด๋‹ค

  • ํ˜•์ƒ์„ ๋ฌด์‹œํ•˜๊ณ  ๋ชจ๋“  ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ๋™๋“ฑํ•œ ๋‰ด๋Ÿฐ (๊ฐ™์€ ์ฐจ์›์˜ ๋‰ด๋Ÿฐ)์œผ๋กœ ์ทจ๊ธ‰ํ•˜์—ฌ ํ˜•์ƒ์— ๋‹ด๊ธด ์ •๋ณด๋ฅผ ์‚ด๋ฆด ์ˆ˜ ์—†๋‹ค. ํ•œํŽธ, ํ•ฉ์„ฑ๊ณฑ ๊ณ„์ธต์€ ํ˜•์ƒ์„ ์œ ์ง€ํ•œ๋‹ค

  • ์ด๋ฏธ์ง€๋„ 3์ฐจ์› ๋ฐ์ดํ„ฐ๋กœ ์ž…๋ ฅ ๋ฐ›์Œ, ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ๋‹ค์Œ๊ณ„์ธต์—์„œ๋„ 3์ฐจ์› ๋ฐ์ดํ„ฐ๋กœ ์ „๋‹ฌํ•œ๋‹ค.

  • ๊ทธ๋ž˜์„œ CNN ์—์„œ๋Š” ์ด๋ฏธ์ง€์ฒ˜๋Ÿผ ํ˜•์ƒ์„ ๊ฐ€์ง„ ๋ฐ์ดํ„ฐ๋ฅผ ์ œ๋Œ€๋กœ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋‹ค

  • CNN์—์„œ๋Š” ํ•ฉ์„ฑ๊ณฑ ๊ณ„์ธต์˜ ์ž…์ถœ๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ํŠน์ง•๋งต feature map ์ด๋ผ๊ณ  ํ•œ๋‹ค

  • ์ž…๋ ฅ ํŠน์ง• ๋งต์„ input feature map, ์ถœ๋ ฅ ํŠน์ง• ๋งต์„ output feature map์ด๋ผ๊ณ  ํ•œ๋‹ค

ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ

  • ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ์€ ์ด๋ฏธ์ง€ ์ฒ˜๋ฆฌ์—์„œ ๋งํ•˜๋Š” ํ•„ํ„ฐ ์—ฐ์‚ฐ์— ํ•ด๋‹นํ•œ๋‹ค

  • ํ•„ํ„ฐ์˜ ํ˜•์ƒ์„ ๋†’์ด์™€ ๋„ˆ๋น„๋กœ ํ‘œ๊ธฐํ•˜๋ฉฐ, ํ•„ํ„ฐ๋ฅผ ์ปค๋„์ด๋ผ๊ณ  ์นญํ•˜๊ธฐ๋„ ํ•œ๋‹ค

  • ํ•ฉ์„ฑ๊ณฑ์˜ ์—ฐ์‚ฐ์€ ํ•„ํ„ฐ์˜ ์›๋„์šฐ window๋ฅผ ์ผ์ •ํ•œ ๊ฐ„๊ฒฉ์œผ๋กœ ์ด๋™ํ•ด๊ฐ€๋ฉด ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์— ์ ์šฉ

  • ์ด๋ฅผ, ๋‹จ์ผ ๊ณฑ์…ˆ - ๋ˆ„์‚ฐ (fused multiply add : FMA)์ด๋ผ ํ•œ๋‹ค

  • ์™„์ „์—ฐ๊ฒฐ ์‹ ๊ฒฌ๋ง์—๋Š” ๊ฐ€์ค‘์น˜ ๋งค๊ฐœ๋ณ€์ˆ˜์™€ ํŽธํ–ฅ์ด ์กด์žฌํ•˜๋Š”๋ฐ, CNN์—์„œ๋Š” ํ•„ํ„ฐ์˜ ๋งค๊ฐœ๋ณ€์ˆ˜๊ฐ€ ๊ทธ๋™์•ˆ์˜ ๊ฐ€์ค‘์น˜์— ํ•ด๋‹นํ•œ๋‹ค

  • ๊ทธ๋ฆฌ๊ณ  CNN์—์„œ๋„ ํŽธํ–ฅ์ด ์กด์žฌํ•œ๋‹ค. ํŽธํ–ฅ์€ ํ•ญ์ƒ ํ•˜๋‚˜(1x1)๋งŒ ์กด์žฌํ•œ๋‹ค

ํŒจ๋”ฉ (padding)

  • ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ์„ ์ˆ˜ํ–‰ํ•˜์ง€ ์ „์— ์ž…๋ ฅ ๋ฐ์ดํ„ฐ ์ฃผ๋ณ€์„ ํŠน์ • ๊ฐ’(์˜ˆ์ปจ๋Œ€ 0)์œผ๋กœ ์ฑ„์›€

  • ํŒจํŒ…์€ ์ฃผ๋กœ ์ถœ๋ ฅ ํฌ๊ธฐ๋ฅผ ์กฐ์ •ํ•  ๋ชฉ์ ์œผ๋กœ ์‚ฌ์šฉํ•œ๋‹ค

  • ์ฆ‰, ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ์„ ๊ฑฐ์น  ๋•Œ๋งˆ๋‹ค ํฌ๊ธฐ๊ฐ€ ์ž‘์•„์ง€๋ฉด ์–ด๋А ์‹œ์ ์—์„œ๋Š” ์ถœ๋ ฅ ํฌ๊ธฐ๊ฐ€ 1์ด ๋˜์–ด ๋ฒ„๋ฆด์ˆ˜ ์žˆ๋‹ค

  • ์ด๋Ÿฌํ•œ ์‚ฌํƒœ๋ฅผ ๋ง‰๊ธฐ ์œ„ํ•ด์„œ ํŒจํŒ…์„ ์‚ฌ์šฉํ•œ๋‹ค

์ŠคํŠธ๋ผ์ดํŠธ (stride)

  • ํ•„ํ„ฐ๋ฅผ ์ ์šฉํ•˜๋Š” ์œ„์น˜์˜ ๊ฐ„๊ฒฉ์„ ์ŠคํŠธ๋ผ์ดํŠธ๋ผ๊ณ  ํ•œ๋‹ค

  • ์˜ˆ๋ฅผ ๋“ค์–ด ์ŠคํŠธ๋ผ์ดํŠธ๋ฅผ 2๋กœ ํ•˜๋ฉด ํ•„ํ„ฐ๋ฅผ ์ ์šฉํ•˜๋Š” ์›๋„์šฐ๊ฐ€ ๋‘์นธ์”ฉ ์ด๋™

์ž…๋ ฅ ํฌ๊ธฐ(H, W), ํ•„ํ„ฐ ํฌ๊ธฐ(FH, FW), ์ถœ๋ ฅ ํฌ๊ธฐ (OH, OW), ํŒจํŒ… P, ์ŠคํŠธ๋ผ์ดํŠธ S
OH = ((H + P -FH)/S) + 1 (์ŠคํŠธ๋ผ์ดํŠธ 1๋กœ ์„ค์ •)
OW = ((W + P -FW)/S) + 1 (์ŠคํŠธ๋ผ์ดํŠธ 1๋กœ ์„ค์ •)
OH = ((H + 2P -FH)/S) + 1 (์ŠคํŠธ๋ผ์ดํŠธ 2๋กœ ์„ค์ •)
OW = ((W + 2P -FW)/S) + 1 (์ŠคํŠธ๋ผ์ดํŠธ 2๋กœ ์„ค์ •)

3์ฐจ์› ๋ฐ์ดํ„ฐ์˜ ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ

  • ์ด๋ฏธ์ง€๋งŒ ํ•ด๋„ ์„ธ๋กœ, ๊ฐ€๋กœ์— ๋”ํ•ด์„œ ์ฑ„๋„๊นŒ์ง€ ๊ณ ๋ คํ•œ 3์ฐจ์› ๋ฐ์ดํ„ฐ์ด๋‹ค

  • 2์ฐจ์› ์ผ๋•Œ์™€ ๋น„๊ตํ•˜๋ฉด, ๊ธธ์ด ๋ฐฉํ–ฅ(์ฑ„๋„ ๋ฐฉํ–ฅ)์œผ๋กœ ํŠน์ง• ๋งต์ด ๋Š˜์–ด๋‚œ๋‹ค

  • ์ฑ„๋„ ์ชฝ์œผ๋กœ ํŠน์ง• ๋งต์ด ์—ฌ๋Ÿฌ ๊ฐœ ์žˆ๋‹ค๋ฉด ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์™€ ํ•„ํ„ฐ์˜ ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ์„ ์ฑ„๋„๋งˆ๋‹ค ์ˆ˜ํ–‰ํ•˜๊ณ , ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ๋”ํ•ด์„œ ํ•˜๋‚˜์˜ ์ถœ๋ ฅ์„ ์–ป๋Š”๋‹ค

  • 3์ฐจ์›์˜ ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ์—์„œ ์ฃผ์˜ํ•  ์ ์€ ์ž…๋ ฅ๋ฐ์ดํ„ฐ์˜ ์ฑ„๋„์ˆ˜์™€ ํ•„ํ„ฐ์˜ ์ฑ„๋„์ˆ˜๊ฐ€ ๊ฐ™์•„์•ผ ํ•œ๋‹ค

๋ธ”๋ก์œผ๋กœ ์ƒ๊ฐํ•˜๊ธฐ

  • 3์ฐจ์›์˜ ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ์€ ๋ฐ์ดํ„ฐ์•„ ํ•„ํ„ฐ๋ฅผ ์ง์œก๋ฉด์ฒด ๋ธ”๋ก์ด๋ผ๊ณ  ์ƒ๊ฐํ•˜๋ฉด ๋œ๋‹ค

  • ์ž…๋ ฅ๋ฐ์ดํ„ฐ (C, H, W) * ํ•„ํ„ฐ (C, FH, FW) = ์ถœ๋ ฅ๋ฐ์ดํ„ฐ(1, OH, OW)

  • ๊ทธ๋Ÿผ ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ์˜ ์ถœ๋ ฅ์œผ๋กœ ๋‹ค์ˆ˜์˜ ์ฑ„๋„์„ ๋‚ด๋ณด๋‚ด๋ ค๋ฉด ์–ด๋–ป๊ฒŒ ํ•ด์•ผ ํ• ๊นŒ์š”? => ํ•„ํ„ฐ(๊ฐ€์ค‘์น˜)๋ฅผ ๋‹ค์ˆ˜ ์‚ฌ์šฉํ•œ๋‹ค

  • ์ž…๋ ฅ๋ฐ์ดํ„ฐ (C, H, W) * ํ•„ํ„ฐ (C, FH, FW, FN) = ์ถœ๋ ฅ๋ฐ์ดํ„ฐ(FN, OH, OW) ์—ฌ๊ธฐ์„œ ํ•„ํ„ฐ๋ฅผ FN๊ฐœ ์ ์šฉํ•˜๋ฉด ์ถœ๋ ฅ ๋งต๋„ FN๊ฐœ ์ƒ์„ฑ๋œ๋‹ค

  • ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ์—๋„(์™„์ „ ์—ฐ๊ฒฐ ๊ณ„์ธต๊ณผ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ) ํŽธํ–ฅ์ด ์“ฐ์ธ๋‹ค

  • ์ž…๋ ฅ๋ฐ์ดํ„ฐ (C, H, W) * ํ•„ํ„ฐ (C, FH, FW, FN) => ์ถœ๋ ฅ๋ฐ์ดํ„ฐ(FN, OH, OW) + ํŽธํ–ฅ (FN, 1, 1) => (FN, OH, OW)

  • ํ˜•์ƒ์ด ๋‹ค๋ฅธ ๋ธ”๋ก์˜ ๋ง์…ˆ์€ ๋„˜ํŒŒ์ด์˜ ๋ธŒ๋กœ๋“œ์บ์ŠคํŠธ ๊ธฐ๋Šฅ์œผ๋กœ ์‰ฝ๊ฒŒ ๊ตฌํ˜„์ด ๊ฐ€๋Šฅํ•˜๋‹ค

๋ฐฐ์น˜ ์ฒ˜๋ฆฌ

  • ์‹ ๊ฒฝ์ฒ˜๋ฆฌ์—์„œ๋Š” ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ํ•œ๋ฉ์ด๋กœ ๋ฌถ์–ด ๋ฐฐ์น˜๋ฅผ ์ฒ˜๋ฆฌํ–ˆ๋‹ค

  • ์™„์ „ ์—ฐ๊ฒฐ ์‹ ๊ฒฝ๋ง์„ ๊ตฌํ˜„ํ•˜๋ฉด์„œ๋Š” ์ด ๋ฐฉ์‹์„ ์ง€์›ํ•˜์—ฌ ์ฒ˜๋ฆฌ ํšจ์œจ์„ ๋†’์ด๊ณ , ๋ฏธ๋‹ˆ๋ฐฐ์น˜ ๋ฐฉ์‹์˜ ํ•™์Šต๋„ ์ง€์›ํ•˜์˜€๋‹ค

  • ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ๋„ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ๋ฐฐ์น˜ ์ฒ˜๋ฆฌ ๋ฅผ ์ง€์›ํ•˜๋ฉฐ, ๊ฐ ๊ณ„์ธต์„ ํ๋ฅด๋А ๋ฐ์ดํ„ฐ์˜ ์ฐจ์›์„ ํ•˜๋‚˜ ๋Š˜๋ ค 4์ฐจ์› ๋ฐ์ดํ„ฐ๋กœ ์ €์žฅ

  • ์ž…๋ ฅ๋ฐ์ดํ„ฐ (N(N๊ฐœ ๋ฐ์ดํ„ฐ) ,C, H, W) * ํ•„ํ„ฐ (C, FH, FW, FN)

  • => ์ถœ๋ ฅ๋ฐ์ดํ„ฐ(N(N๊ฐœ ๋ฐ์ดํ„ฐ), FN, OH, OW) + ํŽธํ–ฅ (FN, 1, 1)

  • => (N(N๊ฐœ ๋ฐ์ดํ„ฐ), FN, OH, OW)

  • ์ด์ฒ˜๋Ÿผ ๋ฐ์ดํ„ฐ๋Š” 4์ฐจ์› ํ˜•์ƒ์„ ๊ฐ€์ง„ ์ฑ„ ๊ฐ ๊ณ„์ธต์„ ํƒ€๊ณ  ํ๋ฆ…๋‹ˆ๋‹ค

  • ์—ฌ๊ธฐ์—์„œ ์ฃผ์˜ํ•  ์ ์œผ๋กœ๋Š” ์‹ ๊ฒฝ๋ง์— 4์ฐจ์› ๋ฐ์ดํ„ฐ๊ฐ€ ํ•˜๋‚˜ ํ๋ฅผ ๋•Œ๋งˆ๋‹ค ๋ฐ์ดํ„ฐ N๊ฐœ ๋Œ€ํ•œ ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ์ด ์ด๋ค„์ง„๋‹ค๋Š” ๊ฒƒ์ด๋‹ค

  • ์ฆ‰, N ํšŒ ๋ถ„์˜ ์ฒ˜๋ฆฌ๋ฅผ ํ•œ ๋ฒˆ์— ์ˆ˜ํ–‰ํ•˜๋Š” ๊ฒƒ์ด๋‹ค

ํ’€๋ง ๊ณ„์ธต

  • ํ’€๋ง์€ ์„ธ๋กœ ๊ฐ€๋กœ ๋ฐฉํ–ฅ์˜ ๊ณต๊ฐ„์„ ์ค„์ด๋Š” ์—ฐ์‚ฐ์ด๋‹ค

  • ์ตœ๋Œ€ ํ’€๋ง์€ ๋Œ€์ƒ ์˜์—ญ์—์„œ ์ตœ๋Œ“๊ฐ’์„ ์ทจํ•˜๋Š” ์—ฐ์‚ฐ์ธ ๋ฐ˜๋ฉด,

  • ํ‰๊ท  ํ’€๋ง์€ ๋Œ€์ƒ ์—ฐ์—ญ์—์„œ ํ‰๊ท ์„ ๊ณ„์‚ฐํ•œ๋‹ค

  • ์ด๋ฏธ์ง€ ์ธ์‹ ๋ถ„์•ผ์—์„œ๋Š” ์ฃผ๋กœ ์ตœ๋Œ€ ํ’€๋ง์„ ์‚ฌ์šฉํ•œ๋‹ค.

ํ’€๋ง ๊ณ„์ธต์˜ ํŠน์ง•

  1. ํ•™์Šตํ•ด์•ผ ํ•  ๋งค๊ฐœ ๋ณ€์ˆ˜๊ฐ€ ์—†๋‹ค

    • ํ’€๋ง์€ ๋Œ€์ƒ ์˜์—ญ์—์„œ ์ตœ๋Œ“๊ฐ’์ด๋‚˜ ํ‰๊ท ์„ ์ทจํ•˜๋Š” ๋ช…ํ™•ํ•œ ์ฒ˜๋ฆฌ์ด๋ฏ€๋กœ ํŠน๋ณ„ํžˆ ํ•™์Šตํ•  ๊ฒƒ์ด ์—†๋‹ค

  2. ์ฑ„๋„ ์ˆ˜๊ฐ€ ๋ณ€ํ•˜์ง€ ์•Š๋Š”๋‹ค

    • ํ’€๋ง ์—ฐ์‚ฐ์€ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์˜ ์ฑ„๋„ ์ˆ˜ ๊ทธ๋Œ€๋กœ ์ถœ๋ ฅ ๋ฐ์ดํ„ฐ๋กœ ๋‚ด๋ณด๋‚ธ๋‹ค, ์ฑ„๋„ ๋งˆ๋‹ค ๋…๋ฆฝ์ ์œผ๋กœ ๊ณ„์‚ฐํ•˜๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค

  3. ์ž…๋ ฅ์˜ ๋ณ€ํ™”์— ์˜ํ–ฅ์„ ์ ๊ฒŒ ๋ฐ›๋Š”๋‹ค (๊ฐ•๊ฑดํ•˜๋‹ค)

    • ์ž…๋ ฅ๋ฐ์ดํ„ฐ๊ฐ€ ์กฐ๊ธˆ ๋ณ€ํ•ด๋„ ํ’€๋ง์˜ ๊ฒฐ๊ณผ๋Š” ์ž˜ ๋ณ€ํ•˜์ง€ ์•Š๋Š”๋‹ค.

PreviousneuralNetworkLearningNextGradient Descent

Last updated 3 years ago

Was this helpful?