티스토리 뷰

반응형

실제로 딥러닝이 사용되고 있는 사례에 대해서 알아보도록 하겠습니다.

여러가지의 활용 예시가 있는데, 3가지정도를 골라보았습니다.


1. 흑백 사진/영상 색 복원 기술

이 기술은 처음 보았을때 정말 대박이라고밖에 생각이 들지 않았습니다. 아주아주 오래전 찍었던 흑백 필름 사진을 그당시 존재하지도 않았던 컬러 사진으로 바꾸어주는 혁신적인 기술입니다. 보기 드문 충분한 감동을 줄 수 있는 기술이라고 생각합니다. 실제로 이 기술로 돌아가신 부모님 / 조부모님의 유일한 사진을 흑백으로나마 간직하고 계셨던 분들이 이 기술을 이용해 이제는 가물가물한 살아생전 모습을 더 생생하게 볼 수 있었다는 감동적인 후기도 들려오고 있습니다. 


       

관련 article 사이트

https://dl.acm.org/citation.cfm?id=2925974

이 기술은 딥러닝중에서도 CNN (Convolutional Nural Networks)를 기반으로 구성되어 있으며, 다양한 레이어들을 end-to-end 방식으로 결합하여 모든 해상도의 이미지를 대상으로 학습을 진행하였다고 합니다.


2. 실시간 행동 분석 

이 기술은 말 그대로 사진/동영상 속의 사람들이 무슨 행동을 하고있는지를 파악 할 수 있는 기술입니다. 다중모드 센서를 통하여 각 행동별 데이터를 수집하여 정적인 행동에 대하여 정의하고, 자세별로 학습시키고, 주로 지능형 CCTV에 사용되고 있는 기술이며, 주로 RNN(Recurrent Neural Network)의 변형 알고리즘인 LSTM(Long Short Term Memory Networks)를 이용하여 학습하는 편이라고 합니다.

관련 국내 논문

http://www.riss.kr/link?id=T14407203


3. TTS (Text to Speech)

이 기술은, 글자를 읽어주는 기술이다. 설명만 보자면 간단해 보이지만, 실제로 화자가 없는데도 말하지 않은것을 말한것처럼 말해내어 듣는이로 하여금 소름을 돋게 하는 무시무시한 기술입니다. 인터넷 스트리밍 방송을 보다보면, 간혹 TTS 기술을 이용해 스트리머와 소통하는 시청자들을 볼 수 있습니다. 주로 레이어 기반의 CNN(Convolutional Nural Networks)을 이용해 학습하는 경우가 많다고 합니다. 대표적으로 구글의 WaveNet이 있습니다.

Google TTS WaveNet 논문

https://arxiv.org/abs/1609.03499

Google TTS WaveNet Github

https://github.com/vincentherrmann/pytorch-wavenet


이밖에도 딥러닝은 활용도가 매우 방대하며, 다양한 곳에서 다양한 방식으로 사용되고 있습니다. 그만큼 공부하기 힘든 영역이지만, 확장성을 보았을때 가장 매력있는 기술이지 않나 생각됩니다.  최근에는 CNN, RNN 말고도 Faster R-CNN 등의 다양한 학습 알고리즘이 나오고 있다고 합니다.


반응형
댓글
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/07   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
아카이브