딥 러닝이란 무엇입니까?
딥 러닝이란 것은 머신러닝(ML)의 하위 집합입니다. 인간의 두뇌처럼 작동하도록 모델링된 알고리즘 인공 신경망에 대량의 데이터를 학습시켜주는 것을 말합니다.
컴퓨터에게 꽃을 보여주면서 꽃이라고 가르쳐 줍니다. 수천, 수만 종의 꽃을 보여주어도 컴퓨터는 잊어버리지 않고 그것들을 전부 저장고에 입력해놓습니다. 이렇게 컴퓨터에게 학습시키는 기술을 딥러닝이라고 합니다. 컴퓨터에게 정지 신호를 인식시키고, 보행자와 가로등을 구별할 수 있도록 알려준다면 어떻게 되겠습니까? 사람은 자기 의지가 발동해서 노란불일 때도 정지 신호를 어기고 가버릴 수 있지만 컴퓨터는 입력해놓은 대로 정지 신호를 지킬 것입니다. 딥러닝은 1980년대에 이론으로 정립되었지만 최근에 와서 비약적인 발전을 이루었습니다. 그 이유는 방대한 양의 레이블 지정 데이터가 필요하기 때문입니다. 자율주행 자동차를 만들려면 수백만 장, 혹은 수천만 장의 사진 데이터를 입력시켜야 하기 때문입니다. 이를 위해서는 고성능 컴퓨터가 필수인데요, 고성능 GPU는 딥러닝에 효과적인 병렬 아키텍쳐를 갖고 있습니다. 이를 클러스터 또는 클라우드 컴퓨팅과 함께 사용할 경우 몇 주씩 걸리던 딥러닝 네트워크의 학습 시간을 몇 시간 이내로 단축할 수 있게 된 것입니다.
자율 주행: 자동차 연구소에서는 정지 신호, 신호등과 같은 물체를 자동으로 탐지하는 데 딥러닝을 사용하고 있습니다. 또한 딥러닝은 보행자를 탐지하는 데도 사용되어 사고를 줄이는 데 기여하고 있습니다.
항공 우주 및 국방: 딥러닝은 위성에서 객체를 식별하여 관심 영역을 찾고 병력을 파견하기에 안전하거나 안전하지 않은 지역을 확인하는 데 사용됩니다.
의학 연구: 암 연구진은 암 세포를 자동으로 탐지하는 데 딥러닝을 사용하고 있습니다. UCLA 연구 팀은 딥러닝 애플리케이션에 암 세포를 정확히 식별하는 법을 학습하는 데 사용될 고차원 데이터 세트를 생성하는 첨단 현미경을 개발했습니다.
산업 자동화: 사람이나 물체가 기계와 안전 거리를 유지하지 않을 때 딥러닝이 이를 자동으로 탐지하여 중장비를 다루는 작업자를 더 안전하게 보호할 수 있습니다.
전자: 자동 청취 및 음성 번역에 딥러닝이 사용되고 있습니다. 예를 들어 사용자의 음성에 응답하고 사용자의 기호를 파악하는 가전 기기는 딥러닝 애플리케이션을 기반으로 합니다.
머신러닝과 딥러닝의 차이점은 무엇일까요?
딥러닝은 머신러닝의 하위 집합이라는 이야기는 위에서 했습니다.
그렇다면 머신러닝은 무엇인지를 알아보도록 하겠습니다.
머신러닝(ML)이라는 것은 사람이 개입하지 않아도 시간이 지나면서 정확성을 높이기 위해 데이터에서 학습할 수 있는 애플리케이션을 구축하는 데 중점을 둔 AI의 하위 집합입니다. 머신러닝 알고리즘을 학습을 통해 더 나은 의사 결정을 내리고 예측하기 위한 패턴을 찾을 수 있지만, 일반적으로 사람이 개입해야 합니다.
머신러닝은 AI의 하위집합이라고 하니까 이번에는 AI가 무엇인지 알아보겠습니다.
AI(인공지능)
인공 지능을 사용하면 컴퓨터, 머신 또는 로봇이 의사 결정, 개체 인식, 문제 해결, 언어 이해 등 인간의 능력을 모방할 수 있습니다.
딥러닝은 어떻게 작동할까요?
딥 러닝은 인간의 두뇌 작동 방식을 기반으로 느슨하게 모델링한 알고리즘인 신경망 계층으로 지원됩니다. 대량의 데이터를 통한 학습은 신경망에서 신경을 구성하는 것입니다. 그 결과 학습이 완료되면 새 데이터를 처리하는 딥 러닝 모델이 됩니다. 딥 러닝 모델은 여러 데이터 소스에서 정보를 가져와 사람이 개입할 필요 없이 해당 데이터를 실시간으로 분석합니다. 딥 러닝에서 그래픽 처리 장치(GPU)는 여러 계산을 동시에 처리할 수 있으므로 학습 모델에 최적화되어 있습니다.
딥 러닝을 적용해서 가장 활발하게 사용되는 사례를 알아볼까요?
소셜 미디어
유튜브에는 요즘 챗Gpt를 활용해서 5분 만에 글쓰기를 하자, 챗Gpt로는 글을 쓰고 그림은 미드저니에게 그리게 해 5분 만에 그림 동화를 한 편 쓰자, 이런 자극적인 제목의 글들이 수십, 수백 개 올라온 것을 보실 수 있을 것입니다. 저도 해 보았습니다. 챗GPT에게 명령을 내리고 그 답을 가지고 블로그에 글을 쓰려고 해보았죠. 저는 불가능했습니다만, 챗GPT가 조금 더 학습하고 나면 훌륭한 글을 써줄지도 모른다는 생각이 들었습니다.
재무
딥 러닝의 신경망은 주식 가치를 예측하고 거래 전략을 개발하는 데 사용될 수 있으며 보안 위협을 감지하고 사기로부터 보호할 수도 있습니다. 이 분야에서 딥 러닝은 절대적일 것 같습니다. 방대한 분량의 데이터를 가지고 분석한다면 주식거래는 물론이고 보안에 이르기까지 이미 그 활약은 비약적이라고 합니다.
의료 산업
딥 러닝은 환자의 행동과 생활 습관으로 환자의 질병을 예측하고 있습니다. 딥러닝은 보건의료 분야에서 중추적인 역할을 수행할 수 있습니다. 보건의료 종사자는 딥 러닝 알고리즘을 활용해 환자에 대한 최적의 검사 및 치료를 결정할 수 있습니다.
사이버 보안
딥 러닝은 알려진 위협 데이터베이스에 대응하는 대신 의심스러운 새 활동을 인식하여 기존 맬웨어 솔루션보다 고급 위협을 더 효과적으로 감지할 수 있습니다.
디지털 어시스턴트
디지털 도우미는 딥 러닝의 가장 일반적인 몇 가지 예를 나타냅니다. 자연어 처리(NLP) 기능 덕분에 Siri, Cortana, Google, Alexa는 질문에 응답하고 사용자 습관에 적응할 수 있습니다.
딥 러닝 적용을 방해하는 장애물
딥 러닝의 새로운 용도를 알아내고 있지만, 여전히 다음과 같은 특정 제약과 함께 발전하고 있습니다.
대량의 데이터
보다 통찰력 있고 추상적인 답변을 얻기 위해서는 딥 러닝이 학습해야 할 대량이 데이터가 필요합니다. 인간의 두뇌와 마찬가지로 딥 러닝 알고리즘은 실수로부터 학습하고 결과를 개선할 수 있는 예시가 필요합니다.
유연성 부족
머신은 여전히 매우 편협한 방식으로 학습하므로 실수를 초래할 수 있습니다. 딥 러닝 네트워크는 특정 문제를 해결하려면 데이터가 필요합니다. 해당 범위를 벗어난 작업을 수행하도록 요청하면 실패할 가능성이 큽니다.
투명성 부족
패턴을 찾기 위해 수백만 개의 데이터 포인트를 샅샅이 살펴보지만, 신경망이 솔루션에 어떻게 도달하는지 이해하기 어려울 수 있습니다. 데이터 처리 방식에 대한 투명성이 부족하므로 원치 않는 편향을 식별하고 예측을 설명하기가 어렵습니다.
이러한 난관에도 불구하고 데이터 과학자들은 감독 없이 학습할 수 있는 매우 정확한 딥 러닝 모델을 구축하는 일에 점점 더 가까워지고 있으며, 이 모델을 통해 딥 러닝이 더 빨라지고 노동 집약적 작업이 줄어들 것입니다.