티스토리 뷰
구글에서 배우는 딥러닝(Learning from Google Deep Learning) by 닛케이 빅 데이터
Arc Lab. 2017. 11. 7. 00:07[업데이트 2017.11.08 00:29]
구글에서 배우는 딥러닝 Learning from Google Deep Learning
저자 - 닛케이 빅데이터
[주요 내용 요약]
- '닛케이 빅데이터'는 기업 사이에서 주목 받는 빅데이터, 인공지능, IoT를 활용한 신사업의 창출 및 업무 개혁을 중점적으로 취재하는 전문지.
- 제3차 인공지능 붐을 대중에게 알리게된 계기 '알파고', '인공지능이 바둑으로 인간을 이기려면 10년은 필요하다'는 평을 깨는 계기가 됨.
* 추가 조사한 내용
제1차 인공지능 붐 : 1950년대 후반 1960년대, 컴퓨터로 추론, 탐색하여 특정 문제를 푸는 연구단계(간단한 문제만 풀림)
제2차 인공지능 붐 : 1980년대, 컴퓨터에 지식을 넣으면 똑똑해 진다는 접근법(지식을 서술,관리하는 것은 방대 하다는 것이 한계임)
제3차 인공지능 붐 : 2010년대, 빅데이터를 활용한 머신러닝 + 딥러닝
- 구글의 AI 퍼스트 선언, '우리는 모바일 퍼스트 세계에서 AI 퍼스트 세계로 이행 할 것' from 순다 피차이(Sundar Pichai) Google CEO, 2016.04
- 주요 비즈니스 적용 사례
1) 우버 : 이동하고 싶은 사람(수요)과 이동 수단을 제공 할 수 있는 사람(공금)을 통해 최적의 매칭을 실현.
2) 에어비앤비 : 숙박 장소를 찾는 사람(손님)과 빈방을 빌려 주고 싶은 사람(호스트)의 수요/공급을 매칭. 수백가지 데이터를 바탕으로 인공지능을 통해 매출이 최대치가 되는 숙박 요금을 추측하여 빈방을 제공하는 호스트에게 매일매일 제안. (부동산이 위치한 도시의 숙박 수요의 동향, 교통 편의성, 지역 정보, 손님 리뷰 등을 활용)
3) GE : 비행기의 엔진, 발전기의 데이터를 수집하고, 인공지능을 통해 이상 감지, 고장 예측, 운행의 최적화를 통해 에너지 비용 절감.(산업 인터넷)
4) 패스트 리테일링(유니클로의 모회사) : 다양한 상점에서 수집한 고객 데이터, 제품 데이터를 활용하여 고객 1명에게 모든 접점에서 일관된 경험을 제공하는 옴니채널 전략 활용. 고객이 매장에서 신체 치수를 재면 인터넷 쇼핑몰에서 맞춤 셔츠와 자켓을 주문 할 수 있음.
5) 정보 제조 소매업 : 구매 동향 등을 예측하여 수요 예측 판매 계획 작성(커스터머 센트릭, 고객 중심주의)
6) 의료분야 : 치료 기록, 건강 진단 기록 등을 통해 건강 지도, 질병 치료를 통해 의료비 절감.
7) 핀 테크 : 빅데이터 기반, 투자 자산 배분, 대출, 보험 가입 심사 실현.
8) 에듀 테크 : 교육 분야에서 성적이 우수한 학생의 데이터를 기반으로 다른 학생들을 지도.
9) HR 테크 : 우수한 직원 채용 과정 데이터를 통해 좋은 인재 채용으로 연결.
- 중소기업에도 인공지능 혜택이 주어진다.(Google Vision API 등)
- 인공지능 > 머신러닝 > 딥러닝
1) 인공지능 : 컴퓨터를 통해 지적인 정보를 처리하는 것.
2) 머신러닝 : 인간이 기존처럼 '어떤 조건일 때 어떠한 답이 도출된다'로 프로그래밍 하는 것이 아닌 기계가 방대한 데이터를 바탕으로 학습 모델을 만들어 가는 것. 예를 들면 부모가 아이에게 특정 상황들(방대한 데이터)에 대해 반복적인 학습을 시킴으로써 지식을 습득하는 것으로 비유 할 수 있습니다.
3) 딥러닝 : 딥러닝은 머신러닝을 수행시 여러 단계를 걸쳐 계층적인 처리를 시도하여 복잡한 판단을 할 수 있도록 하는 기술이며 심층학습, 즉 딥러닝이라 부른다. 인간 뇌의 뉴런/시냅스를 모방한 인공 신경망 모델을 사용하여 표현한다.
- 머신러닝과 딥러닝의 개념은 오래전부터 있었으나 이제 와서 주목 받고 있는 것은 3가지가 갖추어졌기 때문이다.
1) 빅데이터
2) 컴퓨터 성능의 향상
3) 고급 알고리즘
- 분류하는 방법을 컴퓨터가 스스로 배워나간다.
입력 데이터(음성,이미지,텍스트 등) -> 컴퓨터(머신러닝,딥러닝) -> 출력 데이터(이미지 분류, 음성인식 텍스트 등)
입력 데이터와 출력 데이터의 관계로부터 '모델'을 만들어냅니다. 어린 시절 무언가를 넣으면 그것이 바뀌어 나오는 상자(블랙박스)와 닮았음. 단지 대량의 입/출력 데이터가 주어지고, 그 블랙박스가 어떻게 변환될 지 기계 스스로 판단한다는 점이다.
-지도학습, 비지도학습(강화학습)
지도학습은 정답/오답이 주어지고 컴퓨터가 점점 정답이 출력될 수 있는 확률을 높이기 위해 내부의 변수를 조정해나가는 과정을 말하며, 비지도학습은 정답/오답이 주어지지 않은 경우로 보통 어떤 데이터의 군집을 분류하는 것으로 유전자 패턴 분류, 뉴스 분류를 예로 들수 있다. 강화학습도 비지도학습의 일종인데 바둑처럼 지금 상태에서 다음 상태로 바뀔 때 무엇이 정답인지 알 수 없는 경우에 게임의 승패를 높이기 위해 보상을 얻을 수 있는 경우에 상을 주는 방식으로 학습을 시키는 것을 말한다.
지도학습 : 어린아이가 부모에게 질문하면서 동물 이름을 배워가는 것.
비지도학습(강화학습) : 축구 시합에서 이기려면 슈팅, 패스를 반복 하는 시합을 되풀이하면서 승리의 공식을 배워나가는 것.
- 강화학습이 적용된 알파고. 알파고는 두 종류의 뉴럴 네트워크로 구성된다. 하나는 다음 수를 결정하는 '정책망', 다른 하나는 승률을 계산하여 승자를 예측하는 '가치망'이다. 바둑의 달인들이 남긴 3,000만 개 이상의 기보를 사용하여 학습함. "알파고는 가상 대국을 스스로 반복하여, 승리라는 목표를 향해 조정을 거듭했습니다."
- 데이타x목적에 따른 딥러닝의 활용목적
[데이터]
1) 이미지
2) 텍스트
3) 음성
4) 센서
[목적]
1) 비용 절감
2) 부가가치를 높여 새로운 비즈니스 기회를 창출할 것
3) 크리에이티브성을 높일 것
- 이미지, 텍스트 데이터는 이미 연구된 성과물이 많다
최근 주목을 받고 있는 챗봇의 경우 이미 기업에 텍스트 데이터를 많이 보유하고 있기 때문임. LINE에서 제공하는 린나(Rinna)라는 인공지능은 여고생을 모티브로 한 경우인데, 일반 챗봇이 고객의 궁금증에 대해 빠르게 해결하는 것이 목표라면 린나는 대화를 오래 지속적으로 하는 것을 목표로 하는 점이 독특한 점이다.
아래의 두가지에 해당하는데, 그러나 얼마나 투자할지 어떻게 투자비용을 회수할 지에 대한 청사진이 없는 기업이 대부분이다. 그래서 자체 연구개발이 가능한 경우를 제외하고는 결국 프로젝트로 실현되기 어려운 현실임.
2) 부가가치를 높여 새로운 비즈니스 기회를 창출할 것
3) 크리에이티브성을 높일 것
- 우선 비용절감을 목표로 하는것이 현실적이다
사람의 노동력은 '품질이 일정하지 않다', '장시간 근무가 불가능하다'는 점을 고려해야 한다. 인공지능은 24시간 일정한 품질로 일 할 수 있다.
- 딥러닝, 머신러닝이 적용된 시스템 개발은 기존의 시스템 개발과 다르다
스펙이 결정되면 그 범위를 벗어나지 못하는 기존 시스템에 반해 딥러닝, 머신러닝 시스템은 전용(예정되어 있는 곳에 사용하지 않고 다른 데로 돌려서 씀)이 가능하다는 점이 묘미이다. 구글에서 제공하는 텐서플로 라이브러리에는 범용 이미지 인식 모델인 Inception-v3가 있는데, 피사체를 1000종류 분류 할 수 있습니다. 이 모델에 특정 분야의 훈련 데이터를 추가로 학습시키면 그 분야에 대해 더 자세히 식별 할 수 있게 되는데, 이 기술을 전이학습이라고 부릅니다.
- 딥러닝 도입을 위해 따져봐야할 세 가지 측면
1) 비즈니스 현장에 딥러닝을 적용할 수 있는가?
2) 학습시킬 데이터를 보유하고 있는가?
3) 보유한 데이터가 딥러닝에서 활용할 수 있는 부류인가?
- 필요한 인재상?
1) 비즈니스를 앞장서서 이끄는 사람
2) 딥러닝 기술자, 데이터 과학자
3) 모델이 내장된 시스템을 만드는 엔지니어
4) 비즈니스와 엔지니어, 데이터 과학자의 사이의 가교 역할을 하는 사람
- 현재 특정 분야의 이미지 인식에서는 사람보다 높은 정밀도를 얻을 수 있지만, 이미지를 종합적으로 이해하거나, 나누어 이해하는 경우, 액션과 이벤트를 이해하는 부분에 있어서는 아직 과제로 남아 있다.
- Total
- Today
- Yesterday
- some time ago
- 2D Game
- GOD
- aws #cloudfront
- Library
- docker
- ILoop Engine
- 도커
- SSM
- sentence test
- #ApacheSpark
- project
- Sea Bottom
- English
- ate
- #REST API
- Badge
- Ragdoll
- Mask R-CNN
- Jekyll and Hyde
- Physical Simulation
- #ELK Stack
- #TensorFlow
- Meow
- Memorize
- Worry
- #ApacheZeppelin
- Game Engine
- belief
- OST
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |