티스토리 뷰
[업데이트 2016.11.17 23:22]
2015년부터 Machine Learning의 한 분야인 Deep Learning이 주목을 받으면서, 다양한 Deep Learning Open Source Project들이 발표되고 있습니다. 프로그래밍 언어별로 다양한 Deep Learning 라이브러리가 존재합니다.
** 발췌: http://aikorea.org/blog/dl-libraries/
그 중에서 최근에 세미나를 통해 알게 된 Python기반의 Scikit-learn 및 Google의 TensorFlow에 대해 공부를 해보려고 합니다. 먼저 Scikit-learn을 설치하여 Deep Learning의 기본적인 개념인 인공 신경망 이론을 토대로 공부하려고 합니다. 최종 목표는 빅데이터 분석, 게임 인공지능 등에 적용해보는 것입니다.
Scikit-learn의 홈페이지 주소는 아래와 같습니다.
Scikit-learn 설치를 위해 아래의 주소로 이동해보면, 설치 전에 기본적으로 선행되어 설치 되어야 할 라이브러리 항목을 보실 수 있습니다. Python 기반이기 때문에, Python이 설치가 되어야 하며, NumPy, SciPy라는 Python 모듈도 추가로 설치 되어야 합니다.
** NumPy: 배열, 행렬 등 수치 계산을 위한 Python 모듈
** SciPy: 과학 계산용 Python 모듈
http://scikit-learn.org/stable/install.html
Scikit-learn requires:
- Python (>= 2.6 or >= 3.3)
- NumPy (>= 1.6.1)
- SciPy (>= 0.9)
Deep Learning에 필요한 모듈들이 많은데, 이것을 한 번에 설치해주는 Third-party Distributions이 있습니다. Anaconda, Canopy 등이 있습니다.(아래 링크 참고)
http://scikit-learn.org/stable/install.html#canopy-and-anaconda-for-all-supported-platforms
저는 Anaconda를 이용하여 Windows에 설치를 하려고 합니다. 링크는 아래와 같습니다.
(2016.11.17 기준 Anaconda 4.2.0, Python 3.5 Version 설치)
https://www.continuum.io/downloads
여기서 Windows 운영체제에 맞게 다운로드를 합니다. Anaconda가 설치가 완료된 후, Command Prompt창을 실행하여, python이라 타이핑후, Python이 Command Prompt에서 실행되는지 확인합니다. Anaconda 4.2.0기준, 설치시 환경변수에 Python 실행 경로를 자동으로 추가해주는 것 같습니다. Command Prompt창에서 바로 Python이 동작됨을 확인했습니다.
Anaconda의 경우 필요한 것들은 모두 자동으로 설치합니다. 따라서 설치가 완료된 후, IPython이란 대화형 인터페이스도 바로 사용이 가능합니다. 아래와 같이 Windows Start > All Programs에서 IPython을 실행합니다. 과거에 설치하는 방법들을 찾아보면 모든 라이브러리를 별도로 설치를 했어야 하는데, 지금은 많이 편해진 것 같습니다. 아래의 그림은 IPython 실행 결과입니다.
이제 아래와 같이 입력 후 Scikit-learn이 동작하는지 확인합니다. 여기서 %의 의미는 IPython에서 제공하는 magic function으로 기본적으로 자주 사용하는 라이브러리에 대해 자동으로 import해줍니다. %pylab을 통해 Numpy, Matplotlib를 자동으로 import 합니다.
Scikit-learn에는 기본적으로 내장 데이터가 있는데, 당뇨병 데이터를 가지고 실행해보도록 하겠습니다.
(2,3번 라인)
%pylab from sklearn import datasets diabetes = datasets.load_diabetes() print(diabetes.data.shape, diabetes.target.shape)
실행 결과 아래와 같이 442개 행, 10개 열을 가진 데이터 및 442개 행로 구성된 타켓(병의 악화도)의 데이터를 확인할 수 있습니다.
(442, 10) (442, )
이로써 Scikit-learn 사용을 위한 준비가 완료되었습니다.
- Total
- Today
- Yesterday
- sentence test
- Sea Bottom
- belief
- Physical Simulation
- ILoop Engine
- Badge
- 2D Game
- #TensorFlow
- Worry
- aws #cloudfront
- English
- #ApacheZeppelin
- GOD
- #REST API
- SSM
- Memorize
- project
- OST
- #ELK Stack
- Jekyll and Hyde
- Library
- ate
- docker
- Ragdoll
- 도커
- #ApacheSpark
- Mask R-CNN
- Game Engine
- some time ago
- Meow
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |