티스토리 뷰

AI/Machine Learning

[Scikit-learn] 설치하기

Arc Lab. 2016. 11. 17. 20:11

[업데이트 2016.11.17 23:22]  

 

2015년부터 Machine Learning의 한 분야인 Deep Learning이 주목을 받으면서, 다양한 Deep Learning Open Source Project들이 발표되고 있습니다. 프로그래밍 언어별로 다양한 Deep Learning 라이브러리가 존재합니다.

 

 

** 발췌: http://aikorea.org/blog/dl-libraries/

 

그 중에서 최근에 세미나를 통해 알게 된 Python기반의 Scikit-learn 및 Google의 TensorFlow에 대해 공부를 해보려고 합니다. 먼저 Scikit-learn을 설치하여 Deep Learning의 기본적인 개념인 인공 신경망 이론을 토대로 공부하려고 합니다. 최종 목표는 빅데이터 분석, 게임 인공지능 등에 적용해보는 것입니다.

 

Scikit-learn의 홈페이지 주소는 아래와 같습니다.

http://scikit-learn.org/

Scikit-learn 설치를 위해 아래의 주소로 이동해보면, 설치 전에 기본적으로 선행되어 설치 되어야 할 라이브러리 항목을 보실 수 있습니다. Python 기반이기 때문에, Python이 설치가 되어야 하며, NumPy, SciPy라는 Python 모듈도 추가로 설치 되어야 합니다.

 

** NumPy: 배열, 행렬 등 수치 계산을 위한 Python 모듈

** SciPy: 과학 계산용 Python 모듈

 

http://scikit-learn.org/stable/install.html

Scikit-learn requires:

  • Python (>= 2.6 or >= 3.3)
  • NumPy (>= 1.6.1)
  • SciPy (>= 0.9)

Deep Learning에 필요한 모듈들이 많은데, 이것을 한 번에 설치해주는 Third-party Distributions이 있습니다. Anaconda, Canopy 등이 있습니다.(아래 링크 참고)

 

http://scikit-learn.org/stable/install.html#canopy-and-anaconda-for-all-supported-platforms

 

저는 Anaconda를 이용하여 Windows에 설치를 하려고 합니다. 링크는 아래와 같습니다.

(2016.11.17 기준 Anaconda 4.2.0, Python 3.5 Version 설치)

 

https://www.continuum.io/downloads

 

여기서 Windows 운영체제에 맞게 다운로드를 합니다. Anaconda가 설치가 완료된 후, Command Prompt창을 실행하여, python이라 타이핑후, Python이 Command Prompt에서 실행되는지 확인합니다. Anaconda 4.2.0기준, 설치시 환경변수에 Python 실행 경로를 자동으로 추가해주는 것 같습니다. Command Prompt창에서 바로 Python이 동작됨을 확인했습니다.

 

 

Anaconda의 경우 필요한 것들은 모두 자동으로 설치합니다. 따라서 설치가 완료된 후, IPython이란 대화형 인터페이스도 바로 사용이 가능합니다. 아래와 같이 Windows Start > All Programs에서 IPython을 실행합니다. 과거에 설치하는 방법들을 찾아보면 모든 라이브러리를 별도로 설치를 했어야 하는데, 지금은 많이 편해진 것 같습니다. 아래의 그림은 IPython 실행 결과입니다.

 

 

이제 아래와 같이 입력 후 Scikit-learn이 동작하는지 확인합니다. 여기서 %의 의미는 IPython에서 제공하는 magic function으로 기본적으로 자주 사용하는 라이브러리에 대해 자동으로 import해줍니다. %pylab을 통해 Numpy, Matplotlib를 자동으로 import 합니다.

 

Scikit-learn에는 기본적으로 내장 데이터가 있는데, 당뇨병 데이터를 가지고 실행해보도록 하겠습니다. 

(2,3번 라인)

%pylab
from sklearn import datasets
diabetes = datasets.load_diabetes()
print(diabetes.data.shape, diabetes.target.shape)

 

실행 결과 아래와 같이 442개 행, 10개 열을 가진 데이터 및 442개 행로 구성된 타켓(병의 악화도)의 데이터를 확인할 수 있습니다.

(442, 10) (442, )

 

이로써 Scikit-learn 사용을 위한 준비가 완료되었습니다.

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
글 보관함