[Python]개요, 파이썬 설치
1. 파이썬(Python) 입문
● 파이썬은 1991년 Guido Van Rossem에 의해 개발되었으며 다음의 특징을 지님
- 프로그램의 생산성고 코드의 가독성, 통계처리 기능 강화
- 효율적인 데이터 구조
- 간단하지만 효과적인 객체지향 프로그래밍
- 자유, 오픈소스 소프트웨어
- 고수준 언어
- 이식성
- 확장성
- 실행 전에 컴파일할 필요가 없다.
- 작성한 코드의 결과를 즉시 볼 수 있다.
- 작성한 코드의 줄을 맞추지 않으면 실행이 되지 않는다.
- 어느 운영체제에서도 사용할 수 있다.
- 방대한 라이브러리가 있다.
※ 주요 특징
- 동적 타이핑(dynamic typing).(실행 시간에 자료형을 검사한다.)
- 객체의 멤버에 무제한으로 접근할 수 있다. (속성이나 전용의 메서드 훅을 만들어 제한할 수는 있음.)
- 모듈, 클래스, 객체와 같은 언어의 요소가 내부에서 접근할 수 있고, 리플렉션을 이용한 기술을 쓸 수 있다.
※ 해석 프로그램의 종류
- Cython: C로 작성된 인터프리터.
- 스택리스 파이썬 : C 스택을 사용하지 않는 인터프리터.
- 자이썬 : 자바 가상 머신용 인터프리터. 과거에는 제이파이썬(JPython)이라고 불렸다.
- IronPython: .NET 플랫폼용 인터프리터.
- PyPy: 파이썬으로 작성된 파이썬 인터프리터.
2. Python Programming 개발 환경
- 파이썬은 다양한 환경에서 사용할 수 있다. ▷ 윈도, 유닉스, 리눅스, 매킨토시.
- 설치 프로그램 → Python
2.1. 작업폴더 생성
- D:\python
- D:\python\util => python 관련 프로그램 저장
- D:\python\workspace => 작업 파일 저장
2.2. Python 설치
- 기본 설치
- 아나콘다설치 : 파이썬을 통해 쉽게 데이터 분석을 할 수 있도록 기타 유용한 라이브러리들을 한꺼번에 모아놓은 오픈소스 패키지
(1) anaconda
- Numpy를 비롯한 수많은 라이브러리가 미리 설치된 프로그램.
- 예전에는 딥러닝과 같은 프로그램을 사용하려면 파이썬 모듈을 이것저것 설치해야 쓸 수 있었지만, 요즘은 딥러닝 외에 빅데이터 데이터 시각화 등 다양한 분야에서 필요로 하는 모듈(패키지)들을 아나콘다와 같은 배포 프로그램을 사용하고 있다.
- 아나콘다에는 필요한 모듈(패키지)이 대부분 구성되어 있어서 따로 패키지를 설치할 필요가 없다.
(2) 프로그램 다운받기
- 사이트 : https://anaconda.org
- "Download Anaconda" 버튼 클릭
- 운영체제 선택 : Windows 클릭
- "Python 3.8 version"의 "64-Bit Graphical Installer" 다운로드
- "Anaconda3-2020.07-Windows-x86_64.exe"를 util 폴더로 옮겨 놓는다.
(3) Anaconda 설치
- Anaconda3-2020.07-Windows-x86_64.exe 파일 실행
- 기본값으로 설치를 한다.
(4) Spyder 실행
- "Anaconda Navigator" 메뉴 클릭
- 라이브러리 설치 확인
- "Environments" 메뉴 클릭
- base(root) 가상환경이 만들어진 것을 확인 ☞ 패키지(라이브러리)가 설치된 것을 확인
- "Home" 메뉴 클릭
- 실행하려는 개발도구를 찾아서 "Launch" 버튼 클릭
- ☞ 만일 "Launch"이 없이 "Install" 버튼이 보이면 클릭해서 설치하고 "Launch" 버튼 클릭
- "Spyder"의 "Launch" 버튼 클릭
(5) Spyder만 따로 실행할 수도 있다.
- "windows 10"인 경우에는 시작버튼에서 바로 실행할 수도 있다.
- 시작 ▷ Anaconda3 폴더 클릭 ▷ Spyder 클릭
(6) 데이터 분석에 필요한 필수 라이브러리
① 넘파이(Numpy)
- 넘파이는 Numerical Python의 약자로 대표적인 파이썬 기반 수치 해석 라이브러리로 알려져 있다. 특히 선형대수 연산에 필요한 다차원 배열과 배열 연산을 수행하는 다양한 함수를 제공한다.
② 맷플롯립(Matplotlib)
- 맷플롯립은 그래프나 차트 등 그래픽으로 표현하는 데 사용하는 파이썬 기반 2D 시각화 도구이다.
판다스와 연계하여 데이터를 다양한 방식으로 시각화하는 기능을 제공한다.
③ 판다스(Pandas)
- 판다스는 2008년 금융데이터 분석용으로 처음 개발되었다. 이후 오픈소스 커뮤니티를 통해 발전하고 있으며 통계와 데이터과학, 머신러닝 분야에서 가장 중요한 소프트웨어로 성장하였다.
④ 사이파이(SciPy)
- 사이파이는 과학용 연산에 필요한 다양한 패키지를 모아놓은 라이브러리이다.
- 미적분, 선형대수, 행렬 연산, 방정식 계산 등에 필요한 함수를 지원한다.
⑤ 사이킷런(scikit-learn)
- 머신러닝 학습을 위한 파이썬 라이브러리이다.
- 회귀분석, 분류, 군집 등 실무에서 적용하는 대부분의 머신러닝 모형을 제공한다.