데이터분석을 위한 작업환경 - Anaconda, Miniconda, pip 등
가상환경:
독립적인 작업환경에서 패키지, 버전관리 하기 위한 환경
라이브러리 간의 의존성, 호환문제를 해결
여러 프로젝트가 충돌을 일으키지 않고 하나의 컴퓨터에서 돌아가게 해줌. window os컴퓨터에서 리눅스 가상환경을 설치해 리눅스를 돌리는 것도 가능함
작업환경들을 폴더처럼 프로젝트 별 관리,공유하게끔 도와주는 것
아나콘다:
아나콘다는 과학 연구 및 머신러닝 분야에 적합한 Python 및 R 언어의 패키지 / 의존성 관리 및 배포를 편리하게 해주는 조건부 무료 오픈 소스 SW 이름이다.
$conda create -n 가상환경 이름 python=3.8(버전)
그 이후 anaconda3/envs/가상환경이름으로 폴더 생성 됨
$conda active 가상환경이름으로 활성화
$conda deactive 가상환경이름으로 비활성화
가상환경 라이브러리 설치
$conda install -n 가상환경이름 라이브러리
$conda list
가상환경 리스트 확인 및 조회
#conda info --envs
$conda remove -n 가상환경이름 -all
출처: https://yganalyst.github.io/pythonic/anaconda_env_1/
[Anaconda] 아나콘다 가상환경의 개념 및 활용방법
가상환경이 도대체 뭘까? 그리고 어떻게 쓰는 걸까?
yganalyst.github.io
conda info
conda update conda
conda install - 근데 나는 pip install 위주로 쓸거임
conda env list - 현재 가상환경 리스트
conda env export> environment.yml - 현재 가상환경의 setting이 그대로 저장됨
conda create --clone bonel --name bonel2 : 파일로 안만들고 프롬프트창에서 곧바로 클론으로 이름만 다르게 같은설정 가상환경 복사
미니콘다:
기존 아나콘다는 오픈소스 프리웨어였으나 최근 기업에게는 상용화되면서 오픈소스 프리웨어인 미니콘다로 작업환경을 옮기는 기업이 증가함
미니콘다는 구동에 필요한 최소한의 기능(conda,파이썬,최소한의 패키지)만 제공되므로 파일이 작고 가볍다. 필요한 패키지를 일일히 찾아서 설치해주어야 한다는 단점이 있다.
아나콘다/미니콘다 anaconda prompt실행시키면 (base)떠있는게 가상환경이라는 뜻
(base)떠있으면 base 가상환경이라는 뜻인데, 타 가상환경을 activate해줘야 (다른가상환경) 으로 바뀜
항상 가상환경 한군데 만드는 습관 들이기.
c:\ apps\miniconda3\envs 난 여기. 사람마다 설정하기에 따라 경로는 다름
주피터:
아나콘다 or 미니콘다랑 같이 설치해서 많이 씀
파이썬의 즉시 입력/실행이 가능한 웹코딩 라이브러리. 구글에서 제공하는 google colaborator도 주피터 기반으로 함
cmd에서
pip install jupyter
설치 끝난후 콘솔에서 출력된 토큰을 jupyter 웹페이지에서 입력
new> python3> 코드 입력 및 실행
pip
파이썬 패키지 매니지먼트
python에 속해있는 패키지임
근데 만약 안나올경우 conda install pip
pip --version : python내에서 버전관리
pip install (라이브러리 name) : 해당라이브러리 설치
pip show (라이브러리name): 해당 라이브러리 정보 보여줌
pip freeze > requriement.txt 가상환경 활성화시킨 후 패키지 목록과 정보들을 requriement 파일로 저장
이 목록들 안에 있는 패키지/라이브러리들을 한번에 설치도 가능함
$pip install -r requirements.txt 하면 한번에 설치
주피터
pip install notebook
미니콘다는 뭐 하나하나 필요한거 다 설치해줘야해!
머신러닝/데이터 분석을 위한 기본 패키지 설치
1.2 머신러닝용 파이썬 패키지 — 데이터 사이언스 스쿨
.ipynb .pdf to have style consistency -->
datascienceschool.net