All Projects → rickiepark → introduction_to_ml_with_python

rickiepark / introduction_to_ml_with_python

Licence: other
도서 "[개정판] 파이썬 라이브러리를 활용한 머신 러닝"의 주피터 노트북과 코드입니다.

Projects that are alternatives of or similar to introduction to ml with python

Data Science Ipython Notebooks
Data science Python notebooks: Deep learning (TensorFlow, Theano, Caffe, Keras), scikit-learn, Kaggle, big data (Spark, Hadoop MapReduce, HDFS), matplotlib, pandas, NumPy, SciPy, Python essentials, AWS, and various command lines.
Stars: ✭ 22,048 (+10349.29%)
Mutual labels:  numpy, scikit-learn, pandas, scipy, matplotlib
Mlcourse.ai
Open Machine Learning Course
Stars: ✭ 7,963 (+3673.93%)
Mutual labels:  numpy, scikit-learn, pandas, scipy, matplotlib
Machine Learning With Python
Practice and tutorial-style notebooks covering wide variety of machine learning techniques
Stars: ✭ 2,197 (+941.23%)
Mutual labels:  numpy, scikit-learn, pandas, matplotlib
Machine Learning Alpine
Alpine Container for Machine Learning
Stars: ✭ 30 (-85.78%)
Mutual labels:  numpy, scikit-learn, pandas, matplotlib
Docker Alpine Python Machinelearning
Small Docker image with Python Machine Learning tools (~180MB) https://hub.docker.com/r/frolvlad/alpine-python-machinelearning/
Stars: ✭ 76 (-63.98%)
Mutual labels:  numpy, scikit-learn, pandas, scipy
Stats Maths With Python
General statistics, mathematical programming, and numerical/scientific computing scripts and notebooks in Python
Stars: ✭ 381 (+80.57%)
Mutual labels:  numpy, pandas, scipy, matplotlib
Pythondatasciencehandbook
The book was written and tested with Python 3.5, though other Python versions (including Python 2.7) should work in nearly all cases.
Stars: ✭ 31,995 (+15063.51%)
Mutual labels:  numpy, scikit-learn, pandas, matplotlib
Dask
Parallel computing with task scheduling
Stars: ✭ 9,309 (+4311.85%)
Mutual labels:  numpy, scikit-learn, pandas, scipy
Studybook
Study E-Book(ComputerVision DeepLearning MachineLearning Math NLP Python ReinforcementLearning)
Stars: ✭ 1,457 (+590.52%)
Mutual labels:  numpy, scikit-learn, pandas, scipy
Ml Cheatsheet
A constantly updated python machine learning cheatsheet
Stars: ✭ 136 (-35.55%)
Mutual labels:  numpy, pandas, scipy, matplotlib
Data Analysis
主要是爬虫与数据分析项目总结,外加建模与机器学习,模型的评估。
Stars: ✭ 142 (-32.7%)
Mutual labels:  numpy, pandas, scipy, matplotlib
Python-Matematica
Explorando aspectos fundamentais da matemática com Python e Jupyter
Stars: ✭ 41 (-80.57%)
Mutual labels:  numpy, pandas, scipy, matplotlib
Algorithmic-Trading
Algorithmic trading using machine learning.
Stars: ✭ 102 (-51.66%)
Mutual labels:  scikit-learn, pandas, scipy, matplotlib
Credit Risk Modelling
Credit Risk analysis by using Python and ML
Stars: ✭ 91 (-56.87%)
Mutual labels:  numpy, scikit-learn, pandas, scipy
Orange3
🍊 📊 💡 Orange: Interactive data analysis
Stars: ✭ 3,152 (+1393.84%)
Mutual labels:  numpy, scikit-learn, pandas, scipy
datascienv
datascienv is package that helps you to setup your environment in single line of code with all dependency and it is also include pyforest that provide single line of import all required ml libraries
Stars: ✭ 53 (-74.88%)
Mutual labels:  numpy, scikit-learn, pandas, matplotlib
Mars
Mars is a tensor-based unified framework for large-scale data computation which scales numpy, pandas, scikit-learn and Python functions.
Stars: ✭ 2,308 (+993.84%)
Mutual labels:  numpy, scikit-learn, pandas
Cheatsheets.pdf
📚 Various cheatsheets in PDF
Stars: ✭ 159 (-24.64%)
Mutual labels:  numpy, scikit-learn, pandas
Data Science Types
Mypy stubs, i.e., type information, for numpy, pandas and matplotlib
Stars: ✭ 180 (-14.69%)
Mutual labels:  numpy, pandas, matplotlib
Data Science Projects With Python
A Case Study Approach to Successful Data Science Projects Using Python, Pandas, and Scikit-Learn
Stars: ✭ 198 (-6.16%)
Mutual labels:  numpy, scikit-learn, pandas

[개정판] 파이썬 라이브러리를 활용한 머신러닝

이 책의 개정2판이 출간되었습니다. 개정 2판의 코드는 여기를 참고하세요.

사이킷런(Scikit-Learn) 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

cover

이 레파지토리는 안드레아스 뮐러(Andreas Mueller)와 세라 가이도(Sarah Guido)의 책인 "Introduction to Machine Learning with Python" 4th 릴리스의 번역서 "(개정판)파이썬 라이브러리를 활용한 머신러닝"의 코드와 주피터 노트북을 담고 있습니다. 개정판은 풀 컬러 인쇄이며 사이킷런의 최신 기능과 한글 부록, 최신 라이브러리에 대응하는 역자 노트가 포함되어 있습니다.

** 1판 번역서의 코드는 1st_edition 브랜치를 참고하세요. **

이 책의 내용은 Python 3.7, scikit-learn 0.20.2, 0.21.1, 0.22, 0.23.1에서 테스트 되었습니다.

이 레파지토리는 책에 포함된 코드를 주피터 노트북 형태로 가지고 있으며 그래프와 데이터셋을 위한 mglearn 라이브러리를 함께 제공합니다. aclImdb 데이터셋과 Naver sentiment movie corpus를 제외하고는 책에서 사용하는 데이터도 모두 포함하고 있습니다. aclImdb 데이터셋은 앤드류 마스(Anrew Mass)의 웹사이트에서 다운받을 수 있습니다. 자세한 내용은 책을 참고하세요. Naver sentiment movie corpus는 루시 님의 깃허브에서 다운받을 수 있습니다.

책 커버에 있는 도룡뇽은 헬벤더입니다.

에러타(Errata)

"(개정판)파이썬 라이브러리를 활용한 머신러닝"의 에러타는 옮긴이의 블로그나 한빛미디어 웹사이트에서 확인할 수 있습니다. 코드에 오류가 있다면 깃허브에 이슈를 남겨 주시거나 옮긴이의 블로그를 통해 연락 주세요.

설치

이 코드를 실행하려면 numpy, scipy, scikit-learn, matplotlib, pandaspillow 패키지가 필요합니다. 결정 트리와 신경망 구조에 대한 그래프를 그리려면 graphviz도 필요합니다. 7장 텍스트 데이터 다루기에서는 ntlkspacy도 사용합니다.

개발 환경을 만들려면 아나콘다(Anaconda)를 설치하는 것이 가장 편리한 방법입니다.

conda를 사용한 패키지 설치

설치된 파이썬이 있다면 conda 패키지 매니저를 사용하여 다음 명령을 실행하면 필요한 패키지를 모두 얻을 수 있습니다.

conda install numpy scipy scikit-learn matplotlib pandas pillow graphviz python-graphviz

7장을 위해서는 nltkspacy도 설치해야 합니다.

conda install nltk spacy

pip를 사용한 패키지 설치

파이썬이 있고 pip를 사용하여 패키지를 설치하려면 다음 명령을 사용합니다.

pip install numpy scipy scikit-learn matplotlib pandas pillow graphviz

또한 graphviz C 라이브러리를 설치해야 합니다. 패키지 매니저를 사용하여 쉽게 설치할 수 있으며 macOS는 homebrew를 사용하여 brew install graphviz 명령을 사용합니다. 우분투나 데비안이라면 apt-get install graphviz 명령을 사용합니다. 윈도우즈에서 graphviz를 설치하는 것은 쉽지 않습니다. 대신 conda나 아나콘다를 사용하세요. 7장을 위해서는 nltkspacy도 설치해야 합니다.

pip install nltk spacy

영어 언어 모델 다운로드하기

7장에서 spacy의 영어 언어 모델을 다운로드하려면 다음 명령을 사용합니다.

python -m spacy download en
Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].