이곳은 "생능 출판사"의 "머신러닝으로 쉽게 따라하는 데이터 과학 프로젝트-오렌지3 with 파이썬(2024출판)"의 저장소입니다.
미리보기: 생능출판사
이 책의 정오표를 생능출판사에서 확인할 수 있습니다.
9가지의 다양한 프로젝트 실습을 통해 상황에 따라 미래의 변화를 예측할 수 있는 방법 소개
이 책은 데이터 과학 및 기계학습의 다양한 적용 분야를 다루며, 특히 오렌지3와 파이썬을 활용하여 문제를 해결하는 프로젝트 활동들로 구성되어 있습니다. 각 챕터에서는 실제 데이터에 기반한 프로젝트를 통해 이론을 실제로 구현하고, 머신러닝의 개념과 응용 방법을 익힐 수 있게 구성되었습니다.
또한 각 실습은 특정 데이터 세트와 문제에 초점을 맞추지만, 배운 기법들은 다른 유사한 문제에도 적용이 가능합니다. 따라서 각 챕터를 마친 후, 배운 내용을 다른 문제에 적용해 보는 것이 좋습니다.
1장 기계학습과 신경망의 이해
01 기계학습은 무엇인가?
02 지도 학습 과정
03 신경망 모델
04 학습과 평가
2장 머신러닝 기반 문제 해결 과정 : 오렌지와 구글 코랩의 활용
01 오렌지 소개하기
02 오렌지 프로그램 설치하기
03 오렌지 프로그램 화면
04 구글 코랩 사용하기
05 데이터 분석을 위한 파이썬 주요 라이브러리
06 머신러닝 기반 문제 해결 과정
3장 호텔 고객의 만족도를 높이기 위해 어떤 서비스에 중점을 두어야 할까?
01 문제 정의하기
02 데이터는 어떻게 수집할까?
03 호텔 만족도 분류 모델은 어떻게 만들까?
04 오렌지를 이용한 결정트리 모델 구현하기
05 파이썬을 이용해 결정트리 모델 구현하기
4장 펭귄 종을 분류할 수 있는 방법은 무엇일까?
01 문제 정의하기
02 데이터는 어떻게 수집할까?
03 펭귄 종 분류 모델은 어떻게 만들까?
04 오렌지를 이용한 펭귄 종 예측하기
05 파이썬을 이용해 최근접 이웃 알고리즘으로 펭귄 종 예측하기
5장 2040년 자장면 가격을 예측할 수 있을까?
01 문제 정의하기
02 데이터는 어떻게 수집할까?
03 어떤 데이터 처리가 필요할까?
04 자장면 가격 예측 모델은 어떻게 만들까?
05 오렌지를 이용한 선형회귀 모델 구현하기
06 파이썬을 이용해 선형회귀 모델 구현하기
6장 건강 상태를 알면 당뇨병을 예측할 수 있을까?
01 문제 정의하기
02 데이터는 어떻게 수집할까?
03 당뇨병 분류 모델은 어떻게 만들까?
04 오렌지를 이용한 당뇨병 예측하기
05 파이썬을 이용해 당뇨병 예측하기
7장 전 세계의 지진 데이터를 군집화할 수 있을까?
01 문제 정의하기
02 데이터는 어떻게 수집할까?
03 지진 군집화 모델은 어떻게 만들까?
04 오렌지를 이용한 지진 데이터 군집화하기
05 파이썬을 이용해 지진 데이터 군집화하기
8장 인공지능으로 이미지의 용량을 줄이는 방안은 무엇일까?
01 문제 정의하기
02 데이터는 어떻게 수집할까?
03 사진의 군집화 모델은 어떻게 만들까?
04 오렌지를 이용한 사진 데이터 군집화하기
05 파이썬을 이용해 사진 데이터 군집화하기
9장 식료품 구매에 어떤 연관성이 있을까?
01 문제 정의하기
02 데이터는 어떻게 수집할까?
03 식료품 구매의 연관 분석은 어떻게 수행할까?
04 오렌지를 이용한 식료품 구매 연관 분석하기
05 파이썬을 이용해 식료품 연관 분석하기
10장 음파 탐지기로 기뢰와 바위를 구분할 수 있을까?
01 문제 정의하기
02 데이터는 어떻게 수집할까?
03 기뢰와 바위를 분류하는 모델은 어떻게 만들까?
04 오렌지를 이용한 기뢰, 바위 예측하기
05 파이썬을 이용해 기뢰, 바위 예측하기
11장 인공지능으로 사과 농가를 어떻게 도울까?
01 문제 정의하기
02 데이터는 어떻게 수집할까?
03 썩은 사과 분류 모델은 어떻게 만들까?
04 오렌지를 이용한 썩은 사과 분류하기
05 파이썬을 이용해 썩은 사과 분류 예측하기
| 폴더 이름 | 설명 |
|---|---|
| Ch_02 | 데이터 분석을 위한 파이썬 주요 라이브러리, 머신러닝 기반 문제 해결 과정 설명 노트북 |
| Ch_03 | 호텔 고객의 만족도를 높이기 위해 어떤 서비스에 중점을 두어야 할까?, 주피터 노트북+오렌지3파일, 데이터셋 |
| Ch_04 | 펭귄 종을 분류할 수 있는 방법은 무엇일까?, 주피터 노트북+오렌지3파일, 데이터셋 |
| Ch_05 | 2040년 자장면 가격을 예측할 수 있을까?, 주피터 노트북+오렌지3파일, 데이터셋 |
| Ch_06 | 건강 상태를 알면 당뇨병을 예측할 수 있을까?, 주피터 노트북+오렌지3파일, 데이터셋 |
| Ch_07 | 전 세계의 지진 데이터를 군집화할 수 있을까?, 주피터 노트북+오렌지3파일, 데이터셋 |
| Ch_08 | 인공지능으로 이미지의 용량을 줄이는 방안은 무엇일까?,주피터 노트북+오렌지3파일 |
| Ch_09 | 식료품 구매에 어떤 연관성이 있을까?, 주피터 노트북+오렌지3파일, 데이터셋 |
| Ch_10 | 음파 탐지기로 기뢰와 바위를 구분할 수 있을까?, 주피터 노트북+오렌지3파일, 데이터셋 |
| Ch_11 | 인공지능으로 사과 농가를 어떻게 도울까?, 주피터 노트북+오렌지3파일, 데이터셋 |
이 책의 코드는 주피터 노트북으로도 제공됩니다. 다음 표의 링크를 클릭하면 구글 코랩에서 노트북을 실행할 수 있습니다.
본서에서 제공하는 예제와 실습은 아래의 환경과 라이브러리 버전을 기준으로 작성되었습니다.
독자 여러분이 동일한 결과를 얻기 위해서는, 가능한 한 이와 유사한 환경을 준비하시기를 권장드립니다.
- Python 버전: 3.10.12
- Orange3 버전: 3.8
- TensorFlow 버전: 2.17.1
(Keras 버전: 3.5.0 포함) - NumPy 버전: 1.26.4
- Pandas 버전: 2.2.2
- Matplotlib 버전: 3.8.0
- scikit-learn 버전: 1.6.0
