서강대학교 로욜라도서관

탑메뉴

전체메뉴

전체메뉴닫기


검색

상세정보

파이썬으로 데이터 마이닝 시작하기 : 데이터의 수집, 로딩, 변환, 클러스터링, 예측까지

Greeneltch, Nathan

상세정보
자료유형단행본
서명/저자사항파이썬으로 데이터 마이닝 시작하기 : 데이터의 수집, 로딩, 변환, 클러스터링, 예측까지 / 나단 그리넬치 지음 ; 조종희 옮김
개인저자Greeneltch, Nathan
조종희, 역
발행사항서울 : 에이콘, 2019
형태사항211 p. : 삽화, 표 ; 24 cm
총서명에이콘 데이터 과학 시리즈
원서명Python data mining quick start guide :a beginner's guide to extracting valuable insights from your data
ISBN9791161753669
일반주기 색인수록
본서는 "Python data mining quick start guide : a beginner's guide to extracting valuable insights from your data. 2019."의 번역서임
언어한국어

소장정보

서비스 이용안내
  • 찾지못한자료찾지못한자료
  • SMS발송SMS발송
메세지가 없습니다
No. 등록번호 청구기호 소장처/자료실 도서상태 반납예정일 예약 서비스
1 1358278 006.312 G812p K 1관4층 일반도서 대출가능
찾지못한자료 SMS발송


서평 (0 건)

서평추가

서평추가
별점
별0점
  • 별5점
  • 별4.5점
  • 별4점
  • 별3.5점
  • 별3점
  • 별2.5점
  • 별2점
  • 별1.5점
  • 별1점
  • 별0.5점
  • 별0점
제목입력
본문입력

*주제와 무관한 내용의 서평은 삭제될 수 있습니다.

출판사 제공 책소개

출판사 제공 책소개 일부

★ 이 책에서 다루는 내용 ★

■ 데이터셋 요약 및 데이터 시각화 기법 탐구
■ 분석 작업을 위한 데이터 수집과 구성
■ 데이터 포인트를 그룹에 할당하고 클러스터링으로 시각화하기
■ 데이터에 대한 연속적 및 카테고리적 예측 학습
■ 데이터 클리닝, 노이즈 제거, 차원 감소
■ scikit-learn의 파이프라인 특징을 사용한 데이터 처리 모델 연속화
■ 파이썬의 pickle 모듈을 이용한 데이터 처리 모델 구현

★ 이 책의 대상 독자 ★

파이썬을 활용한 데이터 마이닝과 분석 분야의 초보자를 대상으로 한다. 독자가 파이썬 프로그래밍 경험이 거의 없으며 고등학교 수준 이상의 수학 실력을 갖추지 못한 것으로 가정하고 서술했다. 이 책에 사용된 모든 파이썬 라이브러리는 많은 플랫폼에서 무료로 구할 수 있으므로, 인터넷에 접속할 수 있다면 책에 나오는 개념을 배우고 연습할 수 있을 것이다.

★ 이 책의 구성 ★

처음 세 장은 데이터 마이닝 프로젝트의 구조적인 내용을 다룬다. 여기에는 데이터 마이닝 파이썬 환경의 생성, 다양한 소스로부터의 데이터 ...

출판사 제공 책소개 전체

★ 이 책에서 다루는 내용 ★

■ 데이터셋 요약 및 데이터 시각화 기법 탐구
■ 분석 작업을 위한 데이터 수집과 구성
■ 데이터 포인트를 그룹에 할당하고 클러스터링으로 시각화하기
■ 데이터에 대한 연속적 및 카테고리적 예측 학습
■ 데이터 클리닝, 노이즈 제거, 차원 감소
■ scikit-learn의 파이프라인 특징을 사용한 데이터 처리 모델 연속화
■ 파이썬의 pickle 모듈을 이용한 데이터 처리 모델 구현

★ 이 책의 대상 독자 ★

파이썬을 활용한 데이터 마이닝과 분석 분야의 초보자를 대상으로 한다. 독자가 파이썬 프로그래밍 경험이 거의 없으며 고등학교 수준 이상의 수학 실력을 갖추지 못한 것으로 가정하고 서술했다. 이 책에 사용된 모든 파이썬 라이브러리는 많은 플랫폼에서 무료로 구할 수 있으므로, 인터넷에 접속할 수 있다면 책에 나오는 개념을 배우고 연습할 수 있을 것이다.

★ 이 책의 구성 ★

처음 세 장은 데이터 마이닝 프로젝트의 구조적인 내용을 다룬다. 여기에는 데이터 마이닝 파이썬 환경의 생성, 다양한 소스로부터의 데이터 로딩, 다운스트림 분석을 위한 데이터 변환을 포함한다. 나머지 장에서는 주로 개념을 다루며, 신입 사원을 교육하는 것처럼 대화체로 서술했다.
1장. '데이터 마이닝과 파이썬 도구 입문'에서는 독자의 소프트웨어 환경에서 파이썬을 시작하는 법을 다룬다. 파이썬, pandas, scikit-learn, seaborn 같은 인기 있는 라이브러리를 설치하는 법을 알려준다. 환경을 설정하고 나면 다음 설명을 따라갈 수 있을 것이다.
2장. '기본 용어와 종합적 사례'에서는 데이터 마이닝에서 요구되는 기본적 통계와 데이터 용어를 소개한다. 이 장의 끝에서는 종합적 예제를 다루고, 다음 장에서 소개할 여러 기법을 보여준다. 2장을 읽으면 분석이 의미하는 사고의 과정과 업무에서 맞닥뜨리게 될 문제를 해결하기 위한 절차를 좀 더 명확히 이해할 수 있다.
3장. '데이터의 수집, 탐구, 시각화'에서는 데이터베이스, 디스크, 웹에서 데이터를 불러오는 기본적인 방법을 살펴본다. 기본적인 SQL 질의와 pandas의 액세스 및 검색 함수를 다루며, seaborn을 사용한 주요 플롯 형태를 소개한다.
4장. '분석을 위한 데이터 클리닝 및 준비'에서는 데이터 클리닝과 차원 감소의 기본을 다룬다. 어떻게 미지의 값을 처리하고, 입력 데이터를 리스케일하고, 카테고리 변수를 다룰지 이해하게 될 것이다. 또한 고차원 데이터의 문제를 필터, 래퍼(wrapper), 변환 기법 등의 특징 감소 기법을 사용해 문제를 어떻게 해결하는지 알아본다.
5장. '데이터의 그룹화와 클러스터링'에서는 데이터 마이닝을 위한 클러스터링 알고리즘 설계 배경과 사고 과정을 설명한다. 그리고 실무에서 사용하는 클러스터링 기법을 소개하고 모의 데이터를 사용해 이들을 비교한다. 이 내용을 배우면 평균 분리, 밀도, 연결성에 기반한 클러스터링 알고리즘 간의 차이를 알게 될 것이다. 또한 데이터의 플롯을 해석하고 클러스터링이 여러분의 데이터 마이닝 프로젝트에 어느 정도 적합한지에 대한 인사이트를 얻을 수 있다.
6장. '회귀와 분류를 이용한 예측'에서는 손실 함수와 기울기 하강을 통한 예측 모델 학습을 다룬다. 그다음 과대적합, 과소적합 및 적합 과정에서의 모델 정규화를 위한 페널티 접근의 개념을 살펴본다. 그리고 표준적인 회귀 및 분류 기법들과 각각의 정규화된 버전을 다룬다. 교차 검증과 그리드 검색을 포함한 모델 튜닝의 베스트 프랙티스를 다루면서 마무리한다.
7장. '고급 주제: 데이터 처리 파이프라인의 생성과 사용'에서는 scikit-learn 기법을 사용해 파이프라인을 생성하고 적용하는 전략을 살펴본다. 이어서 구현 시점에서 일어나는 파이썬 관련 문제를 다룬다.
이전 다음
이전 다음

함께 비치된 도서