서강대학교 로욜라도서관

탑메뉴

전체메뉴

전체메뉴닫기


검색

상세정보

Pandas cookbook : 과학 연산, 시계열 분석, 파이썬을 이용한 시각화, 정돈된 데이터 만들기

Petrou, Theodore

상세정보
자료유형단행본
서명/저자사항Pandas cookbook : 과학 연산, 시계열 분석, 파이썬을 이용한 시각화, 정돈된 데이터 만들기 / 시어도어 페트로우 지음 ; CRAS 금융경제 연구소 옮김
개인저자Petrou, Theodore
단체저자명CRAS 금융경제 연구소
발행사항서울 : 에이콘, 2018
형태사항618 p. : 삽화, 표 ; 24 cm
총서명Acorn+PACKT technical book
원서명Pandas cookbook :recipes for scientific computing, time series analysis and data visualization using Python
ISBN9791161751252
9788960772106 (set)
일반주기 색인수록
본서는 "Pandas cookbook : recipes for scientific computing, time series analysis and data visualization using Python. c2017."의 번역서임
일반주제명Python (Computer program language)
Management --Data processing
Machine learning
언어한국어

소장정보

서비스 이용안내
  • 찾지못한자료찾지못한자료
  • SMS발송SMS발송
메세지가 없습니다
No. 등록번호 청구기호 소장처/자료실 도서상태 반납예정일 예약 서비스
1 1360513 중앙도서관// 정리중 예약


서평 (0 건)

서평추가

서평추가
별점
별0점
  • 별5점
  • 별4.5점
  • 별4점
  • 별3.5점
  • 별3점
  • 별2.5점
  • 별2점
  • 별1.5점
  • 별1점
  • 별0.5점
  • 별0점
제목입력
본문입력

*주제와 무관한 내용의 서평은 삭제될 수 있습니다.

출판사 제공 책소개

출판사 제공 책소개 일부

★ 이 책에서 다루는 내용 ★

■ 모든 데이터셋의 탐색이 가능하도록 해주는 Pandas의 기본 지식 마스터
■ 쿼리와 선택을 통해 데이터 중 원하는 부분만 부분집합으로 적절히 골라내는 방법
■ 데이터를 종합하거나 각 그룹으로 변환하기 전 개별 그룹으로 분할하는 방법
■ 데이터 분석 및 시각화가 용이하도록 데이터를 정돈된 형식으로 재구성
■ 정리되지 않은 실제 데이터를 머신 러닝에서 사용할 수 있도록 준비
■ SQL 유사 연산 기능을 통해 서로 다른 소스의 데이터 병합
■ 독보적인 시계열 데이터 처리 능력
■ matplitlib나 seaborn을 사용한 멋지면서도 동시에 통찰을 얻을 수 있는 시각화 기능

★ 이 책의 대상 독자 ★

이 책은 단순한 레시피에서 고급 레시피까지 거의 100가지 정도의 레시피를 다루고 있다. 모든 레시피는 최신 파이썬 문법과 구문을 사용해 작성됐다. '작동 원리' 절에서는 레시피의 복잡한 각 단계에 대해 상세한 설명을 제공한다. 종종 '추가 사항' 절에서 완전히 새로운 레시피에 대한 정보를 얻을 수 있다. 이 책...

출판사 제공 책소개 전체

★ 이 책에서 다루는 내용 ★

■ 모든 데이터셋의 탐색이 가능하도록 해주는 Pandas의 기본 지식 마스터
■ 쿼리와 선택을 통해 데이터 중 원하는 부분만 부분집합으로 적절히 골라내는 방법
■ 데이터를 종합하거나 각 그룹으로 변환하기 전 개별 그룹으로 분할하는 방법
■ 데이터 분석 및 시각화가 용이하도록 데이터를 정돈된 형식으로 재구성
■ 정리되지 않은 실제 데이터를 머신 러닝에서 사용할 수 있도록 준비
■ SQL 유사 연산 기능을 통해 서로 다른 소스의 데이터 병합
■ 독보적인 시계열 데이터 처리 능력
■ matplitlib나 seaborn을 사용한 멋지면서도 동시에 통찰을 얻을 수 있는 시각화 기능

★ 이 책의 대상 독자 ★

이 책은 단순한 레시피에서 고급 레시피까지 거의 100가지 정도의 레시피를 다루고 있다. 모든 레시피는 최신 파이썬 문법과 구문을 사용해 작성됐다. '작동 원리' 절에서는 레시피의 복잡한 각 단계에 대해 상세한 설명을 제공한다. 종종 '추가 사항' 절에서 완전히 새로운 레시피에 대한 정보를 얻을 수 있다. 이 책은 방대한 Pandas 코드를 제공한다.
일반적으로 처음 6개 장의 레시피는 간단하며, 나머지 5개 장에 비해 기본적이고 근본적인 Pandas 연산에 중점을 두고 있고, 나머지 5개 장은 고급 연산과 프로젝트에 기반을 둔 레시피를 소개한다. 이 책의 난이도는 광범위하기 때문에 초보자와 숙련자 모두에게 유용하다. 따라서 Pandas를 일상적으로 사용하는 사람도 Pandas의 관용구에 익숙해지지 않으면 마스터할 수 없다. 이 점은 Pandas의 방대한 영역에서 비롯된다. 대부분 동일한 연산을 수행할 수 있는 여러 가지 방법이 존재하는데 사용자가 원하는 결과를 얻을 수는 있지만 비효율적인 방법을 사용할 가능성이 있으며, 동일한 문제를 해결하는 Pandas 솔루션의 속도 차이가 몇 제곱 이상 다른 경우도 많다.
책을 읽기 위한 필수 지식은 오직 파이썬뿐이다. 독자가 리스트, 집합, 딕셔너리, 튜플 등과 같은 파이썬의 내장 데이터 저장소에 어느 정도 익숙하다고 가정한다.

★ 이 책의 구성 ★

1장, 'Pandas 기초'에서는 Pandas 데이터 구조를 이루는 두 구성 요소인 Series와 DataFrame를 해부하고 용어를 정리한다. 각 열은 동일한 데이터 형식을 가져야 하는데, 각 데이터 형식을 알아본다. 이를 통해 Series와 DataFrame의 메서드를 호출하고 체인시키면서 두 요소의 진정한 힘을 배우게 될 것이다.
2장, 'DataFrame 필수 연산'에서는 데이터 분석을 위해 가장 중요하고 보편적인 연산에 대해 알아본다.
3장, '데이터 분석 시작'에서는 데이터를 읽어 들인 후, 해야 할 반복적인 작업을 개발하는 데 도움을 줄 것이다. 이외에 흥미로운 점도 많이 발견하게 될 것이다.
4장, '데이터의 부분 집합 선택'에서는 서로 다른 부분 집합 선택에 있어 혼동되는 부분 등 여러 주제에 대해 다룬다.
5장, '불리언 인덱싱'에서는 불리언 조건을 이용해 데이터의 부분 집합을 선택하는 쿼리 프로세스를 다룬다.
6장, '인덱스 정렬'에서는 아주 중요하지만 종종 잘못 이해되고 있는 인덱스(index) 객체를 다룬다. 인덱스를 잘못 다루면 수많은 잘못된 결과를 초래하는데, 6장에서는 강력한 결과를 얻기 위한 올바른 사용법에 대해 알아본다.
7장, '종합, 필터링, 변환을 위한 종합'에서는 데이터를 분석하는 동안 항상 필요한 강력한 그룹화 기능에 대해 다룬다. 목적에 맞는 그룹에 적용할 사용자 정의 함수를 구성할 수 있게 될 것이다.
8장, '데이터를 정돈된 형태로 재구성'에서는 정돈된 데이터에 대해 설명하고 왜 중요한지 알아본다. 또 서로 다른 혼란된 형태로 된 데이터를 정돈하는 법에 대해 다룬다.
9장, 'Pandas 객체 병합'에서는 DataFrames와 Series를 수직과 수평으로 병합하는 여러 메서드에 대해 알아본다. 또 웹 스크래핑을 통해 트럼프와 오바마 대통령의 국정 수행 평가 점수를 비교하고 SQL 관계형 데이터베이스에 연결해본다.
10장, '시계열 분석'은 가능한 모든 시간 차원에 따라 분해를 위한 시계열 기능의 강력한 고급 기능에 대해 알아본다.
11장, 'Matplotlib, Pandas, Seaborn을 이용한 시각화'에서는 Pandas의 모든 도식화의 기본이되는 matplotlib 라이브러리를 소개한다. 그런 다음, Pandas plot 메서드와 seaborn 라이브러리 등 Pandas에서 직접적으로 제공되지 않는 다양하고 심미적인 시각화 기능에 대해 알아본다.

함께 비치된 도서