서강대학교 로욜라도서관

탑메뉴

전체메뉴

전체메뉴닫기


검색

상세정보

(R을 이용한) 빅데이터 분석

임동훈

상세정보
자료유형단행본
서명/저자사항(R을 이용한) 빅데이터 분석 / 임동훈 지음
개인저자임동훈
발행사항파주 : 자유아카데미, 2015
형태사항324 p. : 삽화, 표 ; 26 cm
ISBN9791158080426
일반주기 부록: 개인용 PC의 윈도우즈에 리눅스 설치하기
서지주기참고문헌(p. [317]-319)과 색인수록
분류기호519.50285
언어한국어

소장정보

서비스 이용안내
  • 서가에 없는 자료서가에 없는 자료
  • SMS발송SMS발송
메세지가 없습니다
No. 등록번호 청구기호 소장처/자료실 도서상태 반납예정일 예약 서비스
1 1286941 519.50285 임225ㅂㄷ 2관4층 일반도서 대출가능
서가에 없는 자료 SMS발송


서평 (0 건)

서평추가

서평추가
별점
별0점
  • 별5점
  • 별4.5점
  • 별4점
  • 별3.5점
  • 별3점
  • 별2.5점
  • 별2점
  • 별1.5점
  • 별1점
  • 별0.5점
  • 별0점
제목입력
본문입력

*주제와 무관한 내용의 서평은 삭제될 수 있습니다.

출판사 제공 책소개

출판사 제공 책소개 일부

머리말

21세기 최대의 화두는 빅데이터(big data)이다. 요즘 빅데이터라는 말이 자주 사용되고 있지만 빅데이터가 정확히 무엇인지 알고 있는 사람은 많지 않으리라 생각한다. 빅데이터란 과거 아날로그 환경의 데이터에 비해 규모가 방대하고, 생성 주기가 짧으며, 수치 데이터뿐만 아니라 문자와 영상데이터를 포함하는 대규모 데이터를 말한다. 따라서 과거에 비해 데이터의 양은 물론 질과 다양성 측면에서 새로운 패러다임의 데이터를 의미한다.
요즘 인터넷과 모바일 기기 이용이 생활화되면서 엄청난 양의 데이터가 실시간으로 양산되고 있다. 1분 동안 트위터에서는 약 40만 건의 메시지가 트윗되고 페이스북에서는 60만 명이 로그인하며 구글에서는 약 400만 건의 검색이 이루어지고 있다. 쇼핑의 예에서도 종전에는 상점에서 물건을 살 때만 데이터가 기록되었으나 오늘날에는 인터넷쇼핑몰의 경우 방문자가 구매를 하지 않더라도 어떤 상품에 관심이 있는지, 얼마 동안 쇼핑몰에 머물렀는지를 포함하여 방문자의 행적 하나하나가 데이터로 저장되고 있다.
디지털 시대에 빅데이터만큼 중요한 자산은 없다. 개인이건 기업이건 경쟁사회에서 살아남기 위해서는 빅데이터를 이...

출판사 제공 책소개 전체

머리말

21세기 최대의 화두는 빅데이터(big data)이다. 요즘 빅데이터라는 말이 자주 사용되고 있지만 빅데이터가 정확히 무엇인지 알고 있는 사람은 많지 않으리라 생각한다. 빅데이터란 과거 아날로그 환경의 데이터에 비해 규모가 방대하고, 생성 주기가 짧으며, 수치 데이터뿐만 아니라 문자와 영상데이터를 포함하는 대규모 데이터를 말한다. 따라서 과거에 비해 데이터의 양은 물론 질과 다양성 측면에서 새로운 패러다임의 데이터를 의미한다.
요즘 인터넷과 모바일 기기 이용이 생활화되면서 엄청난 양의 데이터가 실시간으로 양산되고 있다. 1분 동안 트위터에서는 약 40만 건의 메시지가 트윗되고 페이스북에서는 60만 명이 로그인하며 구글에서는 약 400만 건의 검색이 이루어지고 있다. 쇼핑의 예에서도 종전에는 상점에서 물건을 살 때만 데이터가 기록되었으나 오늘날에는 인터넷쇼핑몰의 경우 방문자가 구매를 하지 않더라도 어떤 상품에 관심이 있는지, 얼마 동안 쇼핑몰에 머물렀는지를 포함하여 방문자의 행적 하나하나가 데이터로 저장되고 있다.
디지털 시대에 빅데이터만큼 중요한 자산은 없다. 개인이건 기업이건 경쟁사회에서 살아남기 위해서는 빅데이터를 이용하여 부가가치가 높은 자산으로 만들 필요가 있다. 방대한 규모의 빅데이터를 가치 있고 쓸모 있게 만드는 사람들이 바로 데이터 과학자(data scientist)들이다.
저자가 대학에서 빅데이터 분석에 대해 강의를 하면서 느끼는 고충은 어떤 교재를 가지고 강의할 것인가였다. 대부분의 책들이 빅데이터 분석 방법에 대해 언급하고 있으나 비정형 데이터 혹은 트위터와 같은 소셜 미디어 데이터를 직접 프로그래밍을 통해 다룬 책들은 많지 않았다. 설령 있다 하더라도 어려운 언어 사용으로 인해 구현하는 데 많은 시간이 소비되어 정작 빅데이터의 맛을 제대로 볼 수가 없었다.
이 책은 배우기 쉬운 R 언어를 이용한 데이터 과학자 입문서로서 누구나 따라 하면서 배울 수 있도록 가급적 쉽게 설명하려고 노력하였다.

이 책은 총 10개의 장으로 구성되어 있다. 1장에서는 빅데이터 개요에 대해 소개하고 2장과 3장에서는 텍스트마이닝과 트위터 상에서 텍스트마이닝, 4장과5장에서는 감성분석과 트위터 상에서 감성분석, 6장과 7장에서는 소셜네트워크분석과 트위터 상에서 소셜네트워크 분석, 8장과 9장에서는 텍스트 클러스터링과 트위터 상에서 텍스트 클러스터링에 대해 다루었다. 그리고 10장에서는 리눅스에서 하둡 사용에 대해 다루었고 마지막 부록에서는 개인 PC의 윈도우즈 상에서 리눅스를 설치하는 방법에 대해 다루었다.

책의 예제 및 데이터 파일과 출간 후에 나올 수 있는 수정사항 등은 자유아카데미 홈페이지(www.freeaca.com) 자료실에 제공 예정이다.
이전 다음
이전 다음

함께 비치된 도서