서강대학교 로욜라도서관

탑메뉴

전체메뉴

전체메뉴닫기


검색

상세정보

리눅스에서 R과 하둡을 이용한 빅데이터 처리 분석

임동훈

상세정보
자료유형단행본
서명/저자사항리눅스에서 R과 하둡을 이용한 빅데이터 처리 분석 / 임동훈 지음
개인저자임동훈
발행사항파주 : 자유아카데미, 2018
형태사항vi, 185 p. : 삽화, 표 ; 26 cm
ISBN9791158081942
일반주기 색인수록
수상주기세종도서 학술부문 선정도서, 2019
언어한국어

소장정보

서비스 이용안내
  • 찾지못한자료찾지못한자료
  • SMS발송SMS발송
메세지가 없습니다
No. 등록번호 청구기호 소장처/자료실 도서상태 반납예정일 예약 서비스
1 1359028 005.432 임225ㄹ 1관4층 일반도서 정리중 예약


서평 (0 건)

서평추가

서평추가
별점
별0점
  • 별5점
  • 별4.5점
  • 별4점
  • 별3.5점
  • 별3점
  • 별2.5점
  • 별2점
  • 별1.5점
  • 별1점
  • 별0.5점
  • 별0점
제목입력
본문입력

*주제와 무관한 내용의 서평은 삭제될 수 있습니다.

출판사 제공 책소개

출판사 제공 책소개 일부

기존의 윈도우 환경하에서 전통적인 소프트웨어를 사용하여 빅데이터 처리 ?분석을 하는 것은 한계가 있다. 하둡(Hadoop)은 대용량 데이터를 분산 처리하여 빠른 시간 내 결과를 제공하는 오픈소스 플랫폼이다. 하둡은 빅데이터를 처리할 수 있는 플랫폼이고, 빅데이터 분석을 위해서는 별도의 분석도구가 필요하다. R은 구글, 페이스북, 야후, 아마존 등 많은 기업에서 분석도구로 사용되고 있다. R은 분석 기능이 뛰어나지만 확장성(scalability)이 떨어지는 단점이 있다. 이런 측면에서, 대표적인 빅데이터 처리를 위한 하둡과 분석을 위한 R과의 연동은 아주 자연스러운 일이다. RHadoop은 R과 하둡의 통합 환경으로 대용량 데이터 처리 및 분석을 위한 대표적인 플랫폼이다.
저자가 대학에서 빅데이터 처리.분석을 강의하면서 느끼는 고충은 “어떤 교재를 가지고 강의할 것인가”이다. 대부분 학생들의 컴퓨터 운영체제는 윈도우이고 대학 실습실의 컴퓨터 환경 역시 윈도우 환경하에 있다. 그러나 진짜 빅데이터 처리.분석을 위해서는 리눅스 환경하에서 하둡을 설치하여 R 프로그램을 통해 학습이 이루어져야 한다. 이 책에서는 윈도우 컴퓨터에 리눅스를 설치하여 하둡과 R 상...

출판사 제공 책소개 전체

기존의 윈도우 환경하에서 전통적인 소프트웨어를 사용하여 빅데이터 처리 ?분석을 하는 것은 한계가 있다. 하둡(Hadoop)은 대용량 데이터를 분산 처리하여 빠른 시간 내 결과를 제공하는 오픈소스 플랫폼이다. 하둡은 빅데이터를 처리할 수 있는 플랫폼이고, 빅데이터 분석을 위해서는 별도의 분석도구가 필요하다. R은 구글, 페이스북, 야후, 아마존 등 많은 기업에서 분석도구로 사용되고 있다. R은 분석 기능이 뛰어나지만 확장성(scalability)이 떨어지는 단점이 있다. 이런 측면에서, 대표적인 빅데이터 처리를 위한 하둡과 분석을 위한 R과의 연동은 아주 자연스러운 일이다. RHadoop은 R과 하둡의 통합 환경으로 대용량 데이터 처리 및 분석을 위한 대표적인 플랫폼이다.
저자가 대학에서 빅데이터 처리.분석을 강의하면서 느끼는 고충은 “어떤 교재를 가지고 강의할 것인가”이다. 대부분 학생들의 컴퓨터 운영체제는 윈도우이고 대학 실습실의 컴퓨터 환경 역시 윈도우 환경하에 있다. 그러나 진짜 빅데이터 처리.분석을 위해서는 리눅스 환경하에서 하둡을 설치하여 R 프로그램을 통해 학습이 이루어져야 한다. 이 책에서는 윈도우 컴퓨터에 리눅스를 설치하여 하둡과 R 상에서 빅데이터 처리.분석을 학습하고자 한다.
이 책은 리눅스 기반하에서 빅데이터 처리.분석을 하고 있다. 리눅스 사용자 비율은 약 3%의 아주 소수로 알려져 있다. 윈도우 환경에 익숙한 사용자는 리눅스가 낯선 환경이라 처음에는 어려움을 느낄 수 있다. 저자는 리눅스를 모르는 학생들을 대상으로 한 학기용으로 이 책을 가지고 빅데이터 처리.분석을 강의하고 있다. 저자의 강의 경험에 비추어 빅데이터 처리.분석을 배우고자 하는 열망만 있으면 누구나 따라하며 배울 수 있도록 이 책은 단계별로 쉽게 설명하고 있다. 이 책을 통해 3% ‘비주류’가 되어 빅데이터 처리.분석의 맛을 볼 수 있는 좋은 기회를 갖기 바란다.
이 책은 총 8개의 장으로 구성되어 있다. 제1장에서는 빅데이터 개요에 대해 소개하고, 제2장에서는 윈도우 환경하에 있는 사용자들을 위해 윈도우 운영체제에 리눅스를 설치하는 방법, 제3장에서는 리눅스 사용법에 대해 다룬다. 제4장에서는 하둡의 설치 및 사용법을 설명하며, 제5장에서는 리눅스 상에서 R과 RStudio 설치방법에 대해 다룬다. 제6~8장에서는 하둡과 R의 통합환경인 RHadoop을 설치하고 예제를 통한 RHadoop 프로그램을 작성하고 실제 활용에 대해 공부한다. 많은 사람들이 이 책을 통하여 리눅스 상에서 빅데이터 처리 · 분석의 맛을 볼 수 있도록 최선을 다했지만 여전히 책의 오류 및 부족한 부분이 많을 것으로 생각한다. 따라서 독자들의 애정 어린 충고와 지속적인 지도 편달을 바라며 미흡한 부분은 계속 보완해 나가고자 한다. 출간 후에라도 수정사항이 있을 경우에는 자유아카데미 홈페이지(www.freeaca.com) 자료실에 제공할 예정이니 참조하기를 바란다.
이전 다음
이전 다음

함께 비치된 도서