Quantcast
Channel: 개발 노트
Viewing all articles
Browse latest Browse all 299

[리뷰] 9가지 사례로 익히는 고급 스파크 분석(2판)

$
0
0

들어가기전에

이전 프로젝트에서 엘라스틱서치를 통해서 데이터 분석에 대한 경험을 해볼 수가 있었고, 중요성에 대해서 알 수 있게 되었었습니다. 데이터를 직접 분석해보고 이를 시각화 해보는 과정에서 기존에는 인지하지 못했던 여러 정보들을 얻을 수 있고, 이를 통해 서비스를 개선할 수 있는 다양한 아이디어가 떠오르는 것을 경험해볼 수도 있었습니다. 왜 많은 회사들이 데이터를 다루는 것을 중요하게 생각하고, 이를 위해 어마어마한 투자를 하고 있는지 알 것 같았습니다. 데이터를 분석하는 방법으로는 제가 사용해보았던 엘라스틱서치를 사용할 수도 있고, R이나 스파크 등 다양한 툴들이 존재합니다. 제가 느꼈던 데이터 분석을 위한 툴들의 공통점은 처음 진입하기가 너무 어렵게 느껴진다는 것이었습니다. 머신러닝의 경우에는 내가 감히 접근해도 되는 분야인가 하는 생각이 들 정도로 어려워보였습니다.




책의 느낌

9가지 사례로 익히는 고급 스파크 분석이라는 책을 처음 펼쳐보았을 때도 같은 생각이 들었습니다. 먼저 간단하게 훑어보니 이론적인 설명은 아주 짧게 되어 있고, 책 제목처럼 사례들을 중심으로 되어있었는데 각각의 사례들이 쉽지 않아보였습니다. 그래서 일단은 뒷 내용은 제쳐두고, 앞의 내용을 숙지하자는 생각으로 설명을 읽어가며 명령어들을 하나씩 따라해보았습니다. 스파크에 대한 이론적인 부분에 대한 비중이 적긴 하지만 필요한 내용들에 대해 간단 명료하게 작성되어 있기 때문에 나머지 부수적인 내용은 활용에 대한 부분들이라 필요한 경우에 인터넷을 찾아가며 해도 무관해보였습니다. 엘라스틱서치를 공부할 때도 두꺼운 책을 세세하게 읽어나가는 것보다 조금이라도 빨리 실전 예제를 해보면서 잘 안되는 부분들이나 필요한 부분들을 검색해가며 공부를 했던 것이 더 효과적이었습니다. 예제 또한 너무 동떨어진 내용이 아니고 실생활에서 접할 수 있는 주제들이라서 조금 더 재미있게 따라해볼 수 있었습니다.



스파크에 대해서는 이름만 아는 수준이었는데, 책을 읽다보니 엘라스틱서치와 같이 집계를 수행할 수 있는 기능도 제공하고, 머신러닝도 수행할 수 있는 다양한 기능을 제공한다는 것을 알게되었습니다. 사실 따라하는데에 급급해서 이 책의 모든 내용을 이해하기는 힘들었습니다. 하지만 중요한 것은 스파크를 통해 이러한 일들을 할 수가 있고, 필요한 경우 도입을 검토해볼 수 있겠다는 생각을 갖게 되었습니다.


이 책을 통해 누구나 스파크를 시작해볼 수 있겠지만 모든 사람들이 이 책을 이해하기는 힘들 것 같다는 생각이 들었습니다. 개인적으로 이 책은 스파크에 대한 감을 익히는데 좋지만, 입문자가 이해하기는 어렵기 때문에 스파크를 공부해나가며 이 책에 수록된 예제들을 하나하나 이해해나간다면 이 책을 전부 이해했을 때는 스파크에 대해 어느정도 통달한 경지가 되지않을까하는 생각이 들었습니다.



맺음말
결론적으로 책의 구성은 나쁘지 않았고, 아직은 저에게 어려운 내용이지만 차차 정복해나가는 재미가 있을 것 같다는 생각이 들었습니다. 이 책에 수록된 내용 외에도 스파크를 활용하는데 필요한 지식들이 더 많이 존재하기 때문에 여러 다른 책들과 검색을 통해 지식을 습득하는 것이 좋을 것 같습니다.







Viewing all articles
Browse latest Browse all 299

Trending Articles