관리자 패널에서 메뉴를 설정하세요

– 하둡 HDFS와 MapReduce 설치 및 프로그래밍, 미니 프로젝트 실습

이력서에 쓸 만큼 근사한 경험
NAVER 실제 사례로 배우는 하둡

Actionable Contents
 빅데이터와 하둡 HDFS, MapReduce, Ecosystem의 개념과 기본 지식
 하둡 클러스터 설치와 분석이 쉬워지는 개발환경 셋팅
 하둡의 전반적인 구동 방식과 HDFS 사용법, 맵리듀스 프로그래밍
 리얼 데이터를 이용한 빅데이터 분석 미니 프로젝트

ver. btc08_1.06

01 압도적인 실력의 선생님 프로그래밍 대가는 3,000줄 짜리 소스도 150줄로 줄입니다. 네이버 검색연구센터에서 오랫동안 데이터분석 프로젝트를 진두지휘한 배영규 박사님.  퇴사 후에도 신입 개발자 교육은 꼭 맡아 달라고 네이버가 붙잡는 최고 전문가의 강의는 정말 품질이 다릅니다.
01 네이버 실제 사례 기반 네이버 검색연구센터가 수행한 여러 빅데이터 분석 사례를 토대로 강의가 진행됩니다. 다중 서버를 다루면서 겪게 되는 이론과 실제의 차이, 현실적인 개발환경, 관계자들과 원활히 협업하기 위해 꼭 필요한 개발자의 핵심역량, 현장의 예기치 못한 상황에 대처하는 개발 노하우 등을 네이버 실제 프로젝트를 기반으로 설명합니다.
03 리얼 데이터를 다루는
미니 프로젝트 실습
국립기후자료센터의 데이터 로그를 분석하여 최고 기온을 예보하는 프로젝트로 기본기를 다진 후 실무관계자들이 흔히 요청하는 개발 사례를 중점적으로 다룹니다. 수집한 유저의 상품리뷰 텍스트 분석 등 현업에서 유용하게 쓰이는 하둡 프로그래밍 스킬을 충분히 연습할 수 있습니다.
04 샘플소스만으로도
확실히 본전 뽑는 교육
이론 교육 및 실습 뿐만 아니라 샘플 소스를 추가적으로 제공해드립니다. 회사로 돌아가 바로 적용 가능한 수준의 하둡 클러스터 설치법 및 네이버랩의 개발 노하우가 담긴 샘플 소스만으로도 차원 높은 하둡 교육을 실감할 수 있습니다.
05 JAVA 기초 지식 필요 본 강의는 총 3 단계로 이뤄진 하둡 개발 교육 중 1단계: 입문 코스입니다. 하둡을 한 번도 접해본 적 없거나 리눅스를 잘 모르는 초보자도 어렵지 않게 따라갈 수 있습니다.  그러나 Java를 전혀 모르는 분은 만족할만한 결과를 얻기 어렵습니다. 상담이 필요한 분은 cs@masocampus.com으로 연락주세요.
Curriculum
1. 빅데이터의 세계에 발 들이기
  • 빅데이터를 어떻게 받아 들일까?
  • 데이터 사이언스의 각 분야와 맞물림
  • 빅데이터 분석의 실제
2. 하둡(Hadoop)을 소개합니다
  • 하둡의 기본 개념과 동작 방식
  • HDFS : 하둡의 파일 분산 시스템
  • MapReduce : 병렬 데이터 처리와 프로그래밍 기법
  • YARN : 차세대 분산 처리 환경
  • Hadoop Ecosystem
3. 하둡을 설치합니다
  • 하둡 클러스터 모드 설치 연습
    – CentOS 서버 4대(master 1 + slave 3)로 구성
  • HDFS namenode와 Application Manager 웹 콘솔 확인
4. 클라이언트 개발 환경 셋팅
  • 클라이언트: JDK, Eclipse(git, gradle 플러그인) 설치, 하둡 프로그래밍 환경 셋팅
  • 서버(개발장비): 하둡 프로그래밍을 위한 서버 개발환경 셋팅
5. HDFS와 MapReduce의 기초
  • HDFS로 파일을 관리하기 위한 기본 명령어 배우기
  • MapReduce 구현을 위한 Map 함수, Reduce 함수, Driver Class 프로그래밍 방법
6. MaqReduce 프로그래밍 연습
  • Eclipse를 이용한 자바 맵리듀스 프로그래밍
  • Word Count 프로젝트로 Map 함수 구현, Reduce 함수, Driver Class의 구현 & 실행 결과확인
7. MapReduce 프로그래밍 기법 익히기 (1)
  • 다양한 입력 포맷(input type)
  • 입력 데이터를 핸들링하는 방법
  • 정렬법(sorting): 부분정렬, 전체정렬, 보조정렬
8. MapReduce 프로그래밍 기법 익히기 (2)
  • Partioner와 Group Comparator의 이해
  • 데이터 조인(join) 요령
9. MapReduce 프로그래밍 기법 익히기 (3)
  • 파일 압축과 Split
  • 사이드 데이터의 분배 방법(분산 캐시)
  • 맵리듀스의 스트리밍 방식
10. 하이브(Hive)
  • 하이브의 개요와 설치
  • 하이브의 HiveQL을 이용한 WordCount 구현 및 실행
11. 데이터분석 프로젝트 실습(1)
  • 국립기후자료센터의 데이터 로그 분석 프로그래밍
  • 데이터 로그 분석과 MaxTemperature 프로젝트 생성
  • Map, Reduce, Driver Class 구현 및 실행 결과확인
12. 데이터분석 프로젝트 실습(2)
  • 제품의 사용자 리뷰 데이터를 이용한 텍스트 분석
  • 평점별 키워드 텍스트 마이닝
  • Map, Reduce, Driver Class 구현 및 실행 결과확인

***** 얼리버드 이벤트 안내*****

강의 개시 3주전까지 등록 완료시, 20% 할인
강의 개시 1주전까지 등록 완료시, 10% 할인

일시 cs@masocampus.com으로 문의
장소 삼성중앙역 캠퍼스(지도보기)
수강료 660,000 (VAT 포함)
정원 12명 (조기마감에 유의하세요)
준비물 실습용 노트북
문의처 02-6080-2022 / cs@masocampus.com
기타 LMS 사용법 / 마소웨비나 접속안내 / 카드입금전표 발행

 

커리큘럼 / 웹북 목차

No curriculum found !

강의/웹북 리뷰

N.A

ratings
  • 5 stars0
  • 4 stars0
  • 3 stars0
  • 2 stars0
  • 1 stars0

이 강의에 대한 리뷰가 없습니다.

Actionable Contents
  • PRIVATE
  • 무제한 사용가능
  • 강좌 찜하기
98 등록 수강생

머니매그넷(주) Since 2013
마소캠퍼스
- 온라인|원격평생교육시설 등록번호
: 제 원-509호

마소캠퍼스ICT평생교육원
- 오프라인|지식·인력개발사업 평생교육시설 등록번호
: 제 지-286호

서울시 강남구 테헤란로 242 아이타워 9층 (06221), 전화 02-6080-2022, 팩스 02-6455-2021, 이메일 문의 cs@masocampus.com
통신판매업번호 2014-서울강남-03465, 대표(개인정보책임자): 김진, 서비스 이용약관, 개인정보 처리방침
마소캠퍼스 웹사이트는 크롬 브라우저에 최적화 되어 있습니다.

©MasoCampus. All rights reserved.