- 빅데이터와 기술
- 하둡 → 프리웨어 중요! (무료로 배폰된 소프트웨어)
- 아파치 하둡 (분산을 통해서 복잡한 데이터 잘 처리)
- 빅데이터의 대표적인 엔진이다!! 중요!
- 하둡의 특징
- 오픈 소스 프로젝트여서 비용 부담 없음
- 유닉스 장비 사용하지 않아도 된다.
- 데이터 복제본을 저장해서 복제가 가능 → 기업에서 사용 많이
- 맵리듀스
- 구글에서 병렬처리를 위해 개발된…
- 커스터메이징해서 분할할 수있다느 장점
- Nosquerylanguate = 구조된 어넝 .약자 알아두기
- 분산 환경에는 적합하지 않다… 가 ㅈ중요
- 빅데이터 처리 과정
- 수집 분석 가공
- extruct transform load
- 빅데이터 처리 가법 (데이터 마이닝, 딥러닝 )
- 데이터 ㅁㅇ
- 자연어 처리 빅데이터 ㅓ리 ㅏ법 자연어 상요 ‘
- 잉크 스케이프 워드 클라우드 두 갠 꼭 알고 있기
- 워드 크라욷우듣
lDA
토픽 ㅏㅈ아내는.. 반복..