반응형

1. 데이터 이해

2장 데이터의 가치와 미래

1절 빅데이터의 이해

빅데이터 규모에 따른 정의

  1. 좁은 범위 : 데이터 변화 (3V - 규모, 다양성, 속도)
  2. 중간 범위 : 기술 변화 (데이터 처리, 저장, 분석 기술 및 아키텍쳐)
  3. 넓은 범위 : 인재, 조직 변화 (Data Scientist, 데이터 중심 조직)

 

빅데이터 출연 배경

  • 산업계 : 고객 데이터 축적에 따른 데이터 가치 발굴
  • 학계 : 아키텍처 및 통계 도구 발전
  • 기술발전 : 디지털화, 인터넷 보급

 

빅데이터로 인한 변화

  • 사전처리 -> 사후처리 : 필요한 데이터만 수집 -> 가능한 한 많은 데이터를 다양한 방식으로 조합해 숨은 정보 탐색
  • 표본조사 -> 전수조사 : 데이터 수집 비용 및 처리 비용 감소
  • -> 양
  • 인과관계 -> 상관관계 : 상관관계를 통해 특정 현상의 발전 가능성 포착, 상응하는 행동 추천

 

2절 빅데이터의 가치와 영향

빅데이터 가치 산정이 어려운 이유

  • 데이터의 재사용, 재조합(Mashup)이 일반화되면서 특정 데이터 활용 목적을 알 수 없음.
  • 기존에 없던 가치 창출
  • 분석 기술의 발전에 따라 현재 가치가 없더라고 가치 있는 데이터가 될 수 있음.

 

빅데이터의 영향

생활 전반의 스마트화

  • 기업 : 비즈니스 모델 혁신, 신사업 발굴
  • 정부 : 사회 변화 추정, 관련 정보 추출
  • 개인 : 데이터 분석 비용의 지속적이 하락에 따른 다양한 활용

 

3절 비즈니스 모델

빅데이터 활용 기본 테크닉

  • 연관규칙학습 : 변인 간 상관관계 탐색
  • 유형분석 : 분류
  • 유전자 알고리즘 : 최적화가 필요한 해결책 진화
  • 기계학습 : 훈련 데이터로부터 학습한 특성을 활용해 예측
  • 회귀분석 : 독립변수 조작에 따른 종속변수 변화를 보면서 변인의 관계 파악
  • 감정분석 : 설문조사 및 고객 평가
  • 소셜네트워크분석 : 특정인과의 관계 또는 영향력 있는 사람 탐색

 

4절 위기 요인과 통제 방안

위기 요인통제 방안
사생활 침해 : 익명화 기술 발전 필요 제공자 동의 -> 사용자 책임
책임 원칙 훼손 : 점재적 위협이 아닌 행동한 결과에 대한 책임결과 기반 책임 원칙 고수
데이터 오용 : 미래 예측 정확도는 높으나 항상 맞지는 않음.알고리즘에 대한 접근권 제공

 

5절 미래의 빅데이터

빅데이터 활용 3요소

  • 데이터 : 모든 것의 데이터화
  • 기술 : 진화하는 알고리즘, 인공지능
  • 인력 : 데이터 사이언티스트, 알고리즈미스트

 

반응형

+ Recent posts