bigdata 3

소셜 데이터 마이닝 분석

1. 주요 분석 내용 설정 1) 분석 주제 분석 주제 설정을 통해 구체적으로 어떤 사회현상과 그 세부 내용을 다룰 것인지 정한다. 이 과정에서 연구자는 분석의 효율성과 타당성을 먼저 살펴보아야 한다. 인적, 물적 자원의 투입 대비 효율 측면에서 기존의 방법론에 비해 이점이 없다면 분석주제를 다시 고려해보아야 한다. 소셜 미디어의 '전수'데이터를 활용한다는 가정하에 적절한 분석 방법인지 따져봐야 한다. 2) 분석 방법 소셜 미디어 데이터를 분석할 수 있는 방법론 : ①미디어 내용 분석, ②이용자 반응·효과 분석, ③이용자 혹은 미디어 기업 간 관계 분석 등 각각의 분석 방법은 분석 주제에 따라 설정하는데, 이때 분석을 수행하기 위해 필요한 변인의 종류나 규모, 세부 통계 방법 등도 구체화해야 한다. ① 미..

소셜 빅데이터 마이닝 개념과 분석 유형

1. 소셜 빅데이터 마이닝의 개념 빅데이터(big data) 기존 데이터에 비해 규모(Volume), 속도(Velocity), 다양성(Variety) 등이 우위에 있다고 평가되는 데이터 소셜 빅데이터(social big data) - 소셜 미디어 공간에서 생산되는 대용량 데이터 - 빅데이터의 특징 요소에 더해 소셜 미디어를 통해 생산되는 정보 특성이 강조된 개념 - 이용자 참여가 강조된 인게이지먼트(engagement) 수치가 대용량 데이터로 생산된다는 특징이 있음. 데이터 마이닝 (data mining) - 수많은 데이터 중 의미 있는 정보를 추출해 내는 분석과정을 의미한다. - 숫자 데이터같이 구조화된 데이터를 분석해 낸다는 특징이 있다. - 체계화되지 않은 정보 중 반복적이고 지속적으로 나타나는 트..

관계형 데이터 모델의 기초

데이터 모델이란? 데이터 모델은 구조(S), 연산(O), 제약조건(C)로 이루어져 있음 1. 구조 : 데이터의 구조 - 정적 성질, 객체 타입과 이들간의 관계를 명세함 2. 연산 : 데이터의 동적 성질 - 객체 인스턴스를 처리하는 작업에 대한 명세 - 데이터 조작 기법 3. 제약조건 : 데이터의 논리적인 제약 - 구조로부터 파생 의미적 제약 - 데이터 조작의 한계를 표현하는 규정 예) 정수 구조 : -2.-1,0,1,2... 연산 : 사칙연산 제약조건 :정수의 제한 2.5는 정수가 아님 관계형 데이터 모델을 사용하는 이유 - 모델의 구조가 단순함 - 집합 이론이라는 수학족 이론에 기반하여 모델이 강건함 - SQL이라는 간단한 비절차적 언어로 사용하기 쉬움 관계형 데이터 모델 - 구조 : 릴레이션 (또는 ..

반응형