빅데이터-비정형 데이터마이닝 배우기
빅데이터-비정형 데이터마이닝 배우기 ◆ 비정형 데이터마이닝의 개요 비정형 데이터마이닝은 구조화되지 않은 다양한 형식의 데이터에서 유용한 정보를 추출하기 위한 기술입니다. 이를 위해 텍스트, 이미지, 비디오, 음성, 센서 데이터 등 다양한 형식을 분석하고 처리합니다. 일반적으로 비정형 데이터마이닝의 프로세스는 다음과 같습니다. 1. 데이터 수집 : 비정형 데이터를 수집합니다. 웹 사이트에서 스크랩, 소셜 미디어에서 수집, 디지털 문서, 이메일, 고객 의견 등을 수집하는 것이 가능합니다. 2. 데이터 전처리 : 수집한 데이터를 정제하고 구조화합니다. 이를 위해 텍스트 마이닝, 이미지 분석, 비디오 처리, 음성 인식, 자연어 처리등의 기술을 사용합니다. 3. 특정 추출 : 데이터에서 특징을 추출합니다. 이 과..
빅데이터 분석 기법과 데이터마이닝 이해하기
빅데이터 분석 기법과 데이터마이닝 이해하기 ◆ 빅데이터 분석 기법과 데이터마이닝 빅데이터 분석기법과 데이터마이닝은 대부분이 경우 빅데이터를 분석하여 비즈니스 인텔리젼스 및 예측, 의사결정을 위한 기술입니다. 빅데이터 분석기법은 빅데이터를 처리 및 분석하기 위한 기술 전반을 의미할 수 있으며, 데이터 수집, 전처리, 저장, 분석, 시각화 등 모든 과정을 포함합니다. 이 기술은 데이터 구조화, 병렬 처리, 분산 처리, 클라우드 기술 등을 활용하며, 높은 확장성과 성능을 제공합니다. 데이터마이닝은 머신러닝 및 통계기술을 활용하여 대규모 데이터 세트에서 의미 있는 정보 및 패턴을 추출하는 과정입니다. 이 기술은 분류, 예측, 클러스터링, 연관성 분석 등 다양한 기법을 사용하여, 데이터의 내재된 구조 및 상호 관..