본문 바로가기

Data about...

데이터 과학 vs 빅데이터 vs 데이터 분석

반응형

데이터는 어디 에나 있습니다. 실제로 존재하는 디지털 데이터의 양은 빠른 속도로 증가하여 매 2 년마다 두 배가되고 우리가 사는 방식을 바꿉니다. IBM에 따르면 2012 년에 25 억 기가 바이트 (GB)의 데이터가 매일 생성되었습니다.


포브스 (Forbes) 의 기사에 따르면, 데이터가 이전보다 더 빠르게 증가하고 있으며, 2020 년경에는 지구상의 모든 인간에 대해 매초 1.7 메가 바이트의 새로운 정보가 생성 될 것입니다.


최소한이 분야의 기본 사항을 아는 것은 매우 중요합니다. 결국 여기에 우리의 미래가 놓여 있습니다.


이 기사에서는 데이터 과학, 빅 데이터 및 데이터 분석을 그 기능, 사용 위치, 현장에서 전문가가되기 위해 필요한 기술 및 각 분야의 급여 전망을 기준으로 차별화 할 것입니다.



1) 데이터 과학 : 구조화되지 않은 구조화 된 데이터를 다루는 데이터 과학은 데이터 정리, 준비 및 분석과 관련된 모든 것을 포함하는 분야입니다.


데이터 과학은 통계, 수학, 프로그래밍, 문제 해결, 독창적 인 방식으로 데이터를 캡처, 사물을 다르게 볼 수있는 기능 및 데이터 정리, 준비 및 정렬 작업을 결합한 것입니다.


간단히 말하면 데이터에서 통찰력과 정보를 추출 할 때 사용되는 기술의 산물입니다.



2) Big Data : Big Data는 존재하는 기존 응용 프로그램으로 효과적으로 처리 할 수없는 엄청난 양의 데이터를 나타냅니다. 빅 데이터의 처리는 집계되지 않은 원시 데이터로 시작되어 단일 컴퓨터의 메모리에 저장하는 것이 가장 어렵습니다.


구조화되지 않은 구조와 구조화 된 엄청난 양의 데이터를 설명하는 데 사용되는 전문 용어 인 Big Data는 일상적으로 비즈니스를 침범합니다. 빅 데이터는 더 나은 의사 결정과 전략적 비즈니스로 이어질 수있는 통찰력을 분석하는 데 사용할 수 있습니다.


가트너 (Gartner)가 제공 한 빅 데이터 (Big Data)의 정의는 다음과 같습니다. "빅 데이터는 비용 효율적이고 혁신적인 정보 처리 방식을 필요로하는 대용량 및 고속 및 / 또는 다양한 정보 자산으로 통찰력, 및 프로세스 자동화 "를 제공합니다.


당신도 고소득자 클럽에 가입 할 수 있습니다. 데이터 과학 석사 프로그램에 등록하면 더 많은 수익을 올릴 수 있습니다.


3) 데이터 분석 : 데이터 분석 은 해당 정보에 대한 결론을 도출 할 목적으로 원시 데이터를 조사하는 과학입니다.


데이터 분석에는 통찰력을 이끌어 내기 위해 알고리즘 또는 기계 프로세스를 적용하는 것이 포함됩니다. 예를 들어 서로간에 의미있는 상관 관계를 찾기 위해 여러 데이터 세트를 실행합니다.


이것은 많은 기업에서 조직과 회사가 기존의 이론이나 모델을 검증하고 반증 할뿐만 아니라 더 나은 의사 결정을 내릴 수있게합니다.


데이터 분석의 핵심은 추론에 있습니다. 추론은 연구자가 이미 알고있는 결론을 기반으로 결론을 도출하는 과정입니다.


R로 데이터 과학 교육의 과정 미리보기를 확인할 수 있습니다.



각 분야의 응용

데이터 과학의 응용 :


인터넷 검색 : 검색 엔진은 데이터 과학 알고리즘을 사용하여 몇 초 만에 최상의 검색 결과를 제공합니다.


디지털 광고 : 전체 디지털 마케팅 스펙트럼은 디스플레이 배너에서 디지털 광고판에 이르기까지 데이터 과학 알고리즘을 사용합니다. 이것이 디지털 광고가 전통적인 광고보다 클릭률 (CTR)이 높아지고있는 이유입니다.


추천 시스템 : 추천 시스템은 수십억 개의 제품에서 관련 제품을 쉽게 찾을 수있을뿐만 아니라 사용자 경험에 많은 것을 추가합니다. 많은 회사가 사용자의 요구와 정보의 관련성에 따라 제품 및 제안을 홍보하기 위해이 시스템을 사용합니다. 권장 사항은 사용자의 이전 검색 결과를 기반으로합니다.



빅 데이터 애플리케이션 :


금융 서비스를위한 빅 데이터 : 신용 카드 회사, 소매 은행, 개인 자산 관리 자문, 보험 회사, 벤처 펀드 및 기관 투자 은행은 금융 서비스를 위해 큰 데이터를 사용합니다. 그들 사이에 공통적 인 문제는 모두 큰 데이터로 해결할 수있는 여러 이질적인 시스템에 존재하는 다차원 데이터의 엄청난 양입니다. 따라서 큰 데이터는 다음과 같은 여러 가지 방식으로 사용됩니다. 


고객 분석

규정 준수 분석

사기 분석

운영 분석

통신 분야의 빅 데이터 : 통신 서비스 제공 업체는 새로운 가입자 확보, 고객 유치 및 현재 가입자 기반 확대를 최우선 과제로 삼고 있습니다. 이러한 과제에 대한 해결책은 매일 생성되는 고객 생성 데이터 및 기계 생성 데이터의 대량을 결합하고 분석하는 능력에 있습니다.


소매업을위한 빅 데이터 : Brick and Mortar 또는 온라인 e-tailer, 게임을 유지하고 경쟁에 대한 해답은 고객이 더 잘 서비스 할 수 있도록 이해하는 것입니다. 이를 위해서는 웹 로그, 고객 거래 데이터, 소셜 미디어, 매장 브랜드의 신용 카드 데이터 및 로열티 프로그램 데이터를 포함하여 회사가 매일 처리하는 모든 이질적인 데이터 소스를 분석 할 수 있어야합니다.



데이터 분석의 응용 :


건강 관리 : 비용 압박을받는 병원의 주요 과제는 치료의 질 향상에 유의하면서 효율적으로 환자를 치료하는 것입니다. 장비 및 기계 데이터는 병원에서 사용되는 환자 흐름, 치료 및 장비를 추적하고 최적화하는 데 점점 더 많이 사용되고 있습니다. 글로벌 의료비 절감액으로 63 %가 넘는 1 %의 효율 증가가있을 것으로 예상됩니다.


여행 : 데이터 분석은 모바일 / 웹 로그 및 소셜 미디어 데이터 분석을 통해 구매 경험을 최적화 할 수 있습니다. 여행지는 고객의 욕구와 선호도에 대한 통찰력을 얻을 수 있습니다. 현재 판매를 사용자 정의 패키지 및 오퍼를 통해 후속 탐색 브라우징 - 구매 전환으로 연관시킴으로써 제품을 판매 할 수 있습니다. 개인화 된 여행 추천은 소셜 미디어 데이터를 기반으로 한 데이터 분석에 의해 전달 될 수도 있습니다.


게임 : 데이터 분석은 데이터를 수집하여 게임 내외에서 최적화하고 지출 할 수 있도록 도와줍니다. 게임 회사는 싫어하는 것, 관계 및 사용자의 좋아하는 것에 대한 통찰력을 얻습니다.


에너지 관리 : 대부분의 회사는 유틸리티 회사의 스마트 그리드 관리, 에너지 최적화, 에너지 분배 및 빌딩 자동화를 포함하여 에너지 관리를 위해 데이터 분석을 사용하고 있습니다. 여기에서 응용 프로그램은 네트워크 장치의 제어 및 모니터링, 승무원 파견 및 서비스 중단 관리에 중점을 둡니다. 유틸리티는 수백만 개의 데이터 포인트를 네트워크 성능에 통합 할 수있는 능력을 부여받으며 엔지니어가 분석을 사용하여 네트워크를 모니터링 할 수 있습니다.



필요한 기술

데이터 과학자가 되려면 :


교육 : 88 %는 석사 학위를, 46 %는 박사 학위를 소지하고 있습니다.


SAS 및 / 또는 R에 대한 심층적 인 지식 : 데이터 과학에서 R이 일반적으로 선호됩니다.


Python 코딩 : Python은 Java, Perl, C / C ++와 함께 데이터 과학에 사용되는 가장 일반적인 코딩 언어입니다.


Hadoop 플랫폼 : 항상 요구 사항은 아니지만 Hadoop 플랫폼을 아는 것이 여전히 현장에서 선호됩니다. 하이브 (Hive) 또는 돼지 (Pig)에서 약간의 경험을 쌓은 것도 큰 판매 포인트입니다.


SQL 데이터베이스 / 코딩 : NoSQL 과 Hadoop이 데이터 과학 배경의 주요 부분이되었지만 복잡한 쿼리를 SQL로 작성하고 실행할 수 있다면 여전히 선호됩니다.


체계화되지 않은 데이터로 작업하기 : 데이터 과학자가 소셜 미디어, 비디오 피드 또는 오디오와 같은 비정형 데이터로 작업 할 수 있다는 것이 가장 중요합니다.



빅 데이터 전문가가 되려면 :


분석 기술 : 당신이 얻는 데이터 더미를 이해할 수있는 능력. 분석 능력을 통해 문제 해결과 같은 솔루션과 관련이있는 데이터를 결정할 수 있습니다.


창의력 : 데이터 전략을 수집, 해석 및 분석 할 수있는 새로운 방법을 만들어야합니다. 이것은 소유하기에 매우 적합한 기술입니다.


수학 및 통계 기술 : Good, old-fashioned "number crunching". 이는 데이터 과학, 데이터 분석 또는 큰 데이터에서 매우 중요합니다.


컴퓨터 과학 : 컴퓨터는 모든 데이터 전략의이면에 있습니다. 프로그래머는 데이터를 통찰력으로 처리하는 알고리즘을 고안해야 할 필요가 있습니다.


비즈니스 기술 : 빅 데이터 전문가는 비즈니스 성장뿐만 아니라 이익을 창출하는 기본 프로세스는 물론 비즈니스 목표에 대한 이해가 필요합니다.



데이터 분석가되기 :


프로그래밍 기술 : 프로그래밍 언어를 아는 것은 R 및 Python은 모든 데이터 분석가에게 매우 중요합니다.


통계 기술 및 수학 : 기술 및 추론 통계 및 실험 설계는 데이터 과학자에게 필수입니다.


기계 학습 기술


데이터 wrangling 기술 : 원시 데이터를 매핑하고 데이터를보다 편리하게 사용할 수있는 다른 형식으로 변환하는 기능.


커뮤니케이션 및 데이터 시각화 기술


데이터 직관력 : 전문가가 데이터 분석가처럼 생각할 수 있어야합니다.



출처-https://www.simplilearn.com/data-science-vs-big-data-vs-data-analytics-article

반응형

'Data about...' 카테고리의 다른 글

데이터 과학  (0) 2018.10.20