데이터 과학
데이터 과학자는 디스크에 저장된 ASCII 텍스트, PDF, XML, JSON과 같은 다양한 형태의 데이터를 처리해야한다. 1.데이터를 분석을 수행하기 전에 먼저해야 하는 일은 다양한 형태의 데이터 소스로부터 데이터를 가져온 다음, 데이터 정제(data-cleaning)을 통해 데이터 내에 존재하는 노이즈를 제거해야 한다. 2. 데이터를 인덱싱하고 인덱싱된 데이터에서 검색을 한다. 3. 데이터를 분석한다. 기술통계, 빈도분포, 단순 회귀분석, 다중회귀분석, 상관계수와 공분산 등이 있다. 4. 머신러닝을 사용해 데이터의 패턴을 학습한다. 분류, 회귀, 군집합 머신러닝 작업