최근에 화두가 되고 있는 머신러닝에 대해서 알아보고 있는 중입니다.

머신러닝 정의

Arthur Lee Samuel : 컴퓨터에 명시적으로 프로그래밍 하지 않고도 배우는 능력을 주는 연구분야

머신러닝을 배우기 위한 전제조건

- Linear Algebra(선형 대수학), Multivariate Calculas(다변량 미적분학)

- Statistics(통계) : 머신러닝에서 가장 중요한 것은 데이터이다. 80%시간을 데이타를 모으고 정제하는 작업에 소요된다.

통계는 데이터를 모으고, 분석하고, 표현하는 분야이다. 통계에서 중요한 컨셉중에 하나는 Statistical Significance, Probability Distributions, Hypothesis Testing, Regression etc.

Bayesian Thinking is also a very important part of ML which deals with various concepts like Conditional Probability, Priors, and Posteriors, Maximum Likelihood, etc

- Python

쉽게 기대되는 머신러닝 분야

- 말인식(speech recognition) : 머신러닝 알고리즘 => Hidden Markov Models

- computer vision

- google's self driving car

쉽게 기대되지 않는 머신러닝 분야

- amazon's production recommandation

- youtube / netflix

- datamining / big data

- stock market / housing finance / real estate

케글 도전과제

Titanic: Machine Learning from Disaster: The Titanic: Machine Learning from Disaster challenge is a very popular beginner project  for ML as it has multiple tutorials available. 
So it is a great introduction to ML concepts like data exploration, feature engineering, and model tuning.
Digit Recognizer: The Digit Recognizer is a project after you have some knowledge of Python and ML basics. 
It is a great introduction into the exciting world neural networks using a classic dataset which includes pre-extracted features.

관련용어를 정리해 보자. 

먼저 모델(가설)을 잡아보면, 과일을 판별하는 모델을 만들어 보고자 합니다.

용어를 추출해 보면 모델(Model), 가설(Hypothesis), 과일, 판별 이 있을 수 있다.

과일은 Target(Label)로 정의할수 있고, 판변을 하기 위해서는 Target의 특징이 필요하다.

여기서 특징이 Feature 가 된다.

1. Model(Hypothesis) : 데이타로 부터 결과물을 얻을수 있는 특별한 표현물

2. Feature : 데이타. 과일로 보면 색상, 냄새, 맛 등이 될 것이다.

3. Target(Label) : 위 모델에 의해 예측되어 지는 것. 과일

4. Training : 쌍으로 이루어진 feature, target 을 주어서 훈련하는 것

5. Prediction :  Traning 된 모델이 준비되면 Input 에 대한 Output을 예측할수 있다.

 

블로그 이미지

희망잡이

,