outlier 라는 점이 있습니다. 예외점 이라고 하던가요?
통계학에서 보면 하나만 외톨이처럼 떨어져 있는 점인데,
이 점 때문에 통계학으로부터 세워진 여러 수학적 모델들이 제대로 작동 못하는 경우가 많습니다.
그러나 이런 점을 고려하자니 너무 할일이 많아지고,
이런 점을 고려 안하자니 기존 data를 대표할만한 모델을 세우기가 어렵고,
...아무튼 그렇습니다.
그래서 많은 학자들로부터 data의 경향성을 추정하여 분류하기 위한 많은 방법들이 제안되고 있습니다.
벌써 수십년전부터 쓰이고 있는 주성분분석(PCA), Support Vector Machine(SVM) 등등.
인공지능으로는 신경망(Neural Network), HMM(Hidden Markov Model) 등,
이미 수업시간에나 배웠을 법한 그런 방법들이 세상엔 널려있습니다.
이런 방법론들이 응용되는 사례는 다음과 같습니다.
가령 바다에서 잡힌 물고기들을 각 어종에 맞게 분류하여 출하하는 컨베이어 시스템.
자동차 안에서 주변 소음에 강인하게 사람 목소리를 인식할 수 있는 음성인식기.
인터넷 사이트에서 흔히 떠도는 포르노 사진들을 자동으로 선별하여 아동들에게 보이지 않도록 막는 유해차단기능.
...
...하지만 이 모든 방법론들도 단 하나의 최적화된 방법론을 당하지 못합니다.
이 방법론은 비록 약간은 주관적이라는 단점은 있지만,
일정한 기준을 정해주면 알아서 척척 data를 분류해주는 그런 생체 기계가 있습니다.
바로 사람입니다. 사람이 하면 되는거죠.
(그 한계는 어디까지인지는 모르겠으나)
실제로 네이버와 같은 검색 사이트는 사람이 어느 정도 수작업을 해준다고 합니다.
그렇지만 우리에게 있어서는 정말 쓰기 편한 사이트이지요. 안그렇습니까?



2006/12/03 18:56
2006/12/03 22:44
2006/12/03 20:45
2006/12/03 22:44
그리고 쓸데없는 작업은 자동화하는 것.
컴퓨터와 인간의 완벽한 융합인거같습니다. 멋지죠?
2006/12/04 21:38
2006/12/05 03:31
컴퓨터가 인간의 많은 영역을 점유해가고는 있다지만,
인간도 할일은 있겠죠 :3