본문 바로가기

정보기술의 샘터........о♡/DB & 데이타마이닝

데이터 마이닝 알고리즘

데이터 마이닝 알고리즘


데이터 마이닝 알고리즘은 기계 학습 알고리즘(machine-learning algorithm)에 성능을 고려하여 동적인 실세계 데이터로부터 흥미 있는 패턴을 발견하는 알고리즘으로 출발해 지금은 다양한 기법과 혼합하여 사용되고 있습니다. 또한 순수 데이터 마이닝을 목적으로 알고리즘이 연구·개발되고 있습니다.
이들 알고리즘 중에 연관규칙이나 클러스터링과 같이 완전하게 데이터 마이닝 알고리즘으로 정착해 사용되는 것을 데이터 마이닝 지향(data mining-oriented) 알고리즘으로 구분합니다. 이에 반해 신경망(neural network)이나 의사결정 트리(decision tree), 유전자 알고리즘(genetic algorithm), 베이지안 알고리즘(bayesian algorithm)처럼 그 근원을 기계 학습 이론에 바탕을 두고 마이닝 문제 해결에 적용된 것을 기계 학습 지향(machine learning-oriented)으로 구별합니다. 특히 데이터 마이닝 지향 알고리즘들은 불확실하거나 누락된 데이터를 포함하기도 하고 수십만 개의 동적인 데이터를 처리하여 유용한 정보를 추출해 내는 만큼 끊임없이 성능개선을 위해 알고리즘이 개발되어 오고 있습니다.