데이터 스무딩 정의 및 예 |
BOYFRIENDë³´ì�´í ë ë ë ´ ì ¬ì � ì �ë ì§ ë§ Dance Ver Music Video www bajaryoutube com
차례:
정의:
데이터 스무딩 은 데이터 세트에서 아웃 라이어를 제거하여
작동 방식 (예):
예를 들어, 대학에서 지난 10 년간의 범죄 데이터를 분석하고 있다고 가정 해 봅시다. 폭력 범죄의 수는 다음과 같습니다:
보시다시피 대학에서는 대개 15 건 미만의 범죄를 경험합니다. 그러나 2006 년과 2007 년에는 대학의 공공 안전 팀의 실험적보고 요구로 인해 44 세의 경험이있었습니다. 보고 실험은 폭력 범죄의 정의를 변경하여 그 기간 동안 어떤 종류의 절도 행위도 포함시켜 캠퍼스에서 폭력적인 범죄가 크게 증가했습니다. 이 기간을 평균에 포함 시키면 즉, 데이터를 원활하게 처리하면 대학에서 평균 19 건의 폭력 범죄가 발생합니다. 그러나 우리가 그 해를 떠나면, 현실적인 평균은 13 건의 폭력 범죄로 32 %의 차이가 있음을 알 수 있습니다.
중요한 이유:
평균 및 알고리즘. 데이터 평활화는 패턴을보다 쉽게 보이게하므로 주가, 고객 동향 또는 기타 비즈니스 정보의 변화를 예측하는 데 도움이됩니다. 그러나 데이터 스무딩은 주요 정보를 간과하거나 중요한 사실을 덜 보일 수 있습니다. 즉, 데이터의 "가장자리를 반올림"하면 특정 데이터가 지나치게 강조되고 다른 데이터는 무시 될 수 있습니다.