پیش-پردازش داده - ویکیپدیا، دانشنامهٔ ...
پیش-پردازش داده به معنای تغییر یا دور انداختن بخشی از داده قبل از این که برای بهتر کردن کارایی استفاده شود است و همچنین یک مرحله مهم از فرآیند داده کاوی میباشد. اصطلاح ورودی زباله، خروجی زباله برای پروژه های داده کاوی و یادگیری ماشینی صادق است. معمولا روش های گرادآوری داده کنترل خاصی ندارند و باعث میشوند به مقادیر غیر واقعی برخورد بکنیم. (برای مثال کشور محل تولد: ایران ، شهر محل تولد: سیدنی) پردازش چنین دادهای که با دقت کنترل نشده است میتواند منجر به نتیجههای گمراه کننده شود. به همین دلیل کنترل کیفیت داده اولین فاز پروژه میباشد و قبل از اجرای هر پردازش دیگری انجام میشود. پیش-پردازش داده معمولا مهمترین قسمت یک پروژه یادگیری ماشینی می باشد، مخصو