سوال: در مورد missing value حذف کردنش بهتره یا اینکه پر کردنش با میانگین؟

پاسخ: تا جایی که ممکن هست، دیتاهامون رو حذف نکنیم، بهتره. اما گاهاً دیتاست ما اونقدر بزرگ هست که اگر بخش خیلی کوچکی از اون رو بزاریم کنار، باز هم نتیجه‌ی بدی نخواهیم گرفت. ولی دقت کن که همیشه داده‌های گمشده رو با میانگین پر نمی‌کنند، میتونیم با مد یا میانه هم اونها رو جایگزین کنیم. توصیه میکنم دو تا ویدیو از همکارمون، آقای دکتر توماج، در خصوص مدیریت داده‌های گمشده رو در آدرس زیر ببینید

در این دو ویدیو روش‌هایی رو برای مدیریت کردن داده‌های گمشده بیان می‌کنند