سوال: در مورد missing value حذف کردنش بهتره یا اینکه پر کردنش با میانگین؟
پاسخ: تا جایی که ممکن هست، دیتاهامون رو حذف نکنیم، بهتره. اما گاهاً دیتاست ما اونقدر بزرگ هست که اگر بخش خیلی کوچکی از اون رو بزاریم کنار، باز هم نتیجهی بدی نخواهیم گرفت. ولی دقت کن که همیشه دادههای گمشده رو با میانگین پر نمیکنند، میتونیم با مد یا میانه هم اونها رو جایگزین کنیم. توصیه میکنم دو تا ویدیو از همکارمون، آقای دکتر توماج، در خصوص مدیریت دادههای گمشده رو در آدرس زیر ببینید
در این دو ویدیو روشهایی رو برای مدیریت کردن دادههای گمشده بیان میکنند