سؤال: سلام، در ویدیو جلسه 16 – بخش 2- دقیقه 27:40، عدد 0.99 یا در ادامش 0.01 برای quantile بر چه اساسی انتخاب کردیم؟ همیشه همین اعداد رو در نظر میگیریم؟ یعنی همیشه برای اصلاح tail ها داده های کمتر از 99 درصد یا 1 درصد کل داده ها رو در نظر میگیریم؟ یا بر اساس تجربست؟ اگر بر اساس تجربه است میشه راهنماییمون کنید که رایج ترین مقدارها چند هستن؟
پاسخ: نه قانون و قاعده خاصی نداره و همه چیز دست تحلیلگر هست. ولی خب هر چقدر کمتر دیتا رو کنار بزاریم، بهتره. مثلاً شما میتونید بجای ۹۹ درصد از ۹۷ استفاده کنید که فاصله ماکسیمم و میانگین، باز هم کمتر بشه.
جلوتر که به یادگیری ماشین برسیم میبینیم که یکی از چالشهای اساسی کار با این الگوریتمها و تحلیلها اینه که عموماً قاعدهی مشخص و استانداردی وجود نداره و فقط باید چندین بار کارهایی گوناگونی انجام بدهیم تا بفهمیم کدوم بهینهتر هست