שאלה בנוגע לשימוש בנתונים


0

שלום, 
אשמח לשאלה בנוגע לתרגיל. (מצ׳׳ב צילום מסך של חלק 1)

בתרגיל בחלק זה, רשום לא לקחת בחשבון את הid  + dignosisֿ 

אך אשמח לוודא, האם כן אמורים להתייחס לפרמטרים אלה בחלק 2 בתרגיל? (PCA), ובפרט בהתייחסות לשונות? (dispersion)

תודה מראש


1 Answer

0

לא. אין להשתמש בהם בPCA או בשום מקום אחר.

האם ה-id יכול לעזור לך לסווג? לבצע רגרסיה? לא. במובן  הזה, הוא סוג של מטה-דאטה. נתונים על הנתונים.

לגבי ה-diagnosis. ביקשתי שתסמנו אותו כך ותוציאו אותו מהנתונים, כי אחרת יהיה "קל" מאוד לבצע קלאסטרינג.