Ի՞նչ է Holdout հավաքածուն: Երբեմն, որը կոչվում է «փորձարկման» տվյալ, պահվող ենթաբազմությունը ապահովում է մեքենայական ուսուցման մոդելի վերջնական գնահատականը այն բանից հետո, երբ այն վերապատրաստվել և վավերացվել է: Holdout հավաքածուները երբեք չպետք է օգտագործվեն որոշումներ կայացնելու համար, թե որ ալգորիթմներն օգտագործել կամ բարելավել կամ կարգավորել ալգորիթմները:
Արդյո՞ք խաչաձև վավերացումը ավելի լավ է, քան պահումը:
Խաչակի վավերացումը սովորաբար նախընտրելի մեթոդն է, քանի որ այն հնարավորություն է տալիս ձեր մոդելին մարզվել մի քանի գնացքի թեստի բաժանումներով: Սա ձեզ ավելի լավ ցույց է տալիս, թե որքան լավ կգործի ձեր մոդելը չտեսնված տվյալների վրա: Մյուս կողմից, պահումը կախված է միայն մեկ գնացքի թեստի բաժանումից:
Ի՞նչ է անհապաղ մոտեցումը:
Holdout մեթոդը դասակարգիչի գնահատման ամենապարզ մեթոդն է: Այս մեթոդով տվյալների հավաքածուն (տվյալների տարրերի կամ օրինակների հավաքածու) բաժանվում է երկու խմբի, որոնք կոչվում են ուսուցման հավաքածու և թեստային հավաքածու: Դասակարգիչը կատարում է տվյալ հավաքածուի տվյալների տարրերը թիրախային կատեգորիայի կամ դասի վերագրելու գործառույթ:
Պե՞տք է միշտ կատարեմ խաչաձև վավերացում:
Ընդհանուր խաչաձև վավերացումը միշտ անհրաժեշտ է, երբ դուք պետք է որոշեք մոդելի օպտիմալ պարամետրերը, լոգիստիկ ռեգրեսիայի համար սա կլինի C պարամետրը:
Ո՞րն է K-fold cross վավերացման առավելությունը:
եթե համեմատում եք թեստային-MSE-ները k-ապատիկի չափով CV-ի դեպքում ավելի լավն են, քան LOOCV-ը: k-fold CV-ն կամ CV-ի ցանկացած կամ նմուշառման մեթոդներ՝ ոչբարելավել փորձարկման սխալները. նրանք գնահատում են թեստի սխալները: k-fold-ի դեպքում սխալը գնահատելու ավելի լավ աշխատանք է կատարում, քան LOOCV: