Skip to main content

Hvad er statistisk klassificering?

Statistisk klassificering er opdelingen af data i meningsfulde kategorier til analyse.Det er muligt at anvende statistiske formler på data for at gøre dette automatisk, hvilket muliggør databehandling i stor skala som forberedelse til analyse.Nogle standardiserede systemer findes for almindelige typer data som resultater fra medicinske billeddannelsesundersøgelser.Dette gør det muligt for flere enheder at evaluere data med de samme målinger, så de let kan sammenligne og udveksle oplysninger.

Når forskere og andre parter indsamler data, kan de tildele dem til at løse kategorier på grundlag af lignende egenskaber.De kan også udvikle formler til at klassificere deres data, når de kommer ind, automatisk opdele dem i specifikke statistiske klassifikationer.Når de indsamler information, ved forskere muligvis ikke meget om deres data, hvilket gør det vanskeligt at klassificere.Formler kan identificere vigtige funktioner, der skal bruges som potentielle kategoriidentifikatorer.

Behandling af data kræver statistisk klassificering for at adskille forskellige slags oplysninger til analyse og sammenligning.I en folketælling skal for eksempel være i stand til at udforske flere parametre for at tilvejebringe en meningsfuld vurdering af de data, de indsamler.Ved hjælp af erklæringer om folketællingsformer kan en statistisk klassificeringsalgoritme adskille forskellige typer husholdninger og enkeltpersoner på grundlag af information som alder, husholdningskonfiguration, gennemsnitlig indkomst osv.at arbejde.Kvalitativ information kan være for subjektiv.Som et resultat er forskere nødt til at designe dataindsamlingsmetoder omhyggeligt for at få information, de faktisk kan bruge.I et klinisk forsøg kunne observatører for eksempel bruge formularer under opfølgningsundersøgelser bruge en scoringsrubrik til at vurdere patientens sundhed.I stedet for en kvalitativ vurdering som "patienten ser godt ud", kunne forskeren tildele en score på syv i en skala, som en formel kunne bruge til at behandle dataene.

Statistikere bruger en række teknikker til statistisk klassificering og udvikling afpassende formler til at behandle deres data.Fejl i dette trin i dataanalyse kan forværres over senere forskning og analyse.Det er vigtigt at tænke på arten af datasættet, de oplysninger, folk ønsker at trække ud af det, og hvordan materialet vil blive brugt.I formelle papirer er forskere nødt til at diskutere det statistiske klassificeringssystem, de valgte at bruge, og mange leverer også rå data for at give korrekturlæsere mulighed for at se på oplysningerne for sig selv for at bestemme gyldigheden af de konklusioner, der er nået i undersøgelsen.