Definition af "statistisk identitet"?
Jeg har forgæves prøvet at finde en definition af statistisk identitet.
Det ser ud til at være et udtryk der kun bruges meget sjældent.
Hvis nogen kan finde en reference der kan forklare præcis, hvad det betyder i den sammenhæng det er brugt her, vil det hjælpe utrolig meget i forhold til at forstå, hvad der præcis er de har vist.
Jeg har en snigende mistanke om at de essentielt bare viser at de elektroniske bedømmelser har en tilsvarende fordelingsfunktion med samme gennemsnit og spredning som de menneskelige bedømmelser.
Hvis vi antager at de menneskelige bedømmere er nogenlunde konsistente over tid, vil man kunne lave et program der kan præstere en tilsvarende statistisk identisk bedømmelse helt uden at læse noget som helst - simpelthen ved at give karakterer i et fast mønster der har en fordeling svarende til den menneskelige.
Hvis der i stedet er tale om at der er en korrelation tæt på 1 mellem de menneskelige bedømmelser og de på forhånd givne computerbedømmelser af nye essays (altså dem der ikke var med i det oprindelige træningssæt) er der måske noget at komme efter.




Kommentarer (3)