Hej.
Har fått svar från KB:s systemutvecklare och kortfattat så fungerar ES relevansrankning så här:
Term frequency (TF): Ju oftare en sökterm förekommer i ett dokument desto högre upp rankas det
Inverse document frequency (IDF): Söktermer som förekommer ofta i hela sökmängden rankas lägre. På så sätt rankas ovanliga söktermer högre. Tänk att man söker på häst och annons i en datamängd som handlar om hästar. Då rankas annons högre.
Field length: Dokument som innehåller färre ord (där söktermen ingår), rankas högre än ett dokument som innehåller mycket text (där söktermen ingår)
Frassökning: Vid sökning på fras fast utan citattecken så rankas träffar med sökfrågans exakta ordföljd högre än träffar innehållande endast enskilda ord från sökfrågan.
Jonas Ahlberg