Vista l'importanza delle frequenze alleliche in studi genetici, è estremamente importante essere in grado di stimare attendibilmente. Tradizionalmente, le frequenze alleliche sono state semplicemente stimate contando il numero di volte ogni allele era stato visto in un campione dalla popolazione. Questo approccio è stato spesso utilizzato con successo su dati genotipo SNP e dati di sequenziamento Sanger perché i genotipi di ogni singolo potrebbe spesso essere determinato senza ambiguità. Tuttavia, questo approccio potrebbe non riuscire quando applicato ai dati da tecnologia di sequenziamento di prossima generazione. In primo luogo, i dati di sequenziamento di nuova generazione hanno un tasso di errore superiore a quello tradizionale sequenziamento Sanger o saggi di genotipizzazione SNP. In secondo luogo, al fine di sequenziare più campioni, il ricercatore spesso sequenza ogni individuo con copertura superficiale. Così, ogni base sarà coperto solo da poche legge, il che rende più difficile dedurre con precisione il genotipo di un individuo in un determinato sito. Infine, perché la legge da tecnologie di sequenziamento di prossima generazione e spesso piuttosto breve, altri errori possono verificarsi quando si cerca di allineare la legge breve che torna al genoma di riferimento. Per queste ragioni, la stima delle frequenze alleliche rimane difficile.