Il quadro di campionamento deve essere rappresentativo della popolazione e questa è una questione al di fuori dell’ambito della teoria statistica che richiede il giudizio di esperti nella particolare materia oggetto di studio. Tutte le cornici di cui sopra omettono alcune persone che voteranno alle prossime elezioni e contengono alcune persone che non lo faranno; alcune cornici conterranno più record per la stessa persona. Le persone non presenti nel quadro non hanno alcuna prospettiva di essere campionate.
Perché un quadro basato su cluster contiene meno informazioni sulla popolazione, può porre dei vincoli al disegno del campione, forse richiedendo l’uso di metodi di campionamento meno efficienti e/o rendendo più difficile l’interpretazione dei dati risultanti.
La teoria statistica ci dice delle incertezze nell’estrapolazione da un campione al quadro. Ci si deve aspettare che i quadri di campionamento contengano sempre qualche errore. In alcuni casi, questo può portare a un errore di campionamento. Tale distorsione dovrebbe essere minimizzata e identificata, anche se evitarla completamente in un mondo reale è quasi impossibile. Non si dovrebbe inoltre dare per scontato che le fonti che affermano di essere imparziali e rappresentative siano tali.
Nella definizione della struttura, è necessario affrontare questioni pratiche, economiche, etiche e tecniche. La necessità di ottenere risultati tempestivi può impedire di estendere il quadro molto in là nel tempo. Le difficoltà possono essere estreme quando la popolazione e il quadro sono disgiunti. Questo è un problema particolare nelle previsioni dove le inferenze sul futuro sono fatte da dati storici. Infatti, nel 1703, quando Jacob Bernoulli propose a Gottfried Leibniz la possibilità di usare i dati storici di mortalità per prevedere la probabilità di morte precoce di un uomo vivente, Gottfried Leibniz riconobbe il problema rispondendo:
La natura ha stabilito dei modelli originati dal ritorno degli eventi ma solo per la maggior parte. Nuove malattie inondano la razza umana, così che, per quanti esperimenti abbiate fatto sui cadaveri, non avete imposto un limite alla natura degli eventi in modo che in futuro non possano variare.
– Gottfried Leibniz
Leslie Kish ha posto quattro problemi fondamentali delle cornici di campionamento:
- Elementi mancanti: Alcuni membri della popolazione non sono inclusi nel frame.
- Elementi mancanti: I non membri della popolazione sono inclusi nel quadro.
- Voci duplicate: Un membro della popolazione è censito più di una volta.
- Gruppi o cluster: Il frame elenca cluster invece di individui.
Problemi come quelli elencati possono essere identificati con l’uso di test pre-indagine e studi pilota.