Τύποι δειγμάτων. Γενικός πληθυσμός και δειγματοληπτική μελέτη. Στατιστική εγκυρότητα

Σχέδιο:

1. Προβλήματα μαθηματικής στατιστικής.

2. Τύποι δειγμάτων.

3. Μέθοδοι επιλογής.

4. Στατιστική κατανομή του δείγματος.

5. Εμπειρική συνάρτηση κατανομής.

6. Πολύγωνο και ιστόγραμμα.

7. Αριθμητικά χαρακτηριστικά της σειράς παραλλαγών.

8. Στατιστικές εκτιμήσεις παραμέτρων κατανομής.

9. Διαστημικές εκτιμήσεις παραμέτρων κατανομής.

1. Εργασίες και μέθοδοι μαθηματικής στατιστικής

Στατιστικά μαθηματικών είναι ένας κλάδος των μαθηματικών αφιερωμένος στις μεθόδους συλλογής, ανάλυσης και επεξεργασίας των αποτελεσμάτων στατιστικών δεδομένων παρατήρησης για επιστημονικούς και πρακτικούς σκοπούς.

Ας απαιτείται η μελέτη ενός συνόλου ομοιογενών αντικειμένων σε σχέση με κάποιο ποιοτικό ή ποσοτικό χαρακτηριστικό που χαρακτηρίζει αυτά τα αντικείμενα. Για παράδειγμα, εάν υπάρχει μια παρτίδα εξαρτημάτων, τότε το πρότυπο του εξαρτήματος μπορεί να χρησιμεύσει ως ποιοτικό πρόσημο και το ελεγχόμενο μέγεθος του εξαρτήματος μπορεί να χρησιμεύσει ως ποσοτικό πρόσημο.

Μερικές φορές γίνεται συνεχής μελέτη, δηλ. εξετάστε κάθε αντικείμενο σε σχέση με το επιθυμητό χαρακτηριστικό. Στην πράξη, μια ολοκληρωμένη έρευνα χρησιμοποιείται σπάνια. Για παράδειγμα, εάν η συλλογή περιέχει πολύ μεγάλος αριθμόςαντικείμενα, τότε είναι φυσικά αδύνατο να διεξαχθεί μια συνεχής έρευνα. Εάν η έρευνα του αντικειμένου σχετίζεται με την καταστροφή του ή απαιτεί μεγάλο κόστος υλικού, τότε δεν έχει νόημα να πραγματοποιηθεί μια πλήρης έρευνα. Σε τέτοιες περιπτώσεις, ένας περιορισμένος αριθμός αντικειμένων (σετ δειγμάτων) επιλέγεται τυχαία από ολόκληρο τον πληθυσμό και υποβάλλεται στη μελέτη τους.

Το κύριο καθήκον της μαθηματικής στατιστικής είναι να μελετήσει ολόκληρο τον πληθυσμό με βάση δειγματοληπτικά δεδομένα, ανάλογα με τον στόχο, δηλ. η μελέτη των πιθανοτικών ιδιοτήτων του πληθυσμού: νόμος κατανομής, αριθμητικά χαρακτηριστικά κ.λπ. για τη λήψη διοικητικών αποφάσεων υπό συνθήκες αβεβαιότητας.

2. Τύποι δειγμάτων

Πληθυσμός είναι το σύνολο των αντικειμένων από τα οποία γίνεται το δείγμα.

Πληθυσμός δείγματος (δείγμα) είναι μια συλλογή από τυχαία επιλεγμένα αντικείμενα.

Μέγεθος πληθυσμού είναι ο αριθμός των αντικειμένων αυτής της συλλογής. Συμβολίζεται ο όγκος του γενικού πληθυσμούΝ, επιλεκτικό - n.

Παράδειγμα:

Εάν από τα 1000 μέρη επιλέγονται 100 μέρη για εξέταση, τότε ο όγκος του γενικού πληθυσμούΝ = 1000 και το μέγεθος του δείγματος n = 100.

Η δειγματοληψία μπορεί να γίνει με δύο τρόπους: αφού το αντικείμενο επιλεγεί και παρατηρηθεί πάνω του, μπορεί να επιστραφεί ή να μην επιστραφεί στον γενικό πληθυσμό. Οτι. τα δείγματα χωρίζονται σε επαναλαμβανόμενα και μη επαναλαμβανόμενα.

Αλλεπάλληλοςπου ονομάζεται δειγματοληψία, στο οποίο το επιλεγμένο αντικείμενο (πριν από την επιλογή του επόμενου) επιστρέφεται στον γενικό πληθυσμό.

Μη επαναλαμβανόμενοπου ονομάζεται δειγματοληψία, στο οποίο το επιλεγμένο αντικείμενο δεν επιστρέφεται στον γενικό πληθυσμό.

Στην πράξη, χρησιμοποιείται συνήθως η μη επαναλαμβανόμενη τυχαία επιλογή.

Για να μπορούν τα δεδομένα του δείγματος να κρίνουν με αρκετή σιγουριά για το χαρακτηριστικό ενδιαφέροντος στον γενικό πληθυσμό, είναι απαραίτητο τα αντικείμενα του δείγματος να το αντιπροσωπεύουν σωστά. Το δείγμα πρέπει να αντιπροσωπεύει σωστά τις αναλογίες του πληθυσμού. Το δείγμα πρέπει να είναι αντιπρόσωπος (αντιπρόσωπος).

Δυνάμει του νόμου μεγάλα νούμεραμπορεί να υποστηριχθεί ότι το δείγμα θα είναι αντιπροσωπευτικό εάν πραγματοποιηθεί τυχαία.

Εάν το μέγεθος του γενικού πληθυσμού είναι αρκετά μεγάλο και το δείγμα είναι μόνο ένα ασήμαντο μέρος αυτού του πληθυσμού, τότε η διάκριση μεταξύ επαναλαμβανόμενων και μη επαναλαμβανόμενων δειγμάτων διαγράφεται. Στην περιοριστική περίπτωση, όταν λαμβάνεται υπόψη ένας άπειρος γενικός πληθυσμός και το δείγμα έχει πεπερασμένο μέγεθος, αυτή η διαφορά εξαφανίζεται.

Παράδειγμα:

Στο αμερικανικό περιοδικό Literary Review, χρησιμοποιώντας στατιστικές μεθόδους, έγινε μια μελέτη προβλέψεων σχετικά με το αποτέλεσμα των επερχόμενων προεδρικών εκλογών στις ΗΠΑ το 1936. Οι υποψήφιοι για αυτή τη θέση ήταν ο F.D. Roosevelt και A. M. Landon. Τα βιβλία αναφοράς των τηλεφωνικών συνδρομητών λήφθηκαν ως πηγή για τον γενικό πληθυσμό των Αμερικανών που μελετήθηκαν. Από αυτές, επιλέχθηκαν τυχαία 4 εκατομμύρια διευθύνσεις, στις οποίες οι συντάκτες του περιοδικού έστειλαν καρτ ποστάλ ζητώντας τους να εκφράσουν τη στάση τους απέναντι στους υποψηφίους για την προεδρία. Μετά την επεξεργασία των αποτελεσμάτων της δημοσκόπησης, το περιοδικό δημοσίευσε μια κοινωνιολογική πρόβλεψη ότι ο Landon θα κέρδιζε τις επερχόμενες εκλογές με μεγάλη διαφορά. Και ... έκανα λάθος: ο Ρούσβελτ κέρδισε.
Αυτό το παράδειγμα μπορεί να θεωρηθεί ως παράδειγμα μη αντιπροσωπευτικού δείγματος. Γεγονός είναι ότι στις Ηνωμένες Πολιτείες στο πρώτο μισό του εικοστού αιώνα, μόνο το πλούσιο μέρος του πληθυσμού, που υποστήριζε τις απόψεις του Landon, είχε τηλέφωνα.

3. Μέθοδοι επιλογής

Στην πράξη, εφαρμόστε διάφορους τρόπουςεπιλογή, η οποία μπορεί να χωριστεί σε 2 τύπους:

1. Η επιλογή δεν απαιτεί τη διαίρεση του πληθυσμού σε μέρη (α) απλό τυχαίο χωρίς επανάληψη; σι) απλή τυχαία επανάληψη).

2. Επιλογή, στην οποία ο γενικός πληθυσμός χωρίζεται σε μέρη. (ΕΝΑ) τυπική επιλογή; σι) μηχανική επιλογή; V) κατα συρροη επιλογή).

Απλή τυχαία καλέστε αυτό επιλογή, στο οποίο τα αντικείμενα εξάγονται ένα προς ένα από ολόκληρο τον γενικό πληθυσμό (τυχαία).

Τυπικόςπου ονομάζεται επιλογή, στο οποίο τα αντικείμενα επιλέγονται όχι από ολόκληρο τον γενικό πληθυσμό, αλλά από κάθε ένα από τα «τυπικά» μέρη του. Για παράδειγμα, εάν ένα εξάρτημα κατασκευάζεται σε πολλά μηχανήματα, τότε η επιλογή δεν γίνεται από ολόκληρο το σύνολο των εξαρτημάτων που παράγονται από όλα τα μηχανήματα, αλλά από τα προϊόντα κάθε μηχανής ξεχωριστά. Αυτή η επιλογή χρησιμοποιείται όταν το χαρακτηριστικό που εξετάζεται παρουσιάζει σημαντικές διακυμάνσεις σε διάφορα «τυπικά» μέρη του γενικού πληθυσμού.

Μηχανικόςπου ονομάζεται επιλογή, στο οποίο ο γενικός πληθυσμός χωρίζεται «μηχανικά» σε όσες ομάδες υπάρχουν αντικείμενα που πρέπει να συμπεριληφθούν στο δείγμα και επιλέγεται ένα αντικείμενο από κάθε ομάδα. Για παράδειγμα, εάν πρέπει να επιλέξετε το 20% των εξαρτημάτων που κατασκευάζονται από το μηχάνημα, τότε επιλέγεται κάθε 5ο εξάρτημα. εάν απαιτείται να επιλέξετε το 5% των εξαρτημάτων - κάθε 20ο, κ.λπ. Μερικές φορές μια τέτοια επιλογή μπορεί να μην εξασφαλίζει αντιπροσωπευτικό δείγμα (αν επιλέγεται κάθε 20ος κύλινδρος περιστροφής και ο κόφτης αντικαθίσταται αμέσως μετά την επιλογή, τότε θα επιλεγούν όλοι οι κύλινδροι που έχουν περιστραφεί με αμβλεία κοπή).

Κατα συρροηπου ονομάζεται επιλογή, όπου τα αντικείμενα επιλέγονται από τον γενικό πληθυσμό όχι ένα κάθε φορά, αλλά σε «σειρές», τα οποία υποβάλλονται σε συνεχή έρευνα. Για παράδειγμα, εάν τα προϊόντα κατασκευάζονται από μια μεγάλη ομάδα αυτόματων μηχανών, τότε τα προϊόντα λίγων μόνο μηχανών υποβάλλονται σε συνεχή εξέταση.

Στην πράξη, χρησιμοποιείται συχνά συνδυασμένη επιλογή, στην οποία συνδυάζονται οι παραπάνω μέθοδοι.

4. Στατιστική κατανομή του δείγματος

Ας ληφθεί ένα δείγμα από τον γενικό πληθυσμό και η τιμή x 1-παρατηρήθηκε μια φορά, x 2 -n 2 φορές, ... x k - n k φορές. n= n 1 +n 2 +...+n k είναι το μέγεθος του δείγματος. Παρατηρούμενες τιμέςπου ονομάζεται επιλογές, και η ακολουθία είναι μια παραλλαγή γραμμένη με αύξουσα σειρά - μεταβλητές σειρές. Αριθμός παρατηρήσεωνπου ονομάζεται συχνότητες (απόλυτες συχνότητες)και τη σχέση τους με το μέγεθος του δείγματος- σχετικές συχνότητεςή στατιστικές πιθανότητες.

Εάν ο αριθμός των επιλογών είναι μεγάλος ή το δείγμα γίνεται από έναν συνεχή γενικό πληθυσμό, τότε η σειρά παραλλαγών συντάσσεται όχι από μεμονωμένες τιμές σημείων, αλλά από διαστήματα τιμών του γενικού πληθυσμού. Μια τέτοια σειρά ονομάζεται διάστημα.Τα μήκη των διαστημάτων πρέπει να είναι ίσα.

Η στατιστική κατανομή του δείγματος ονομάζεται λίστα επιλογών και οι αντίστοιχες συχνότητες ή σχετικές συχνότητες.

Η στατιστική κατανομή μπορεί επίσης να καθοριστεί ως μια ακολουθία διαστημάτων και των αντίστοιχων συχνοτήτων τους (το άθροισμα των συχνοτήτων που εμπίπτουν σε αυτό το διάστημα τιμών)

Η σειρά σημειακών μεταβολών των συχνοτήτων μπορεί να αναπαρασταθεί από έναν πίνακα:

x i
x 1
x2

x k
n i
ν 1
ν 2

nk

Ομοίως, μπορεί κανείς να αναπαραστήσει μια σημειακή μεταβλητή σειρά σχετικών συχνοτήτων.

Και:

Παράδειγμα:

Ο αριθμός των γραμμάτων σε κάποιο κείμενο Χ αποδείχθηκε ίσος με 1000. Το πρώτο γράμμα ήταν "i", το δεύτερο - το γράμμα "i", το τρίτο - το γράμμα "a", το τέταρτο - "u". Μετά ήρθαν τα γράμματα «ο», «ε», «υ», «ε», «σ».

Ας γράψουμε τις θέσεις που καταλαμβάνουν στο αλφάβητο, αντίστοιχα, έχουμε: 33, 10, 1, 32, 16, 6, 21, 31, 29.

Αφού διατάξουμε αυτούς τους αριθμούς με αύξουσα σειρά, παίρνουμε μια σειρά παραλλαγών: 1, 6, 10, 16, 21, 29, 31, 32, 33.

Οι συχνότητες εμφάνισης των γραμμάτων στο κείμενο: "a" - 75, "e" -87, "i" - 75, "o" - 110, "y" - 25, "s" - 8, "e" - 3, "yu "- 7," I "- 22.

Συνθέτουμε μια σημειακή μεταβλητή σειρά συχνοτήτων:

Παράδειγμα:

Καθορίζεται η κατανομή συχνότητας δειγματοληψίας όγκου n = 20.

Δημιουργήστε μια σειρά σημειακών μεταβολών σχετικών συχνοτήτων.

x i

2

6

12

n i

3

10

7

Λύση:

Βρείτε τις σχετικές συχνότητες:


x i

2

6

12

w i

0,15

0,5

0,35

Κατά την κατασκευή μιας κατανομής διαστήματος, υπάρχουν κανόνες για την επιλογή του αριθμού των διαστημάτων ή του μεγέθους κάθε διαστήματος. Το κριτήριο εδώ είναι η βέλτιστη αναλογία: με την αύξηση του αριθμού των διαστημάτων, η αντιπροσωπευτικότητα βελτιώνεται, αλλά ο όγκος των δεδομένων και ο χρόνος επεξεργασίας τους αυξάνεται. Διαφορά Η παραλλαγή x max - x min μεταξύ της μεγαλύτερης και της μικρότερης τιμής καλείται σε μεγάλη κλίμακαδείγματα.

Για να μετρήσετε τον αριθμό των διαστημάτωνκ συνήθως εφαρμόζουν τον εμπειρικό τύπο του Sturgess (που υποδηλώνει στρογγυλοποίηση στον πλησιέστερο κατάλληλο ακέραιο): k = 1 + 3,322 log n .

Αντίστοιχα, η τιμή κάθε διαστήματοςη μπορεί να υπολογιστεί χρησιμοποιώντας τον τύπο:

5. Εμπειρική συνάρτηση κατανομής

Εξετάστε ένα δείγμα από τον γενικό πληθυσμό. Ας είναι γνωστή η στατιστική κατανομή των συχνοτήτων του ποσοτικού χαρακτηριστικού X. Ας εισάγουμε τον συμβολισμό: n xείναι ο αριθμός των παρατηρήσεων στις οποίες παρατηρήθηκε τιμή χαρακτηριστικού μικρότερη από x. n συνολικός αριθμόςπαρατηρήσεις (μέγεθος δείγματος). Σχετική συχνότητα συμβάντος X<х равна n x /n . Αν το x αλλάξει, τότε αλλάζει και η σχετική συχνότητα, δηλ. σχετική συχνότηταn x /nείναι συνάρτηση του x. Επειδή βρίσκεται εμπειρικά, λέγεται εμπειρική.

Εμπειρική συνάρτηση κατανομής (συνάρτηση κατανομής δείγματος) καλέστε τη συνάρτηση, το οποίο καθορίζει για κάθε x τη σχετική συχνότητα του συμβάντος X<х.


πού είναι ο αριθμός των επιλογών μικρότερος από x,

n - μέγεθος δείγματος.

Σε αντίθεση με την εμπειρική συνάρτηση κατανομής του δείγματος, καλείται η συνάρτηση κατανομής F(x) του πληθυσμού συνάρτηση θεωρητικής κατανομής.

Η διαφορά μεταξύ της εμπειρικής και της θεωρητικής συνάρτησης κατανομής είναι ότι η θεωρητική συνάρτηση F (x) καθορίζει την πιθανότητα ενός γεγονότος X F*(x)τείνει κατά πιθανότητα στην πιθανότητα F (x) αυτού του γεγονότος. Δηλαδή για μεγάλα ν F*(x)και το F(x) διαφέρουν ελάχιστα μεταξύ τους.

Οτι. Συνιστάται η χρήση της συνάρτησης εμπειρικής κατανομής του δείγματος για μια κατά προσέγγιση αναπαράσταση της θεωρητικής (ολοκληρωτικής) συνάρτησης κατανομής του γενικού πληθυσμού.

F*(x)έχει όλες τις ιδιότητες F(x).

1. Αξίες F*(x)ανήκουν στο διάστημα.

2. Η F*(x) είναι μια μη φθίνουσα συνάρτηση.

3. Αν είναι η μικρότερη παραλλαγή, τότε F*(x) = 0, στο x < x1; αν x k είναι η μεγαλύτερη παραλλαγή, τότε F*(x) = 1, για x > x k .

Εκείνοι. F*(x)χρησιμεύει για την εκτίμηση της F(x).

Εάν το δείγμα δίνεται από μια μεταβλητή σειρά, τότε η εμπειρική συνάρτηση έχει τη μορφή:

Η γραφική παράσταση της εμπειρικής συνάρτησης ονομάζεται αθροιστική.

Παράδειγμα:

Σχεδιάστε μια εμπειρική συνάρτηση στη δεδομένη κατανομή δείγματος.


Λύση:

Μέγεθος δείγματος n = 12 + 18 +30 = 60. Η μικρότερη επιλογή είναι 2, δηλ. στο x < 2. Γεγονός Χ<6, (x 1 = 2) наблюдалось 12 раз, т.е. F*(x)=12/60=0,2στις 2 < Χ < 6. Γεγονός Χ<10, (x 1 =2, x 2 = 6) наблюдалось 12 + 18 = 30 раз, т.е.F*(x)=30/60=0,5 при 6 < Χ < 10. Επειδή Το x=10 είναι η μεγαλύτερη επιλογή, λοιπόν F*(x) = 1σε x>10. Η επιθυμητή εμπειρική συνάρτηση έχει τη μορφή:

Συσσωρεύω:


Η συσσώρευση καθιστά δυνατή την κατανόηση των πληροφοριών που παρουσιάζονται γραφικά, για παράδειγμα, για να απαντήσετε στις ερωτήσεις: «Προσδιορίστε τον αριθμό των παρατηρήσεων στις οποίες η τιμή του χαρακτηριστικού ήταν μικρότερη από 6 ή όχι μικρότερη από 6. F*(6) = 0,2 » Τότε ο αριθμός των παρατηρήσεων στις οποίες η τιμή του παρατηρούμενου χαρακτηριστικού ήταν μικρότερη από 6 είναι 0,2* n \u003d 0,2 * 60 \u003d 12. Ο αριθμός των παρατηρήσεων στις οποίες η τιμή του παρατηρούμενου χαρακτηριστικού δεν ήταν μικρότερη από 6 είναι (1-0,2) * n \u003d 0,8 * 60 \u003d 48.

Εάν δοθεί μια σειρά διαστημάτων παραλλαγής, τότε για να συνταχθεί η εμπειρική συνάρτηση κατανομής, βρίσκονται τα μέσα των διαστημάτων και λαμβάνεται από αυτά η συνάρτηση εμπειρικής κατανομής παρόμοια με τη σειρά σημειακής μεταβολής.

6. Πολύγωνο και ιστόγραμμα

Για λόγους σαφήνειας, κατασκευάζονται διάφορα γραφήματα της στατιστικής κατανομής: πολυωνυμικά και ιστογράμματα

Πολύγωνο συχνότητας-Αυτή είναι μια διακεκομμένη γραμμή, τα τμήματα της οποίας συνδέουν τα σημεία ( x 1 ;n 1 ), ( x 2 ;n 2 ),…, ( x k ; n k ), όπου είναι οι επιλογές, είναι οι συχνότητες που αντιστοιχούν σε αυτά.

Πολύγωνο σχετικών συχνοτήτων -Αυτή είναι μια διακεκομμένη γραμμή, τα τμήματα της οποίας συνδέουν τα σημεία ( x 1 ;w 1 ), (x 2 ;w 2 ),…, ( x k ;w k ), όπου x i είναι επιλογές, w i είναι σχετικές συχνότητες που αντιστοιχούν σε αυτά.

Παράδειγμα:

Σχεδιάστε το σχετικό πολυώνυμο συχνότητας στη δεδομένη κατανομή δείγματος:

Λύση:

Στην περίπτωση ενός συνεχούς χαρακτηριστικού, είναι σκόπιμο να κατασκευαστεί ένα ιστόγραμμα, για το οποίο το διάστημα, το οποίο περιέχει όλες τις παρατηρούμενες τιμές του χαρακτηριστικού, χωρίζεται σε πολλά επιμέρους διαστήματα μήκους h και για κάθε μερικό διάστημα βρίσκεται το n i. - το άθροισμα των μεταβλητών συχνοτήτων που εμπίπτουν στο i-ο διάστημα. (Για παράδειγμα, όταν μετράμε το ύψος ή το βάρος ενός ατόμου, έχουμε να κάνουμε με συνεχόμενο ζώδιο).

Ιστόγραμμα συχνότητας-Αυτό είναι ένα κλιμακωτό σχήμα, που αποτελείται από ορθογώνια, οι βάσεις των οποίων είναι μερικά διαστήματα μήκους h και τα ύψη είναι ίσα με την αναλογία (πυκνότητα συχνότητας).

τετράγωνο Το i-ο μερικό ορθογώνιο είναι ίσο με το άθροισμα των συχνοτήτων της παραλλαγής του i-ου διαστήματος, δηλ. η περιοχή του ιστογράμματος συχνότητας είναι ίση με το άθροισμα όλων των συχνοτήτων, δηλ. το μέγεθος του δείγματος.

Παράδειγμα:

Δίνονται τα αποτελέσματα της μεταβολής της τάσης (σε βολτ) στο ηλεκτρικό δίκτυο. Συνθέστε μια σειρά παραλλαγών, δημιουργήστε ένα πολύγωνο και ένα ιστόγραμμα συχνότητας εάν οι τιμές τάσης είναι οι εξής: 227, 215, 230, 232, 223, 220, 228, 222, 221, 226, 226, 215, 218, 216, 220, 225, 212, 217, 220.

Λύση:

Ας δημιουργήσουμε μια σειρά από παραλλαγές. Έχουμε n = 20, x min =212, x max =232.

Ας χρησιμοποιήσουμε τον τύπο Sturgess για να υπολογίσουμε τον αριθμό των διαστημάτων.

Η διαστημική μεταβλητή σειρά συχνοτήτων έχει τη μορφή:


Πυκνότητα Συχνότητας

212-21 6

0,75

21 6-22 0

0,75

220-224

1,75

224-228

228-232

0,75

Ας φτιάξουμε ένα ιστόγραμμα συχνοτήτων:

Ας κατασκευάσουμε ένα πολύγωνο συχνοτήτων βρίσκοντας πρώτα τα μέσα των διαστημάτων:


Ιστόγραμμα σχετικών συχνοτήτωνκαλούμε ένα κλιμακωτό σχήμα που αποτελείται από ορθογώνια, οι βάσεις του οποίου είναι μερικά διαστήματα μήκους h και τα ύψη είναι ίσα με τον λόγο w Εγώ/h (σχετική πυκνότητα συχνότητας).

τετράγωνο Το i-ο μερικό ορθογώνιο είναι ίσο με τη σχετική συχνότητα της παραλλαγής που έπεσε στο i-ο διάστημα. Εκείνοι. η περιοχή του ιστογράμματος των σχετικών συχνοτήτων είναι ίση με το άθροισμα όλων των σχετικών συχνοτήτων, δηλ. μονάδα.

7. Αριθμητικά χαρακτηριστικά της σειράς παραλλαγών

Εξετάστε τα κύρια χαρακτηριστικά του γενικού πληθυσμού και του πληθυσμού του δείγματος.

Γενική δευτεροβάθμιαονομάζεται αριθμητικός μέσος όρος των τιμών του χαρακτηριστικού του γενικού πληθυσμού.

Για διαφορετικές τιμές x 1 , x 2 , x 3 , …, x n . πρόσημο του γενικού πληθυσμού του όγκου Ν έχουμε:

Εάν οι τιμές των χαρακτηριστικών έχουν αντίστοιχες συχνότητες N 1 +N 2 +…+N k =N, τότε


δείγμα μέσου όρουονομάζεται αριθμητικός μέσος όρος των τιμών του χαρακτηριστικού του πληθυσμού του δείγματος.

Εάν οι τιμές των χαρακτηριστικών έχουν αντίστοιχες συχνότητες n 1 +n 2 +…+n k = n, τότε


Παράδειγμα:

Υπολογίστε τη μέση τιμή δείγματος για το δείγμα: x 1 = 51,12; x 2 \u003d 51,07 x 3 \u003d 52,95; x 4 \u003d 52,93, x 5 \u003d 51,1, x 6 \u003d 52,98; x 7 \u003d 52,29; x 8 \u003d 51,23; x 9 \u003d 51,07; x10 = 51,04.

Λύση:

Γενική διακύμανσηονομάζεται αριθμητικός μέσος όρος των τετραγωνικών αποκλίσεων των τιμών του χαρακτηριστικού Χ του γενικού πληθυσμού από τον γενικό μέσο όρο.

Για διαφορετικές τιμές x 1 , x 2 , x 3 , ..., x N του πρόσημου του πληθυσμού του όγκου N έχουμε:

Εάν οι τιμές των χαρακτηριστικών έχουν αντίστοιχες συχνότητες N 1 +N 2 +…+N k =N, τότε

Γενική τυπική απόκλιση (τυπική)ονομάζεται τετραγωνική ρίζα της γενικής διακύμανσης

Διακύμανση δείγματοςονομάζεται αριθμητικός μέσος όρος των τετραγωνικών αποκλίσεων των παρατηρούμενων τιμών του χαρακτηριστικού από τη μέση τιμή.

Για διαφορετικές τιμές x 1 , x 2 , x 3 , ..., x n του πρόσημου του πληθυσμού δείγματος του όγκου n έχουμε:


Εάν οι τιμές των χαρακτηριστικών έχουν αντίστοιχες συχνότητες n 1 +n 2 +…+n k = n, τότε


Δείγμα τυπικής απόκλισης (τυπική)ονομάζεται τετραγωνική ρίζα της διακύμανσης του δείγματος.


Παράδειγμα:

Το σύνολο δειγματοληψίας δίνεται από τον πίνακα κατανομής. Βρείτε τη διακύμανση του δείγματος.


Λύση:

Θεώρημα: Η απόκλιση είναι ίση με τη διαφορά μεταξύ του μέσου όρου των τετραγώνων των τιμών των χαρακτηριστικών και του τετραγώνου του συνολικού μέσου όρου.

Παράδειγμα:

Βρείτε τη διακύμανση για αυτήν την κατανομή.



Λύση:

8. Στατιστικές εκτιμήσεις παραμέτρων κατανομής

Αφήστε τον γενικό πληθυσμό να μελετηθεί από κάποιο δείγμα. Σε αυτήν την περίπτωση, είναι δυνατό να ληφθεί μόνο μια κατά προσέγγιση τιμή της άγνωστης παραμέτρου Q, η οποία χρησιμεύει ως εκτίμησή της. Είναι προφανές ότι οι εκτιμήσεις μπορεί να διαφέρουν από το ένα δείγμα στο άλλο.

Στατιστική αξιολόγησηΕ*η άγνωστη παράμετρος της θεωρητικής κατανομής ονομάζεται συνάρτηση f, η οποία εξαρτάται από τις παρατηρούμενες τιμές του δείγματος. Το καθήκον της στατιστικής εκτίμησης άγνωστων παραμέτρων από ένα δείγμα είναι η κατασκευή μιας τέτοιας συνάρτησης από τα διαθέσιμα δεδομένα στατιστικών παρατηρήσεων που θα έδιναν τις πιο ακριβείς κατά προσέγγιση τιμές πραγματικών, άγνωστων στον ερευνητή, τιμών αυτών των παραμέτρων.

Οι στατιστικές εκτιμήσεις χωρίζονται σε σημειακές και χρονικές, ανάλογα με τον τρόπο που παρέχονται (αριθμός ή διάστημα).

Μια σημειακή εκτίμηση ονομάζεται στατιστική εκτίμηση.παράμετρος Q της θεωρητικής κατανομής που προσδιορίζεται από μία τιμή της παραμέτρου Q *=f (x 1 , x 2 , ..., x n), όπουx 1 , x 2 , ...,xn- τα αποτελέσματα εμπειρικών παρατηρήσεων για το ποσοτικό χαρακτηριστικό X ενός συγκεκριμένου δείγματος.

Τέτοιες εκτιμήσεις παραμέτρων που λαμβάνονται από διαφορετικά δείγματα τις περισσότερες φορές διαφέρουν μεταξύ τους. Η απόλυτη διαφορά /Q *-Q / ονομάζεται δειγματοληπτικό σφάλμα (εκτίμηση).

Προκειμένου οι στατιστικές εκτιμήσεις να δώσουν αξιόπιστα αποτελέσματα σχετικά με τις εκτιμώμενες παραμέτρους, είναι απαραίτητο να είναι αμερόληπτες, αποτελεσματικές και συνεπείς.

Εκτίμηση σημείων, η μαθηματική προσδοκία του οποίου είναι ίση (όχι ίση) με την εκτιμώμενη παράμετρο, ονομάζεται χωρίς μετατόπιση (μετατόπιση). M(Q *)=Q.

Διαφορά Μ( Q *)-Q λέγεται μεροληψία ή συστηματικό σφάλμα. Για αμερόληπτες εκτιμήσεις, το συστηματικό σφάλμα είναι 0.

αποτελεσματικός εκτίμηση Q *, το οποίο, για ένα δεδομένο μέγεθος δείγματος n, έχει τη μικρότερη δυνατή διακύμανση: D min(n = const ). Ο αποτελεσματικός εκτιμητής έχει τη μικρότερη διαφορά σε σύγκριση με άλλους αμερόληπτους και συνεπείς εκτιμητές.

Πλούσιοςονομάζεται τέτοια στατιστική εκτίμηση Q *, το οποίο για nτείνει κατά πιθανότητα στην εκτιμώμενη παράμετρο Q , δηλ. με αύξηση του μεγέθους του δείγματος n η εκτίμηση τείνει κατά πιθανότητα στην πραγματική τιμή της παραμέτρου Q.

Η απαίτηση συνέπειας είναι συνεπής με το νόμο των μεγάλων αριθμών: όσο περισσότερες αρχικές πληροφορίες για το αντικείμενο που μελετάται, τόσο πιο ακριβές είναι το αποτέλεσμα. Εάν το μέγεθος του δείγματος είναι μικρό, τότε η σημειακή εκτίμηση της παραμέτρου μπορεί να οδηγήσει σε σοβαρά σφάλματα.

Οποιος δείγμα (όγκοςιδ)μπορεί να θεωρηθεί ως ένα διατεταγμένο σύνολοx 1 , x 2 , ...,xnανεξάρτητες πανομοιότυπα κατανεμημένες τυχαίες μεταβλητές.

Μέσα δειγμάτων για δείγματα διαφορετικού όγκου n από τον ίδιο πληθυσμό θα είναι διαφορετικό. Δηλαδή, ο μέσος όρος του δείγματος μπορεί να θεωρηθεί ως μια τυχαία μεταβλητή, πράγμα που σημαίνει ότι μπορούμε να μιλήσουμε για την κατανομή του μέσου όρου του δείγματος και τα αριθμητικά χαρακτηριστικά του.

Ο μέσος όρος του δείγματος ικανοποιεί όλες τις απαιτήσεις που επιβάλλονται στις στατιστικές εκτιμήσεις, δηλ. δίνει μια αμερόληπτη, αποτελεσματική και συνεπή εκτίμηση του μέσου όρου του πληθυσμού.

Μπορεί να αποδειχθεί ότι. Έτσι, η διακύμανση του δείγματος είναι μια μεροληπτική εκτίμηση της γενικής διακύμανσης, δίνοντάς της μια υποεκτιμημένη τιμή. Δηλαδή με μικρό μέγεθος δείγματος θα δώσει συστηματικό σφάλμα. Για μια αμερόληπτη, συνεπή εκτίμηση, αρκεί να ληφθεί η ποσότητα, που ονομάζεται διορθωμένη διακύμανση. δηλ.

Στην πράξη, για την εκτίμηση της γενικής διακύμανσης, χρησιμοποιείται η διορθωμένη διακύμανση όταν n < 30. Σε άλλες περιπτώσεις ( n >30) απόκλιση από ελάχιστα αισθητή. Επομένως, για μεγάλες αξίες n Το σφάλμα μεροληψίας μπορεί να αγνοηθεί.

Μπορεί επίσης να αποδείξει κανείς ότι η σχετική συχνότηταΤο n i / n είναι μια αμερόληπτη και συνεπής εκτίμηση πιθανοτήτων P(X=x i ). Εμπειρική συνάρτηση κατανομής F*(x ) είναι μια αμερόληπτη και συνεπής εκτίμηση της θεωρητικής συνάρτησης κατανομής F(x)=P(X< x ).

Παράδειγμα:

Βρείτε τις αμερόληπτες εκτιμήσεις του μέσου όρου και της διακύμανσης από τον πίνακα δείγματος.

x i
n i

Λύση:

Μέγεθος δείγματος n=20.

Η αμερόληπτη εκτίμηση της μαθηματικής προσδοκίας είναι ο μέσος όρος του δείγματος.


Για να υπολογίσουμε την αμερόληπτη εκτίμηση της διακύμανσης, βρίσκουμε πρώτα τη διακύμανση του δείγματος:

Τώρα ας βρούμε την αμερόληπτη εκτίμηση:

9. Διαστημικές εκτιμήσεις παραμέτρων κατανομής

Ένα διάστημα είναι μια στατιστική εκτίμηση που καθορίζεται από δύο αριθμητικές τιμές - τα άκρα του υπό μελέτη διαστήματος.

Αριθμός> 0, όπου | Q - Q*|< , χαρακτηρίζει την ακρίβεια της εκτίμησης διαστήματος.

Εμπιστοςπου ονομάζεται διάστημα , που με δεδομένη πιθανότητακαλύπτει άγνωστη τιμή παραμέτρου Q . Συμπλήρωση του διαστήματος εμπιστοσύνης στο σύνολο όλων των πιθανών τιμών παραμέτρων Q που ονομάζεται κρίσιμη περιοχή. Εάν η κρίσιμη περιοχή βρίσκεται μόνο στη μία πλευρά του διαστήματος εμπιστοσύνης, τότε καλείται το διάστημα εμπιστοσύνης μονόπλευρος: αριστερός, εάν η κρίσιμη περιοχή υπάρχει μόνο στα αριστερά, και δεξιόχειραςεκτός αν στα δεξιά. Διαφορετικά, καλείται το διάστημα εμπιστοσύνης διμερής.

Αξιοπιστία ή επίπεδο εμπιστοσύνης, Εκτιμήσεις Q (χρησιμοποιώντας Q *) ονομάστε την πιθανότητα με την οποία πληρούται η ακόλουθη ανισότητα: | Q - Q*|< .

Τις περισσότερες φορές, η πιθανότητα εμπιστοσύνης τίθεται εκ των προτέρων (0,95; 0,99; 0,999) και η απαίτηση της επιβάλλεται να είναι κοντά στο ένα.

Πιθανότηταπου ονομάζεται την πιθανότητα σφάλματος ή το επίπεδο σημαντικότητας.

Αφήστε | Q - Q*|< , Επειτα. Αυτό σημαίνει ότι με πιθανότηταμπορεί να υποστηριχθεί ότι η πραγματική τιμή της παραμέτρου Q ανήκει στο διάστημα. Όσο μικρότερη είναι η απόκλιση, τόσο πιο ακριβής είναι η εκτίμηση.

Τα όρια (άκρα) του διαστήματος εμπιστοσύνης ονομάζονται όρια εμπιστοσύνης ή κρίσιμα όρια.

Οι τιμές των ορίων του διαστήματος εμπιστοσύνης εξαρτώνται από τον νόμο κατανομής της παραμέτρου Q*.

Τιμή απόκλισηςονομάζεται το μισό πλάτος του διαστήματος εμπιστοσύνης ακρίβεια αξιολόγησης.

Μέθοδοι για την κατασκευή διαστημάτων εμπιστοσύνης αναπτύχθηκαν για πρώτη φορά από τον Αμερικανό στατιστικολόγο Y. Neumann. Ακρίβεια εκτίμησης, πιθανότητα εμπιστοσύνης και μέγεθος δείγματος n διασυνδεδεμένες. Επομένως, γνωρίζοντας τις συγκεκριμένες τιμές δύο ποσοτήτων, μπορείτε πάντα να υπολογίσετε την τρίτη.

Εύρεση του διαστήματος εμπιστοσύνης για την εκτίμηση της μαθηματικής προσδοκίας μιας κανονικής κατανομής εάν είναι γνωστή η τυπική απόκλιση.

Ας γίνει ένα δείγμα από τον γενικό πληθυσμό, με την επιφύλαξη του νόμου της κανονικής κατανομής. Αφήστε τη γενική τυπική απόκλιση να είναι γνωστή, αλλά η μαθηματική προσδοκία της θεωρητικής κατανομής είναι άγνωστηένα ().

Ισχύει ο ακόλουθος τύπος:

Εκείνοι. σύμφωνα με την καθορισμένη τιμή απόκλισηςείναι δυνατόν να βρεθεί με ποια πιθανότητα η άγνωστη γενική μέση ανήκει στο διάστημα. Και αντίστροφα. Μπορεί να φανεί από τον τύπο ότι με μια αύξηση στο μέγεθος του δείγματος και μια σταθερή τιμή της πιθανότητας εμπιστοσύνης, η τιμή- μειώνεται, δηλ. η ακρίβεια της εκτίμησης αυξάνεται. Με αύξηση της αξιοπιστίας (πιθανότητα εμπιστοσύνης), η τιμή-αυξάνει, δηλ. η ακρίβεια της εκτίμησης μειώνεται.

Παράδειγμα:

Ως αποτέλεσμα των δοκιμών, προέκυψαν οι ακόλουθες τιμές -25, 34, -20, 10, 21. Είναι γνωστό ότι υπακούουν στον νόμο της κανονικής κατανομής με τυπική απόκλιση 2. Βρείτε την εκτίμηση a* για το μαθηματική προσδοκία α. Σχεδιάστε ένα διάστημα εμπιστοσύνης 90% για αυτό.

Λύση:

Ας βρούμε την αμερόληπτη εκτίμηση

Επειτα


Το διάστημα εμπιστοσύνης για το α έχει τη μορφή: 4 - 1,47< ένα< 4+ 1,47 или 2,53 < a < 5, 47

Εύρεση του διαστήματος εμπιστοσύνης για την εκτίμηση της μαθηματικής προσδοκίας μιας κανονικής κατανομής εάν η τυπική απόκλιση είναι άγνωστη.

Ας είναι γνωστό ότι ο γενικός πληθυσμός υπόκειται στον νόμο της κανονικής κατανομής, όπου α και. Ακρίβεια κάλυψης διαστήματος εμπιστοσύνης με αξιοπιστίαη πραγματική τιμή της παραμέτρου a, σε αυτήν την περίπτωση, υπολογίζεται από τον τύπο:

, όπου n είναι το μέγεθος του δείγματος, , - Ο συντελεστής μαθητή (θα πρέπει να βρεθεί από τις τιμές που δίνονται n και από τον πίνακα «Κρίσιμα σημεία κατανομής Μαθητή»).

Παράδειγμα:

Ως αποτέλεσμα των δοκιμών, ελήφθησαν οι ακόλουθες τιμές -35, -32, -26, -35, -30, -17. Είναι γνωστό ότι υπακούουν στο νόμο της κανονικής κατανομής. Βρείτε το διάστημα εμπιστοσύνης για τον πληθυσμιακό μέσο όρο a με επίπεδο εμπιστοσύνης 0,9.

Λύση:

Ας βρούμε την αμερόληπτη εκτίμηση.

Ας βρούμε.

Επειτα

Το διάστημα εμπιστοσύνης θα πάρει τη μορφή(-29,2 - 5,62; -29,2 + 5,62) ή (-34,82; -23,58).

Εύρεση του διαστήματος εμπιστοσύνης για τη διακύμανση και την τυπική απόκλιση μιας κανονικής κατανομής

Ας ληφθεί ένα τυχαίο δείγμα όγκου από κάποιο γενικό σύνολο τιμών που κατανέμεται σύμφωνα με τον κανονικό νόμοn < 30 για το οποίο υπολογίζονται οι διακυμάνσεις του δείγματος: μεροληπτικήκαι διορθώθηκε το s 2. Στη συνέχεια να βρούμε εκτιμήσεις διαστήματος με δεδομένη αξιοπιστίαγια γενική διασποράρεγενική τυπική απόκλισηχρησιμοποιούνται οι παρακάτω τύποι.


ή,

Αξίες- βρείτε χρησιμοποιώντας τον πίνακα τιμών των κρίσιμων σημείωνΔιανομές Pearson.

Το διάστημα εμπιστοσύνης για τη διακύμανση βρίσκεται από αυτές τις ανισότητες τετραγωνίζοντας όλα τα μέρη της ανισότητας.

Παράδειγμα:

Ελέγχθηκε η ποιότητα των 15 μπουλονιών. Υποθέτοντας ότι το σφάλμα στην κατασκευή τους υπόκειται στον νόμο κανονικής διανομής και στην τυπική απόκλιση του δείγματοςίσο με 5 mm, προσδιορίστε με αξιοπιστίαδιάστημα εμπιστοσύνης για άγνωστη παράμετρο

Αντιπροσωπεύουμε τα όρια του διαστήματος ως διπλή ανισότητα:

Τα άκρα του διαστήματος εμπιστοσύνης δύο όψεων για τη διακύμανση μπορούν να προσδιοριστούν χωρίς την εκτέλεση αριθμητικής για ένα δεδομένο επίπεδο εμπιστοσύνης και μέγεθος δείγματος χρησιμοποιώντας τον αντίστοιχο πίνακα (Όρια εμπιστοσύνης για τη διακύμανση ανάλογα με τον αριθμό των βαθμών ελευθερίας και αξιοπιστίας) . Για να γίνει αυτό, τα άκρα του διαστήματος που λαμβάνονται από τον πίνακα πολλαπλασιάζονται με τη διορθωμένη διακύμανση s 2.

Παράδειγμα:

Ας λύσουμε το προηγούμενο πρόβλημα με διαφορετικό τρόπο.

Λύση:

Ας βρούμε τη διορθωμένη διακύμανση:

Σύμφωνα με τον πίνακα "Όρια διαστήματος εμπιστοσύνης για τη διακύμανση ανάλογα με τον αριθμό των βαθμών ελευθερίας και αξιοπιστίας", βρίσκουμε τα όρια του διαστήματος εμπιστοσύνης για τη διακύμανση στοκ=14 και: κατώτερο όριο 0,513 και ανώτατο όριο 2,354.

Πολλαπλασιάστε τα ληφθέντα όρια μεs 2 και εξάγουμε τη ρίζα (γιατί χρειαζόμαστε ένα διάστημα εμπιστοσύνης όχι για τη διακύμανση, αλλά για την τυπική απόκλιση).

Όπως φαίνεται από τα παραδείγματα, η τιμή του διαστήματος εμπιστοσύνης εξαρτάται από τη μέθοδο κατασκευής του και δίνει κοντινά αλλά διαφορετικά αποτελέσματα.

Για δείγματα επαρκώς μεγάλου μεγέθους (n>30) τα όρια του διαστήματος εμπιστοσύνης για τη γενική τυπική απόκλιση μπορούν να προσδιοριστούν από τον τύπο: - κάποιος αριθμός, ο οποίος είναι πινακοποιημένος και δίνεται στον αντίστοιχο πίνακα αναφοράς.

Αν 1- q<1, то формула имеет вид:

Παράδειγμα:

Ας λύσουμε το προηγούμενο πρόβλημα με τον τρίτο τρόπο.

Λύση:

Βρέθηκε προηγουμένωςμικρό= 5,17. q(0,95; 15) = 0,46 - βρίσκουμε σύμφωνα με τον πίνακα.

Επειτα:

Τα εμπειρικά θεωρούνται ένα από τα κύρια μέσα μελέτης των κοινωνικών σχέσεων και διαδικασιών. Παρέχουν αξιόπιστες, πλήρεις και αντιπροσωπευτικές πληροφορίες.

Ιδιαιτερότητα των τεχνικών

Εμπειρική παροχή απόκτησης γνώσης επιβεβαίωσης γεγονότων. Συμβάλλουν στη δημιουργία και γενίκευση των περιστάσεων μέσω έμμεσης ή άμεσης καταγραφής γεγονότων που είναι εγγενείς στις μελετούμενες σχέσεις, αντικείμενα, φαινόμενα. Οι εμπειρικές μέθοδοι διαφέρουν από τις θεωρητικές στο ότι το αντικείμενο της ανάλυσης είναι:

  1. Συμπεριφορά ατόμων και των ομάδων τους.
  2. Προϊόντα ανθρώπινης δραστηριότητας.
  3. Οι λεκτικές ενέργειες των ατόμων, οι κρίσεις, οι απόψεις, οι απόψεις τους.

Δείγματα μελετών

Η εμπειρική μελέτη επικεντρώνεται πάντα στην απόκτηση αντικειμενικών και ακριβών πληροφοριών, ποσοτικών δεδομένων. Από αυτή την άποψη, όταν πραγματοποιείται, είναι απαραίτητο να διασφαλίζεται η αντιπροσωπευτικότητα των πληροφοριών. Αντίστοιχα, σωστά σετ δειγματοληψίας. ΑυτόΑυτό σημαίνει ότι η επιλογή πρέπει να γίνει με τέτοιο τρόπο ώστε τα δεδομένα που λαμβάνονται από μια στενή ομάδα να αντικατοπτρίζουν τις τάσεις που σημειώνονται στη γενική μάζα των ερωτηθέντων. Για παράδειγμα, κατά τη δημοσκόπηση 200-300 ατόμων, τα δεδομένα που λαμβάνονται μπορούν να επεκταθούν σε ολόκληρο τον αστικό πληθυσμό. Οι δείκτες του δειγματοληπτικού συνόλου επιτρέπουν μια διαφορετική προσέγγιση στη μελέτη των κοινωνικοοικονομικών διαδικασιών στην περιοχή, στο σύνολο της χώρας.

Ορολογία

Προκειμένου να κατανοηθούν καλύτερα τα ζητήματα που σχετίζονται με τις δειγματοληπτικές έρευνες, πρέπει να διευκρινιστούν ορισμένοι ορισμοί. Η μονάδα παρατήρησης είναι η άμεση πηγή πληροφοριών. Μπορεί να είναι ένα άτομο, μια ομάδα, ένα έγγραφο, ένας οργανισμός και ούτω καθεξής. Ο γενικός πληθυσμός είναισύνολο μονάδων παρατήρησης. Θα πρέπει όλα να σχετίζονται με το πρόβλημα που μελετάται. υπόκειται σε άμεση ανάλυση. Η μελέτη πραγματοποιείται σύμφωνα με τις αναπτυγμένες μεθόδους συλλογής πληροφοριών. Για να προσδιορίσετε αυτή την αναλογία ολόκληρης της σειράς των ερωτηθέντων, χρησιμοποιήστε την έννοια του «δείγματος». Η ιδιότητά του να αντικατοπτρίζει τις βασικές παραμέτρους της συνολικής μάζας των ανθρώπων ονομάζεται αντιπροσωπευτικότητα. Σε ορισμένες περιπτώσεις δεν υπάρχουν αγώνες. Τότε μιλάμε για λάθος αντιπροσωπευτικότητας.

Εξασφάλιση αντιπροσωπευτικότητας

Τα θέματα που σχετίζονται με αυτό εξετάζονται λεπτομερώς στο πλαίσιο των στατιστικών. Τα προβλήματα είναι πολύπλοκα γιατί, αφενός, μιλάμε για παροχή μιας ποσοτικής αναπαράστασης που δίνει ο γενικός πληθυσμός. Αυτόσημαίνει, ειδικότερα, ότι οι ομάδες των ερωτηθέντων πρέπει να εκπροσωπούνται στον βέλτιστο αριθμό. Η ποσότητα πρέπει να είναι επαρκής για μια κανονική αναπαράσταση. Από την άλλη, σημαίνει και ποιοτική εκπροσώπηση. Προϋποθέτει μια ορισμένη θεματική σύνθεση, η οποία σχηματίζει σετ δειγματοληψίας. Αυτόσημαίνει ότι, για παράδειγμα, η αντιπροσωπευτικότητα δεν μπορεί να συζητηθεί εάν ερωτηθούν μόνο άνδρες ή μόνο γυναίκες, ηλικιωμένοι ή νέοι. Η μελέτη θα πρέπει να διεξάγεται σε όλες τις ομάδες που εκπροσωπούνται.

Χαρακτηριστικό δείγματος

Αυτός ο όρος εξετάζεται από δύο απόψεις. Πρώτα απ 'όλα, ορίζεται ως ένα σύμπλεγμα στοιχείων από τη γενική σειρά ανθρώπων των οποίων η γνώμη μελετάται - αυτό είναι σετ δειγματοληψίας. Αυτόεπίσης η διαδικασία δημιουργίας μιας συγκεκριμένης κατηγορίας ερωτηθέντων με την απαιτούμενη αντιπροσωπευτικότητα. Στην πράξη, υπάρχουν διάφοροι τύποι και είδη επιλογής. Ας τα εξετάσουμε.

Τύποι

Υπάρχουν τρία από αυτά:

  1. αυθόρμητος σετ δειγματοληψίας. Αυτόένα σύνολο ερωτηθέντων που επιλέχθηκαν σε εθελοντική βάση. Παράλληλα, διασφαλίζεται η προσβασιμότητα της εισόδου μονάδων από τη συνολική μάζα των ατόμων σε μια συγκεκριμένη ομάδα μελέτης. Η αυθόρμητη επιλογή στην πράξη χρησιμοποιείται αρκετά συχνά. Για παράδειγμα, σε έρευνες στον Τύπο, μέσω ταχυδρομείου. Ωστόσο, αυτή η προσέγγιση έχει ένα σημαντικό μειονέκτημα. Είναι αδύνατο να αναπαρασταθεί ποιοτικά ολόκληρος ο όγκος του γενικού δείγματος. Αυτή η τεχνική εφαρμόζεται όσον αφορά την οικονομία. Σε ορισμένες έρευνες, αυτή η επιλογή είναι η μόνη δυνατή.
  2. αυθόρμητος σετ δειγματοληψίας. Αυτόμία από τις κύριες μεθόδους που χρησιμοποιήθηκαν στη μελέτη. Η βασική αρχή μιας τέτοιας επιλογής είναι η παροχή μιας ευκαιρίας για κάθε μονάδα παρατήρησης να μεταβεί από τη γενική μάζα των ατόμων σε μια στενή ομάδα. Για αυτό, χρησιμοποιούνται διάφορες μέθοδοι. Για παράδειγμα, μπορεί να είναι μια κλήρωση, μια μηχανική επιλογή, ένας πίνακας τυχαίων αριθμών.
  3. Στρωματοποιημένη (ποσοστική) δειγματοληψία. Βασίζεται στη διαμόρφωση ενός ποιοτικού μοντέλου της συνολικής μάζας των ερωτηθέντων. Μετά από αυτό, πραγματοποιείται η επιλογή των μονάδων στον πληθυσμό του δείγματος. Για παράδειγμα, εκτελείται ανάλογα με την ηλικία ή το φύλο, ανάλογα με τις πληθυσμιακές ομάδες κ.ο.κ.

Είδη

Υπάρχουν οι εξής επιλογές:

Επιπροσθέτως

Τα δείγματα μπορεί επίσης να είναι εξαρτημένα και ανεξάρτητα. Στην πρώτη περίπτωση, η διαδικασία του πειράματος και τα αποτελέσματα που θα προκύψουν κατά τη διάρκεια αυτού για τη μία ομάδα ερωτηθέντων έχουν κάποιο αντίκτυπο στην άλλη. Συνεπώς, ανεξάρτητα δείγματα δεν συνεπάγονται τέτοιο αντίκτυπο. Εδώ, ωστόσο, πρέπει να σημειωθεί ένα σημαντικό σημείο. Μία ομάδα θεμάτων, για την οποία η ψυχολογική εξέταση διενεργήθηκε δύο φορές (ακόμη και αν είχε ως στόχο τη μελέτη διαφορετικών ποιοτήτων, χαρακτηριστικών, σημείων), εξ ορισμού, θα θεωρείται εξαρτημένη.

Πιθανολογικές επιλογές

Εξετάστε ορισμένους τύπους δειγμάτων:

  1. Τυχαίος. Υποθέτει την ομοιογένεια του συνολικού πληθυσμού, μία πιθανότητα διαθεσιμότητας όλων των συστατικών, καθώς και την παρουσία μιας πλήρους λίστας στοιχείων. Κατά κανόνα, στη διαδικασία επιλογής χρησιμοποιείται ένας πίνακας με τυχαίους αριθμούς.
  2. Μηχανικός. Αυτό το είδος τυχαίας δειγματοληψίας περιλαμβάνει την παραγγελία σύμφωνα με ένα συγκεκριμένο χαρακτηριστικό. Για παράδειγμα, με αριθμό τηλεφώνου, αλφαβητικά, κατά ημερομηνία γέννησης και ούτω καθεξής. Το πρώτο συστατικό επιλέγεται τυχαία. Στη συνέχεια, κάθε k στοιχείο επιλέγεται με ένα βήμα n. Η τιμή του συνολικού πληθυσμού θα είναι N=k*n.
  3. Στρωματοποιημένος. Αυτό το δείγμα χρησιμοποιείται όταν ο συνολικός πληθυσμός είναι ετερογενής. Το τελευταίο χωρίζεται σε στρώματα (ομάδες). Σε καθένα από αυτά η επιλογή πραγματοποιείται μηχανικά ή τυχαία.
  4. Κατα συρροη. Οι ομάδες επιλέγονται τυχαία. Μέσα τους, τα αντικείμενα μελετώνται σε όλη τη διαδρομή.

Απίστευτες επιλογές

Περιλαμβάνουν δειγματοληψία όχι με βάση την τυχαιότητα, αλλά για υποκειμενικούς λόγους: τυπικότητα, προσβασιμότητα, ίση εκπροσώπηση κ.λπ. Οι επιλογές αυτής της κατηγορίας περιλαμβάνουν:

Απόχρωση

Απαιτείται ακριβής και πλήρης κατάλογος πληθυσμιακών μονάδων για να εξασφαλιστεί η αντιπροσωπευτικότητα. Τα αντικείμενα παρατήρησης, κατά κανόνα, είναι ένα άτομο. Η επιλογή από τη λίστα γίνεται καλύτερα με αρίθμηση μονάδων και χρησιμοποιώντας έναν πίνακα με τυχαίους αριθμούς. Αλλά συχνά χρησιμοποιείται και η σχεδόν τυχαία μέθοδος. Προϋποθέτει επιλογή από τη λίστα κάθε n στοιχείου.

Παράγοντες που επηρεάζουν

Ο όγκος ενός πληθυσμού είναι ο αριθμός των μονάδων του. Σύμφωνα με τους ειδικούς, δεν χρειάζεται να είναι μεγάλο. Αναμφίβολα, όσο μεγαλύτερος είναι ο αριθμός των ερωτηθέντων, τόσο πιο ακριβές είναι το αποτέλεσμα. Ωστόσο, ταυτόχρονα, ένας μεγάλος όγκος δεν εγγυάται πάντα την επιτυχία. Για παράδειγμα, αυτό συμβαίνει όταν η συνολική σειρά των ερωτηθέντων είναι ετερογενής. Ομοιογενές θα θεωρείται ένα τέτοιο σύνολο όπου η ελεγχόμενη παράμετρος, για παράδειγμα, το επίπεδο αλφαβητισμού, κατανέμεται ομοιόμορφα, δηλαδή δεν υπάρχουν κενά ή συμπυκνώσεις. Σε αυτή την περίπτωση, θα αρκεί να πάρετε συνέντευξη από πολλά άτομα. Σύμφωνα με τα αποτελέσματα της έρευνας, θα είναι δυνατό να εξαχθεί το συμπέρασμα ότι η πλειονότητα των ανθρώπων έχει φυσιολογικό επίπεδο αλφαβητισμού. Από αυτό προκύπτει ότι η αντιπροσωπευτικότητα των πληροφοριών επηρεάζεται όχι από ποσοτικά χαρακτηριστικά, αλλά από τα ποιοτικά χαρακτηριστικά του πληθυσμού - το επίπεδο της ομοιογένειάς του, ειδικότερα.

Λάθη

Αντιπροσωπεύουν την απόκλιση των μέσων παραμέτρων του πληθυσμού του δείγματος από τις τιμές της συνολικής μάζας των ερωτηθέντων. Στην πράξη, τα σφάλματα προσδιορίζονται με αντιστοίχιση. Κατά την έρευνα ενηλίκων, συνήθως χρησιμοποιούνται δεδομένα από απογραφές, στατιστικά αρχεία και αποτελέσματα προηγούμενων ερευνών. Οι παράμετροι ελέγχου είναι συνήθως η Σύγκριση των μέσων τιμών των πληθυσμών (γενικός και δείγμα), ο προσδιορισμός του σφάλματος σύμφωνα με αυτό και η μείωση αυτής της απόκλισης ονομάζεται έλεγχος αντιπροσωπευτικότητας.

συμπεράσματα

Η δειγματοληπτική έρευνα είναι ένας τρόπος συλλογής δεδομένων για τη στάση και τη συμπεριφορά των ανθρώπων μέσω μιας έρευνας ειδικά επιλεγμένων ομάδων ερωτηθέντων. Αυτή η τεχνική θεωρείται αξιόπιστη και οικονομική, αν και απαιτεί συγκεκριμένη τεχνική. Το δείγμα είναι η βάση. Λειτουργεί ως ένα ορισμένο ποσοστό της συνολικής μάζας των ανθρώπων. Η επιλογή γίνεται με τη χρήση ειδικών τεχνικών και αποσκοπεί στην απόκτηση πληροφοριών για ολόκληρο τον πληθυσμό. Το τελευταίο, με τη σειρά του, αντιπροσωπεύεται από όλα τα πιθανά κοινωνικά αντικείμενα ή από την ομάδα που θα μελετηθεί. Συχνά, ο πληθυσμός είναι τόσο μεγάλος που θα ήταν αρκετά δαπανηρό και δυσκίνητο να διεξαχθεί μια έρευνα για κάθε ένα από τα μέλη του. Ως εκ τούτου, χρησιμοποιείται ένα μειωμένο μοντέλο. Στο δείγμα περιλαμβάνονται όλοι όσοι λαμβάνουν ερωτηματολόγια, οι οποίοι ονομάζονται ερωτηθέντες, οι οποίοι, μάλιστα, λειτουργούν ως αντικείμενο μελέτης. Με απλά λόγια, αποτελείται από πολλά άτομα που παίρνουν συνέντευξη.

συμπέρασμα

Οι στόχοι της έρευνας καθορίζονται από συγκεκριμένες κατηγορίες που περιλαμβάνονται στον πληθυσμό. Όσον αφορά ένα συγκεκριμένο μερίδιο της συνολικής μάζας των ανθρώπων, αποτελείται από θέματα που περιλαμβάνονται σε ομάδες χρησιμοποιώντας μαθηματικούς υπολογισμούς. Για την επιλογή των μονάδων απαιτείται περιγραφή του αντικειμένου του αρχικού πληθυσμού. Μετά τον προσδιορισμό του αριθμού των θεμάτων, καθορίζεται η υποδοχή ή η μέθοδος σχηματισμού ομάδων. Τα αποτελέσματα της έρευνας θα μας επιτρέψουν να περιγράψουμε το υπό μελέτη χαρακτηριστικό σε σχέση με όλους τους εκπροσώπους της γενικής μάζας των ανθρώπων. Όπως δείχνει η πρακτική, διεξάγονται κυρίως επιλεκτικές παρά συνεχείς μελέτες.

Θέμα: Δειγματοληψία στη στατιστική

1. Η έννοια της επιλεκτικής παρατήρησης, τα καθήκοντά της

Η στατιστική παρατήρηση μπορεί να οργανωθεί συνεχής και μη συνεχής. Συνεχής παρατήρησηπεριλαμβάνει έρευνα όλων των μονάδων του πληθυσμού που μελετήθηκε και σχετίζεται με μεγάλο εργατικό και υλικό κόστος. Μπορεί να πραγματοποιηθεί η μελέτη όχι όλων των μονάδων του πληθυσμού, αλλά μόνο ενός μέρους, με βάση το οποίο θα πρέπει να κριθούν οι ιδιότητες ολόκληρου του πληθυσμού στο σύνολό του. διακεκομμένοςπαρατήρηση. Στη στατιστική πρακτική, το πιο κοινό είναι επιλεκτική παρατήρηση.

Επιλεκτική παρατήρηση - Αυτό είναι ένα είδος μη συνεχούς παρατήρησης κατά την οποία η επιλογή των μονάδων που θα ερευνηθούν πραγματοποιείται με τυχαία σειρά, το επιλεγμένο μέρος μελετάται και τα αποτελέσματα διανέμονται σε ολόκληρο τον αρχικό πληθυσμό. Η παρατήρηση οργανώνεται με τέτοιο τρόπο ώστε αυτό το μέρος των επιλεγμένων μονάδων σε μειωμένη κλίμακα αντιπροσωπεύει(αντιπροσωπεύει) ολόκληρο τον πληθυσμό.

Ο πληθυσμός από τον οποίο γίνεται η επιλογή ονομάζεται γενικός, γενικός.

Καλείται το σύνολο των επιλεγμένων μονάδων σετ δειγματοληψίας,και όλους τους γενικούς δείκτες του - εκλεκτικός.

Υπάρχουν διάφοροι λόγοι για τους οποίους, σε πολλές περιπτώσεις, η επιλεκτική παρατήρηση προτιμάται από τη συνεχή παρατήρηση. Τα σημαντικότερα από αυτά είναι τα ακόλουθα:

Εξοικονόμηση χρόνου και χρημάτων ως αποτέλεσμα της μείωσης του όγκου της εργασίας.

Ελαχιστοποίηση της ζημιάς ή της καταστροφής των υπό μελέτη αντικειμένων (προσδιορισμός της αντοχής του νήματος στο σπάσιμο, δοκιμή λαμπτήρων ηλεκτρικού φωτός κατά τη διάρκεια της καύσης, έλεγχος καλής ποιότητας κονσερβοποιημένων τροφίμων).

Η ανάγκη για λεπτομερή μελέτη κάθε μονάδας παρατήρησης όταν είναι αδύνατο να καλυφθούν όλες οι μονάδες (κατά τη μελέτη του προϋπολογισμού των οικογενειών).

Επιτύχετε μεγαλύτερη ακρίβεια των αποτελεσμάτων της έρευνας μειώνοντας τα σφάλματα εγγραφής.

Το πλεονέκτημα της επιλεκτικής παρατήρησης έναντι της συνεχούς παρατήρησης μπορεί να γίνει αντιληπτό εάν οργανωθεί και πραγματοποιηθεί σύμφωνα με τις επιστημονικές αρχές. τη θεωρία της μεθόδου δειγματοληψίας.Αυτές οι αρχές είναι: εξασφάλιση ευκαιρία(ίσες πιθανότητες να συμπεριληφθεί στο δείγμα) επιλογή μονάδων και επαρκή αριθμό από αυτά.Η συμμόρφωση με αυτές τις αρχές καθιστά δυνατή την εξασφάλιση αντικειμενικής εγγύησης για την αντιπροσωπευτικότητα του δείγματος που προκύπτει. έννοια αντιπροσωπευτικότηταΟ επιλεγμένος πληθυσμός δεν πρέπει να κατανοηθεί ως η αναπαράστασή του ως προς όλα τα χαρακτηριστικά του υπό μελέτη πληθυσμού, αλλά μόνο σε σχέση με εκείνα τα χαρακτηριστικά που μελετώνται ή έχουν σημαντικό αντίκτυπο στον σχηματισμό συνοπτικών γενικευτικών χαρακτηριστικών.

Το κύριο καθήκον της παρατήρησης του δείγματος στα οικονομικά είναι η απόκτηση αξιόπιστων κρίσεων σχετικά με τους δείκτες του μέσου όρου και του μεριδίου στον γενικό πληθυσμό με βάση τα χαρακτηριστικά του πληθυσμού του δείγματος (μέσος όρος και μερίδιο). Ταυτόχρονα, θα πρέπει να ληφθεί υπόψη ότι σε οποιεσδήποτε στατιστικές μελέτες (συμπαγείς και επιλεκτικές) προκύπτουν σφάλματα δύο ειδών: εγγραφής και αντιπροσωπευτικότητας.

Σφάλματα εγγραφής μπορώ να έχω τυχαίος(ακούσια) και συστηματικός(τεθητικός) χαρακτήρας. Τυχαία σφάλματασυνήθως ισορροπούν μεταξύ τους, αφού δεν έχουν κυρίαρχη κατεύθυνση προς την κατεύθυνση της υπερβολής ή της υποτίμησης της τιμής του υπό μελέτη δείκτη. Συστηματικά λάθηκατευθύνεται προς μία κατεύθυνση λόγω εσκεμμένης παραβίασης των κανόνων επιλογής (προκατειλημμένοι στόχοι). Μπορούν να αποφευχθούν με σωστή οργάνωση και παρακολούθηση.

Σφάλματα αντιπροσωπευτικότητας είναι εγγενείς μόνο στην επιλεκτική παρατήρηση και προκύπτουν λόγω του γεγονότος ότι το δείγμα δεν αναπαράγει πλήρως το γενικό. Αντιπροσωπεύουν την απόκλιση μεταξύ των τιμών των δεικτών που λαμβάνονται από το δείγμα και των τιμών των δεικτών των ίδιων τιμών που θα είχαν ληφθεί με συνεχή παρατήρηση που πραγματοποιείται με τον ίδιο βαθμό ακρίβειας, δηλαδή μεταξύ τις τιμές των επιλεγμένων και τους αντίστοιχους γενικούς δείκτες.

Για κάθε συγκεκριμένη παρατήρηση δείγματος, η τιμή του σφάλματος αντιπροσωπευτικότητας μπορεί να προσδιοριστεί από τους αντίστοιχους τύπους, οι οποίοι εξαρτώνται από τύπος, μέθοδοςΚαι τρόποςσχηματισμός δείγματος.

Ανά τύπο Υπάρχει ατομική, ομαδική και συνδυαστική επιλογή. Στο ατομική επιλογήΣτο δείγμα επιλέγονται μεμονωμένες μονάδες του γενικού πληθυσμού. στο ομαδική επιλογή- ποιοτικά ομοιογενείς ομάδες ή σειρές υπό μελέτη μονάδων. συνδυασμένη επιλογήπεριλαμβάνει συνδυασμό του πρώτου και του δεύτερου τύπου.

Με μέθοδο επιλογής διακρίνω αλλεπάλληλοςΚαι μη επαναλαμβανόμενη δειγματοληψία.

Στο επαναδειγματοληψίαο συνολικός αριθμός πληθυσμιακών μονάδων στη διαδικασία δειγματοληψίας παραμένει αμετάβλητος. Η μία ή η άλλη μονάδα που περιλαμβάνεται στο δείγμα, μετά την εγγραφή, επιστρέφεται ξανά στον γενικό πληθυσμό και διατηρεί ίσες ευκαιρίες με όλες τις άλλες μονάδες, όταν οι μονάδες επανεπιλεγούν ξανά για να μπουν στο δείγμα («επιλογή σύμφωνα με σχέδιο επιστρεφόμενης μπάλας»). Η επαναδειγματοληψία στην κοινωνικοοικονομική ζωή είναι σπάνια. Τυπικά, η δειγματοληψία οργανώνεται σύμφωνα με ένα μη επαναλαμβανόμενο σχήμα δειγματοληψίας.

Στο καμία επαναδειγματοληψίαη μονάδα πληθυσμού που εντάχθηκε στο δείγμα δεν επιστρέφεται στον γενικό πληθυσμό και δεν συμμετέχει στο δείγμα στο μέλλον· Δηλαδή, το επόμενο δείγμα λαμβάνεται από τον γενικό πληθυσμό χωρίς τις προηγουμένως επιλεγμένες μονάδες («επιλογή σύμφωνα με το σχήμα της μη επιστραφής μπάλας»). Έτσι, με τη μη επαναλαμβανόμενη δειγματοληψία, ο αριθμός των μονάδων στο γενικό πληθυσμό μειώνεται στη διαδικασία της έρευνας.

Μέθοδος επιλογής ορίζει έναν συγκεκριμένο μηχανισμό ή διαδικασία για την επιλογή μονάδων από έναν πληθυσμό.

Σύμφωνα με το βαθμό κάλυψης των πληθυσμιακών μονάδων, υπάρχουν μεγάλοΚαι μικρό (n <30) выборки.

Στην πρακτική των δειγματοληπτικών μελετών, οι ακόλουθοι τύποι δειγματοληψίας χρησιμοποιούνται ευρέως: σωστό τυχαίο, μηχανικό, τυπικό, σειριακό, συνδυασμένο.

Τα κύρια χαρακτηριστικά των παραμέτρων του γενικού πληθυσμού και του πληθυσμού δείγματος υποδεικνύονται με σύμβολα:

Ν-όγκος του γενικού πληθυσμού (αριθμός μονάδων που περιλαμβάνονται σε αυτόν).

Π -Μέγεθος δείγματος (αριθμός ερωτηθέντων μονάδων).

- γενικός μέσος όρος (μέση τιμή του χαρακτηριστικού στο γενικό πληθυσμό).

Δείγμα μέσος όρος;

Π- γενικό μερίδιο (το μερίδιο των μονάδων που έχουν μια δεδομένη τιμή του χαρακτηριστικού στον συνολικό αριθμό μονάδων του γενικού πληθυσμού).

w - δείγμα μεριδίου?

- γενική διακύμανση (διακύμανση ενός χαρακτηριστικού στο γενικό πληθυσμό).

μικρό 2 - διακύμανση δείγματος του ίδιου χαρακτηριστικού.

- τυπική απόκλιση στο γενικό πληθυσμό.

μικρό- τυπική απόκλιση στο δείγμα.

2. Σφάλματα δειγματοληψίας

Κατά την επιλεκτική παρατήρηση, θα πρέπει να διασφαλίζεται ευκαιρίαεπιλογή μονάδας. Κάθε μονάδα πρέπει να έχει ίσες ευκαιρίες επιλογής με τις άλλες. Σε αυτό βασίζεται η τυχαία δειγματοληψία.

ΠΡΟΣ ΤΗΝ κατάλληλο τυχαίο δείγμα αναφέρεται στην επιλογή μονάδων από το σύνολο του γενικού πληθυσμού (χωρίς προηγούμενη διαίρεση σε ομάδες) με κλήρωση (κυρίως) ή οποιαδήποτε άλλη παρόμοια μέθοδο, για παράδειγμα, χρησιμοποιώντας έναν πίνακα τυχαίων αριθμών. Τυχαία επιλογή -αυτή η επιλογή δεν είναι τυχαία. Η αρχή της τυχαιότητας υποδηλώνει ότι η συμπερίληψη ή η εξαίρεση ενός αντικειμένου από το δείγμα δεν μπορεί να επηρεαστεί από κανέναν άλλο παράγοντα εκτός από την τύχη. Ενα παράδειγμα στην πραγματικότητα τυχαίαΟι κληρώσεις των κερδών μπορούν να χρησιμεύσουν ως επιλογή: από τον συνολικό αριθμό των εισιτηρίων που εκδόθηκαν, ένα συγκεκριμένο μέρος των αριθμών που αντιστοιχούν στα κέρδη επιλέγεται τυχαία. Επιπλέον, παρέχεται σε όλους τους αριθμούς ίσες ευκαιρίες να μπουν στο δείγμα. Σε αυτήν την περίπτωση, ο αριθμός των μονάδων που επιλέγονται στο σύνολο δειγμάτων συνήθως καθορίζεται με βάση την αποδεκτή αναλογία του δείγματος.

Κοινή χρήση, δείγματα είναι ο λόγος του αριθμού των μονάδων στον πληθυσμό του δείγματος προς τον αριθμό των μονάδων στο γενικό πληθυσμό:

Έτσι, με δείγμα 5% από μια παρτίδα ανταλλακτικών σε 1000 μονάδες. το μέγεθος του δείγματος Πείναι 50 μονάδες και με δείγμα 10% -100 μονάδες. και τα λοιπά. Με την κατάλληλη επιστημονική οργάνωση της δειγματοληψίας, τα σφάλματα αντιπροσωπευτικότητας μπορούν να μειωθούν σε ελάχιστες τιμές, με αποτέλεσμα η επιλεκτική παρατήρηση να γίνεται αρκετά ακριβής.

Η αυτοτυχαία επιλογή "στην καθαρή της μορφή" χρησιμοποιείται σπάνια στην πρακτική της επιλεκτικής παρατήρησης, αλλά είναι η αρχική μεταξύ όλων των άλλων τύπων επιλογής, περιέχει και εφαρμόζει τις βασικές αρχές της επιλεκτικής παρατήρησης.

Ας εξετάσουμε μερικά ερωτήματα της θεωρίας της μεθόδου δειγματοληψίας και του τύπου σφάλματος για ένα απλό τυχαίο δείγμα.

Κατά την εφαρμογή της μεθόδου δειγματοληψίας στις στατιστικές, συνήθως χρησιμοποιούνται δύο κύριοι τύποι γενικευτικών δεικτών: μέση τιμή ενός ποσοτικού χαρακτηριστικούΚαι τη σχετική τιμή του εναλλακτικού χαρακτηριστικού(η αναλογία ή η αναλογία μονάδων στον στατιστικό πληθυσμό που διαφέρουν από όλες τις άλλες μονάδες αυτού του πληθυσμού μόνο λόγω της παρουσίας του υπό μελέτη χαρακτηριστικού).

Μερίδιο δείγματος ( w ), ή συχνότητα, καθορίζεται από την αναλογία του αριθμού των μονάδων που έχουν το υπό μελέτη χαρακτηριστικό Τ,στον συνολικό αριθμό των μονάδων δειγματοληψίας Π:

w = t/n.

Για παράδειγμα, εάν από 100 εξαρτήματα δείγματος (u = 100), τα 95 εξαρτήματα αποδείχθηκαν τυπικά =95), μετά το κλάσμα δείγματος

w = 95 / 100 = 0,95 .

Για να χαρακτηριστεί η αξιοπιστία των δεικτών του δείγματος, υπάρχουν ΜέσηςΚαι οριακό δειγματοληπτικό σφάλμα.

Σφάλμα δειγματοληψίας ή, με άλλα λόγια, το σφάλμα αντιπροσωπευτικότητας είναι η διαφορά μεταξύ του αντίστοιχου δείγματος και των γενικών χαρακτηριστικών:

(1)

(2)

Το δειγματοληπτικό σφάλμα είναι εγγενές μόνο στις παρατηρήσεις του δείγματος. Όσο μεγαλύτερη είναι η τιμή αυτού του σφάλματος, τόσο περισσότερο οι δείκτες του δείγματος διαφέρουν από τους αντίστοιχους γενικούς δείκτες.

Ο μέσος όρος του δείγματος και η αναλογία δείγματος είναι εγγενώς τυχαίες μεταβλητές,που μπορεί να λάβει διαφορετικές τιμές ανάλογα με το ποιες μονάδες του πληθυσμού συμπεριλήφθηκαν στο δείγμα. Επομένως, τα σφάλματα δειγματοληψίας είναι επίσης τυχαίες μεταβλητές και μπορούν να λάβουν διαφορετικές τιμές. Επομένως, προσδιορίζεται ο μέσος όρος των πιθανών σφαλμάτων - το μέσο σφάλμα δειγματοληψίας.

Από τι εξαρτάται σημαίνει σφάλμα δειγματοληψίας!Με την επιφύλαξη της αρχής της τυχαίας επιλογής, το μέσο δειγματοληπτικό σφάλμα προσδιορίζεται, πρώτα απ' όλα, το μέγεθος του δείγματος:Όσο μεγαλύτερος είναι ο πληθυσμός, ceteris paribus, τόσο μικρότερο είναι το μέσο δειγματοληπτικό σφάλμα. Καλύπτοντας μια δειγματοληπτική έρευνα με αυξανόμενο αριθμό μονάδων του γενικού πληθυσμού, χαρακτηρίζουμε όλο και με μεγαλύτερη ακρίβεια ολόκληρο τον πληθυσμό.

Το μέσο σφάλμα δειγματοληψίας εξαρτάται επίσης από βαθμός διακύμανσηςμελετημένο γνώρισμα. Ο βαθμός διακύμανσης, όπως είναι γνωστό, χαρακτηρίζεται από διασπορά ή w (1 - w ) - για εναλλακτική πινακίδα. Όσο μικρότερη είναι η διακύμανση του χαρακτηριστικού, και επομένως η διακύμανση, τόσο μικρότερο είναι το μέσο δειγματοληπτικό σφάλμα και αντίστροφα. Με μηδενική διασπορά (το χαρακτηριστικό δεν ποικίλλει), το μέσο σφάλμα δειγματοληψίας είναι μηδέν, δηλ. οποιαδήποτε μονάδα του γενικού πληθυσμού θα χαρακτηρίσει με ακρίβεια ολόκληρο τον πληθυσμό σύμφωνα με αυτό το χαρακτηριστικό.

Η εξάρτηση του μέσου δειγματοληπτικού σφάλματος από τον όγκο του και τον βαθμό διακύμανσης του χαρακτηριστικού αντικατοπτρίζεται στους τύπους που μπορούν να χρησιμοποιηθούν για τον υπολογισμό του μέσου δειγματοληπτικού σφάλματος υπό συνθήκες παρατήρησης δείγματος, όταν τα γενικά χαρακτηριστικά ( x, p)είναι άγνωστα, και επομένως, δεν είναι δυνατό να βρεθεί το πραγματικό σφάλμα δειγματοληψίας απευθείας από τους τύπους (1), (2).

Με τυχαία επιλογή Τα μέσα σφάλματα υπολογίζονται θεωρητικά χρησιμοποιώντας τους ακόλουθους τύπους:

για το μέσο ποσοτικό χαρακτηριστικό

(3)

για μετοχή (εναλλακτικό χαρακτηριστικό)

(4)

Δεδομένου ότι, στην πράξη, η διακύμανση ενός χαρακτηριστικού στο γενικό πληθυσμό δεν είναι ακριβώς γνωστό, στην πράξη χρησιμοποιούν

τιμή διασποράς μικρό 2 , υπολογίζεται για τον πληθυσμό του δείγματος με βάση το νόμο των μεγάλων αριθμών, σύμφωνα με τον οποίο ο πληθυσμός του δείγματος με επαρκώς μεγάλο μέγεθος δείγματος αναπαράγει με ακρίβεια τα χαρακτηριστικά του γενικού πληθυσμού.

Έτσι, οι τύποι υπολογισμού μέσο δειγματοληπτικό σφάλμα Η τυχαία επαναδειγματοληψία θα γίνει ως εξής:

για το μέσο ποσοτικό χαρακτηριστικό

για μετοχή (εναλλακτικό χαρακτηριστικό)

(6)

Ωστόσο, η διακύμανση του πληθυσμού του δείγματος δεν είναι ίση με τη διακύμανση του γενικού πληθυσμού και επομένως, τα μέσα σφάλματα δείγματος που υπολογίζονται από τους τύπους (5) και (6) θα είναι κατά προσέγγιση. Αλλά στη θεωρία πιθανοτήτων αποδεικνύεται ότι η γενική διακύμανση εκφράζεται μέσω της διακύμανσης του δείγματος ως εξής:

(7)

Επειδή Π / (n-1) για αρκετά μεγάλο Π -τιμή κοντά στην ενότητα, μπορεί να υποτεθεί ότι = μικρό 2 , ΕΝΑΕπομένως, οι τύποι (5) και (6) μπορούν να χρησιμοποιηθούν σε πρακτικούς υπολογισμούς των μέσων σφαλμάτων δειγματοληψίας. Και μόνο σε περιπτώσεις μικρού δείγματος (όταν το μέγεθος του δείγματος δεν υπερβαίνει τα 30) είναι απαραίτητο να ληφθεί υπόψη ο συντελεστής n/(n-1)και υπολογίστε μικρό δείγμα μέσου σφάλματοςσύμφωνα με τον τύπο:

(8)

στους παραπάνω τύπους για τον υπολογισμό των μέσων σφαλμάτων δειγματοληψίας, είναι απαραίτητο να πολλαπλασιαστεί η ριζική έκφραση με 1-(p/ Ν ), αφού στη διαδικασία της μη επαναλαμβανόμενης δειγματοληψίας μειώνεται ο αριθμός των μονάδων στο γενικό πληθυσμό. Επομένως, για μη επαναλαμβανόμενη δειγματοληψία, οι τύποι υπολογισμού μέσο δειγματοληπτικό σφάλμα θα λάβει την εξής μορφή:

για το μέσο ποσοτικό χαρακτηριστικό

(9)

για μετοχή (εναλλακτικό χαρακτηριστικό)

(10)

Επειδή Ππάντα λιγότερο Ν , τότε ο πρόσθετος παράγοντας 1 - (n / Ν ) θα είναι πάντα λιγότερο από ένα. Επομένως, το μέσο σφάλμα στη μη επαναλαμβανόμενη επιλογή θα είναι πάντα μικρότερο από ό,τι στην επαναλαμβανόμενη επιλογή. Ταυτόχρονα, με ένα σχετικά μικρό ποσοστό του δείγματος, αυτός ο παράγοντας είναι κοντά στη μονάδα (για παράδειγμα, με δείγμα 5% είναι 0,95, με δείγμα 2% είναι 0,98 κ.λπ.). Επομένως, στην πράξη, οι τύποι (5) και (6) χρησιμοποιούνται μερικές φορές για τον προσδιορισμό του μέσου δειγματοληπτικού σφάλματος χωρίς τον καθορισμένο πολλαπλασιαστή, αν και το δείγμα οργανώνεται ως μη επαναλαμβανόμενο. Αυτό συμβαίνει όταν ο αριθμός των μονάδων στον πληθυσμό Νάγνωστο ή απεριόριστο, ή πότε Ππολύ λίγο σε σύγκριση με Ν,και, ουσιαστικά, η εισαγωγή ενός πρόσθετου συντελεστή κοντά σε ένα πρακτικά δεν θα επηρεάσει την τιμή του μέσου δειγματοληπτικού σφάλματος.

Μηχανική δειγματοληψία συνίσταται στο γεγονός ότι η επιλογή των μονάδων στο σύνολο δειγμάτων από το γενικό, χωρισμένη με ουδέτερο κριτήριο σε ίσα διαστήματα (ομάδες), πραγματοποιείται με τέτοιο τρόπο ώστε να επιλέγεται μόνο μία μονάδα από κάθε τέτοια ομάδα του δείγματος. Για να αποφευχθεί η μεροληψία, θα πρέπει να επιλεγεί η μονάδα που βρίσκεται στη μέση κάθε ομάδας.

Κατά την οργάνωση μιας μηχανικής επιλογής, οι μονάδες του πληθυσμού προκαθορίζονται (συνήθως σε λίστα) με συγκεκριμένη σειρά (για παράδειγμα, αλφαβητικά, κατά τοποθεσία, σε αύξουσα ή φθίνουσα σειρά των τιμών κάποιου δείκτη που δεν είναι που σχετίζεται με το υπό μελέτη ακίνητο, κ.λπ.), μετά από το οποίο επιλέξτε έναν δεδομένο αριθμό μονάδων μηχανικά, μετά από ένα ορισμένο διάστημα. Στην περίπτωση αυτή, το μέγεθος του διαστήματος στον γενικό πληθυσμό είναι ίσο με το αντίστροφο του μεριδίου δείγματος. Έτσι, με δείγμα 2%, επιλέγεται και ελέγχεται κάθε 50η μονάδα (1: 0,02), με δείγμα 5% - κάθε 20η μονάδα (1: 0,05), για παράδειγμα, ένα εξάρτημα που βγαίνει από το μηχάνημα .

Με έναν αρκετά μεγάλο πληθυσμό, η μηχανική επιλογή ως προς την ακρίβεια των αποτελεσμάτων είναι σχεδόν τυχαία. Επομένως, για τον προσδιορισμό του μέσου σφάλματος της μηχανικής δειγματοληψίας, χρησιμοποιούνται οι τύποι για αυτοτυχαία μη επαναλαμβανόμενη δειγματοληψία (9), (10).

Για να επιλέξετε μονάδες από έναν ετερογενή πληθυσμό, τα λεγόμενα τυπικό δείγμα, που χρησιμοποιείται σε περιπτώσεις όπου όλες οι μονάδες του γενικού πληθυσμού μπορούν να χωριστούν σε πολλές ποιοτικά ομοιογενείς, παρόμοιες ομάδες ανάλογα με τα χαρακτηριστικά που επηρεάζουν τους δείκτες που μελετώνται.

Κατά την έρευνα επιχειρήσεων, τέτοιες ομάδες μπορεί να είναι, για παράδειγμα, βιομηχανία και υποτομέας, μορφές ιδιοκτησίας. Στη συνέχεια, από κάθε τυπική ομάδα, γίνεται μια μεμονωμένη επιλογή μονάδων στο δείγμα από ένα κατάλληλο τυχαίο ή μηχανικό δείγμα.

Συνήθως χρησιμοποιείται τυπική δειγματοληψία στη μελέτη σύνθετων στατιστικών πληθυσμών. Για παράδειγμα, σε μια δειγματοληπτική έρευνα των οικογενειακών προϋπολογισμών των εργαζομένων και των εργαζομένων σε ορισμένους τομείς της οικονομίας, η παραγωγικότητα της εργασίας των εργαζομένων σε μια επιχείρηση, που αντιπροσωπεύεται από ξεχωριστές ομάδες δεξιοτήτων.

Η τυπική δειγματοληψία δίνει πιο ακριβή αποτελέσματα από άλλες μεθόδους επιλογής μονάδων στον πληθυσμό του δείγματος. Η τυποποίηση του γενικού πληθυσμού διασφαλίζει την αντιπροσωπευτικότητα ενός τέτοιου δείγματος, την αναπαράσταση κάθε τυπολογικής ομάδας σε αυτό, γεγονός που καθιστά δυνατό τον αποκλεισμό της επίδρασης της διασποράς μεταξύ ομάδων στο μέσο σφάλμα δείγματος,

Κατά τον καθορισμό μέσο σφάλμα ενός τυπικού δείγματοςχρησιμοποιείται ως δείκτης διακύμανσης. ο μέσος όρος των ενδοομαδικών διακυμάνσεων.

Το μέσο δειγματοληπτικό σφάλμα βρίσκονται με τους τύπους:

για το μέσο ποσοτικό χαρακτηριστικό

(επανεπιλογή) (11)

(μη επαναλαμβανόμενη επιλογή). ( 12)

για μετοχή (εναλλακτικό χαρακτηριστικό)

(επανεπιλογή) (13)

(μη επαναλαμβανόμενη επιλογή), (14)

Οπου - ο μέσος όρος των διασπορών εντός της ομάδας για τον πληθυσμό του δείγματος·

Ο μέσος όρος των ενδοομιλικών διακυμάνσεων της μετοχής (εναλλακ

γνώρισμα) στον πληθυσμό του δείγματος.

σειριακή δειγματοληψία περιλαμβάνει μια τυχαία επιλογή από τον γενικό πληθυσμό όχι μεμονωμένων μονάδων, αλλά ίσων ομάδων τους (φωλιές, σειρές) προκειμένου να υποβληθούν όλες ανεξαιρέτως οι μονάδες σε παρατήρηση σε τέτοιες ομάδες.

Η χρήση της σειριακής δειγματοληψίας οφείλεται στο γεγονός ότι πολλά εμπορεύματα για τη μεταφορά, αποθήκευση και πώλησή τους συσκευάζονται σε συσκευασίες, κουτιά κ.λπ. Επομένως, κατά τον έλεγχο της ποιότητας των συσκευασμένων εμπορευμάτων, είναι πιο λογικό να ελέγχετε πολλές συσκευασίες (σειρές) παρά να επιλέγετε την απαιτούμενη ποσότητα αγαθών από όλες τις συσκευασίες.

Δεδομένου ότι όλες οι μονάδες χωρίς εξαίρεση εξετάζονται μέσα σε ομάδες (σειρές), το μέσο σφάλμα δειγματοληψίας (όταν επιλέγουμε ίσες σειρές) εξαρτάται μόνο από τη διακύμανση μεταξύ ομάδων (ενδιάμεσων σειρών).

Το μέσο δειγματοληπτικό σφάλμα για τη μέση βαθμολογία κατά τη σειριακή επιλογή, βρίσκονται με τους τύπους:

(επανεπιλογή) ( 15 )

(μη επαναλαμβανόμενη επιλογή), ( 16 )

Οπου r- αριθμός επιλεγμένων σειρών. R - συνολικός αριθμός επεισοδίων.

Η διασπορά μεταξύ ομάδων του σειριακού δείγματος υπολογίζεται ως εξής:

πού είναι ο μέσος όρος της i-ης σειράς; - συνολικός μέσος όρος για ολόκληρο το δείγμα.

Μέσο σφάλμα δειγματοληψίας για αναλογία (εναλλακτικό χαρακτηριστικό) σε σειριακή επιλογή:

(επανεπιλογή) ( 17 )

(μη επαναλαμβανόμενη επιλογή). ( 18 )

Διαομαδική(ενδιάμεση σειρά) τη διακύμανση της αναλογίας του σειριακού δείγματοςκαθορίζεται από τον τύπο:

(19)

Οπου w Εγώ - αναλογία του χαρακτηριστικού στη σειρά i. - το συνολικό μερίδιο του χαρακτηριστικού σε ολόκληρο το δείγμα.

Στην πρακτική των στατιστικών ερευνών, εκτός από τις προηγούμενες μεθόδους επιλογής, χρησιμοποιείται ο συνδυασμός τους. (συνδυασμένη επιλογή).

3. Επέκταση των αποτελεσμάτων του δείγματος στον πληθυσμό

Ο απώτερος στόχος της παρατήρησης του δείγματος είναι ο χαρακτηρισμός του γενικού πληθυσμού με βάση τα αποτελέσματα του δείγματος.

Οι μέσοι όροι δειγμάτων και οι σχετικές τιμές κατανέμονται στον γενικό πληθυσμό, λαμβάνοντας υπόψη το όριο του πιθανού σφάλματός τους.

Σε κάθε συγκεκριμένο δείγμα, η απόκλιση μεταξύ του μέσου όρου του δείγματος και του γενικού, δηλ. μπορεί να είναι μικρότερο από το μέσο δειγματοληπτικό σφάλμα , ίσο ή μεγαλύτερο από αυτήν.

Επιπλέον, κάθε μια από αυτές τις αποκλίσεις έχει διαφορετική πιθανότητα(αντικειμενική πιθανότητα επέλευσης του γεγονότος). Επομένως, οι πραγματικές αποκλίσεις μεταξύ του μέσου όρου του δείγματος και του γενικού μπορεί να θεωρηθεί ως οριακό οριακό σφάλμα που σχετίζεται με το μέσο σφάλμα και είναι εγγυημένο με μια ορισμένη πιθανότητα R.

Το οριακό σφάλμα δειγματοληψίας για τη μέση τιμή () στο επανεπιλογήμπορεί να υπολογιστεί χρησιμοποιώντας τον τύπο:

(20)

Οπου t- κανονικοποιημένη απόκλιση - "συντελεστής εμπιστοσύνης", ανάλογα με την πιθανότητα με την οποία είναι εγγυημένο το οριακό σφάλμα δειγματοληψίας.

Μέσο δειγματοληπτικό σφάλμα.

Ο τύπος μπορεί να γραφτεί με παρόμοιο τρόπο οριακό σφάλμα δειγματοληψίας για το κλάσμα όταν επιλέγεται ξανά:

(21)

Με τυχαία μη επαναλαμβανόμενη επιλογήστους τύπους για τον υπολογισμό των οριακών σφαλμάτων δειγματοληψίας (20) και (21), είναι απαραίτητο να πολλαπλασιαστεί η ριζική έκφραση με 1 - ( n / Ν ) .

Ο τύπος για το οριακό δειγματοληπτικό σφάλμα προκύπτει από τις βασικές διατάξεις της θεωρίας της μεθόδου δειγματοληψίας, που διατυπώνονται σε μια σειρά από θεωρήματα της θεωρίας πιθανοτήτων, που αντικατοπτρίζουν το νόμο των μεγάλων αριθμών.

Με βάση την Π.Λ. Chebyshev (με διευκρινίσεις από τον A.M. Lyapunov) με πιθανότητα αυθαίρετα κοντά στο ένα, μπορεί να υποστηριχθεί ότι με ένα αρκετά μεγάλο μέγεθος δείγματος και μια περιορισμένη γενική διακύμανση, οι δείκτες γενίκευσης του δείγματος (μέσος όρος, μερίδιο) θα διαφέρουν ελάχιστα αυθαίρετα από τους αντίστοιχους γενικούς δείκτες.

Όσον αφορά την εύρεση ΜέσηςΤιμές χαρακτηριστικών, αυτό το θεώρημα μπορεί να γραφτεί ως εξής:

(22)

και για μερίδιασημάδι:

(23 )

Οπου (24)

Έτσι, η τιμή του οριακού σφάλματος δειγματοληψίας μπορεί να οριστεί με μια ορισμένη πιθανότητα.

Τιμές συνάρτησης ΦΑ( t ) σε διαφορετικές τιμές tως συντελεστής πολλαπλότητας του μέσου δειγματοληπτικού σφάλματος, προσδιορίζονται με βάση ειδικά καταρτισμένους πίνακες. Ακολουθούν ορισμένες τιμές που χρησιμοποιούνται συχνότερα για δείγματα επαρκώς μεγάλου μεγέθους ( n 30):

t 1,000 1,960 2,000 2,580 3,000

ΦΑ( t ) 0,683 0,950 0,954 0,990 0,997

Το οριακό σφάλμα δειγματοληψίας απαντά στο ερώτημα της ακρίβειας δειγματοληψίας με μια ορισμένη πιθανότητα, η τιμή της οποίας καθορίζεται από τον συντελεστή t(σε πρακτικούς υπολογισμούς, κατά κανόνα, η δεδομένη πιθανότητα δεν πρέπει να είναι μικρότερη από 0,95). Ναι, στο t= 1 οριακό σφάλμα θα είναι = . Επομένως, με πιθανότητα 0,683, μπορεί να υποστηριχθεί ότι η διαφορά μεταξύ του δείγματος και των γενικών δεικτών δεν θα υπερβαίνει το ένα μέσο δειγματοληπτικό σφάλμα. Με άλλα λόγια, στο 68,3% των περιπτώσεων, το σφάλμα αντιπροσωπευτικότητας δεν θα υπερβαίνει το ±1.

Στο t = 2 με πιθανότητα 0,954 δεν θα ξεπεράσει το ±2,

στο t = 3 με πιθανότητα 0,997 - εκτός ±3, κ.λπ.

Όπως φαίνεται από τις παραπάνω τιμές της συνάρτησης φά (t) (δείτε την τελευταία τιμή), η πιθανότητα σφάλματος να είναι ίση ή μεγαλύτερη από το τριπλάσιο του μέσου σφάλματος του δείγματος, δηλ. Το 3 είναι εξαιρετικά μικρό και ίσο με 0,003, δηλαδή 1-0,997. Τέτοια απίθανα γεγονότα θεωρούνται πρακτικά αδύνατα, και επομένως η αξία Το = 3 μπορεί να ληφθεί ως το όριο του πιθανού σφάλματος δειγματοληψίας.

Η παρατήρηση του δείγματος πραγματοποιείται προκειμένου να επεκταθούν τα συμπεράσματα που προκύπτουν από τα δεδομένα του δείγματος στον γενικό πληθυσμό. Ένα από τα κύρια καθήκοντα είναι η αξιολόγηση των μελετηθέντων χαρακτηριστικών (παραμέτρων) του γενικού πληθυσμού με βάση τα δεδομένα του δείγματος.

Το οριακό σφάλμα δειγματοληψίας σάς επιτρέπει να προσδιορίσετε οριακές τιμές των χαρακτηριστικών του γενικού πληθυσμού και τα διαστήματα εμπιστοσύνης τους:

για μέση (25)

για μερίδιο (26)

Αυτό σημαίνει ότι με μια δεδομένη πιθανότητα μπορεί να υποστηριχθεί ότι η τιμή του γενικού μέσου όρου θα πρέπει να αναμένεται εντός του εύρους από - πριν +

Ομοίως, το διάστημα εμπιστοσύνης του γενικού κλάσματος μπορεί να γραφτεί:

Μαζί με την απόλυτη τιμή του οριακού δειγματοληπτικού σφάλματος, το οριακό σχετικό δειγματοληπτικό σφάλμα,το οποίο ορίζεται ως το ποσοστό του οριακού δειγματοληπτικού σφάλματος προς το αντίστοιχο χαρακτηριστικό του δείγματος:

για τον μέσο όρο, %: (27)

για μερίδιο, %: (28)

Ας εξετάσουμε το ενδεχόμενο εύρεσης των μέσων και των οριακών σφαλμάτων δειγματοληψίας, προσδιορίζοντας τα όρια εμπιστοσύνης του μέσου όρου και της αναλογίας χρησιμοποιώντας συγκεκριμένα παραδείγματα.

Εργασία 1.Για να προσδιοριστεί η ταχύτητα των διακανονισμών με πιστωτές εταιρικών επιχειρήσεων σε μια εμπορική τράπεζα, πραγματοποιήθηκε ένα τυχαίο δείγμα 100 παραστατικών πληρωμής, για τα οποία ο μέσος χρόνος μεταφοράς και λήψης χρημάτων ήταν 22 ημέρες ( = 22) με τυπική απόκλιση 6 ημερών (S= 6).

Απαιτείται με πιθανότητα P = 0,954 για τον προσδιορισμό του οριακού σφάλματος του μέσου όρου του δείγματος και των ορίων εμπιστοσύνης της μέσης διάρκειας διακανονισμών των επιχειρήσεων αυτής της εταιρείας.

Λύση.οριακό σφάλμα = tκαθορίζεται από τον τύπο επανεπιλογής (6.20), δεδομένου ότι το μέγεθος του γενικού πληθυσμού Νάγνωστος. Από τις τιμές που παρουσιάζονται φά (t) (βλ. σελ. 98) για την πιθανότητα R= 0,954 εύρημα t = 2.

Επομένως, το οριακό σφάλμα δειγματοληψίας, ημέρες:

Ο συνολικός μέσος όρος θα είναι = ± , και τα διαστήματα εμπιστοσύνης (όρια) του γενικού μέσου όρου υπολογίζονται με βάση τη διπλή ανισότητα:

Έτσι, με πιθανότητα 0,954, μπορεί να υποστηριχθεί ότι η μέση διάρκεια διακανονισμού των επιχειρήσεων αυτής της εταιρείας κυμαίνεται από 20,8 έως 23,2 ημέρες.

Εργασία 2.Μεταξύ 1.000 οικογενειών που συμμετείχαν στο δείγμα στην περιοχή ως προς το κατά κεφαλήν εισόδημα (δείγμα 2%, μηχανικό), 300 οικογένειες αποδείχθηκαν χαμηλού εισοδήματος.

Απαιτείται με πιθανότητα 0,997 για τον προσδιορισμό της αναλογίας των οικογενειών χαμηλού εισοδήματος σε ολόκληρη την περιοχή.

Λύση.Το μερίδιο του δείγματος (το μερίδιο των οικογενειών με χαμηλό εισόδημα μεταξύ των οικογενειών που ερωτήθηκαν) είναι ίσο με:

Σύμφωνα με τα δεδομένα που παρουσιάστηκαν προηγουμένως F( t) για πιθανότητα 0,997 βρίσκουμε t= 3 (βλ. σελ. 99). Το οριακό σφάλμα της μετοχής καθορίζεται από τον τύπο για μη επαναλαμβανόμενη επιλογή (η μηχανική δειγματοληψία είναι πάντα μη επαναλαμβανόμενη):

Περιορίστε το σχετικό σφάλμα δειγματοληψίας, %:

Το γενικό μερίδιο και τα όρια εμπιστοσύνης της γενικής μετοχής υπολογίζονται με βάση τη διπλή ανισότητα:

Στο παράδειγμά μας:

Έτσι, σχεδόν αξιόπιστα, με πιθανότητα 0,997, μπορεί να υποστηριχθεί ότι το ποσοστό των οικογενειών με χαμηλό εισόδημα μεταξύ όλων των οικογενειών της περιοχής κυμαίνεται από 28,6 έως 31,4%.

Εργασία 3.Για τον προσδιορισμό της απόδοσης των σιτηρών, πραγματοποιήθηκε δειγματοληπτική έρευνα σε 100 αγροκτήματα της περιοχής με διάφορες μορφές ιδιοκτησίας, ως αποτέλεσμα της οποίας προέκυψαν συνοπτικά στοιχεία (Πίνακας 6.1). Είναι απαραίτητο με πιθανότητα 0,954 να προσδιοριστεί το οριακό σφάλμα του μέσου όρου του δείγματος και τα όρια εμπιστοσύνης της μέσης απόδοσης των σιτηρών για όλες τις εκμεταλλεύσεις της περιοχής.

Πίνακας 6.1

Κατανομή της απόδοσης από αγροκτήματα της περιοχής με διαφορετικές μορφές ιδιοκτησίας

Λύση.Δεδομένου ότι τα αγροκτήματα της περιοχής που ερευνήθηκαν ομαδοποιούνται σύμφωνα με τη μορφή ιδιοκτησίας, το οριακό σφάλμα της μέσης απόδοσης καθορίζεται από τον τύπο για ένα τυπικό δείγμα, που πραγματοποιείται με τη μέθοδο επαναλαμβανόμενης επιλογής (το μέγεθος του γενικού πληθυσμού N είναι άγνωστο ):

Σε αυτόν τον τύπο, ο μέσος όρος των διακυμάνσεων εντός της ομάδας είναι άγνωστος.

Υπολογίζεται σύμφωνα με τον τύπο:

Σύμφωνα με τα στοιχεία που παρουσιάστηκαν προηγουμένως (βλ. σελ. 98) φά (t) για την πιθανότητα R=0,954 εύρημα t = 2.

Στη συνέχεια, το οριακό σφάλμα δειγματοληψίας, c/ha:

Γενικός μέσος όρος: = ± . Για να βρείτε τα όριά του, πρέπει πρώτα να υπολογίσετε τη μέση απόδοση για τον πληθυσμό του δείγματος , c/ha:

Περιορίστε το σχετικό σφάλμα δειγματοληψίας, %:

Τα όρια εμπιστοσύνης του γενικού μέσου όρου υπολογίζονται με βάση τη διπλή ανισότητα:

Έτσι, με πιθανότητα 0,954, μπορούμε να εγγυηθούμε ότι η μέση απόδοση των σιτηρών στην περιοχή δεν θα είναι μικρότερη από 20 εκατοστά ανά εκτάριο, αλλά όχι μεγαλύτερη από 22 εκατοστά ανά εκτάριο.

Προσδιορισμός του απαιτούμενου μεγέθους δείγματος. Όταν σχεδιάζετε μια παρατήρηση δείγματος με προκαθορισμένη τιμή του επιτρεπόμενου σφάλματος δειγματοληψίας, είναι πολύ σημαντικό να προσδιορίζεται σωστά το μέγεθος (όγκος) του πληθυσμού του δείγματος, το οποίο, με μια ορισμένη πιθανότητα, θα παρέχει μια δεδομένη ακρίβεια των αποτελεσμάτων παρατήρησης. Τύποι για τον προσδιορισμό του απαιτούμενου μεγέθους δείγματος Πλαμβάνεται εύκολα απευθείας από τους τύπους σφαλμάτων του δείγματος.

Έτσι, από τους τύπους για το οριακό σφάλμα δειγματοληψίας για επανεπιλογήείναι εύκολο (αφού τετραγωνιστούν και οι δύο πλευρές της ισότητας) να εκφραστεί απαιτούμενο μέγεθος δείγματος:

για το μέσο ποσοτικό χαρακτηριστικό

για μετοχή (εναλλακτικό χαρακτηριστικό)

(30 )

Ομοίως, από τους τύπους για το οριακό σφάλμα δειγματοληψίας για μη επαναλαμβανόμενη επιλογήτο βρίσκουμε

(για τον μέσο όρο) (31 )

(για κοινή χρήση). (32 )

Αυτοί οι τύποι δείχνουν ότι καθώς αυξάνεται το εκτιμώμενο σφάλμα δειγματοληψίας, το απαιτούμενο μέγεθος δείγματος μειώνεται σημαντικά.

Για να υπολογίσετε το μέγεθος του δείγματος, πρέπει να γνωρίζετε τη διακύμανση. Μπορεί να δανειστεί από προηγούμενες έρευνες του ίδιου ή παρόμοιου πληθυσμού και εάν αυτές δεν είναι διαθέσιμες, τότε θα πρέπει να πραγματοποιηθεί ειδική δειγματοληπτική έρευνα μικρού μεγέθους για τον προσδιορισμό της διακύμανσης.

Εργασία 4.Για τον προσδιορισμό του μέσου όρου ηλικίας των 1200 φοιτητών της σχολής, είναι απαραίτητο να διεξαχθεί μια τυχαία έρευνα με τη μέθοδο της τυχαίας μη επαναλαμβανόμενης επιλογής. Προκαταρκτικά διαπιστώνεται ότι η τυπική απόκλιση της ηλικίας των μαθητών είναι τα 10 έτη.

Πόσοι μαθητές πρέπει να ερευνηθούν ώστε με πιθανότητα 0,954 το μέσο δειγματοληπτικό σφάλμα να μην ξεπερνά τα 3 χρόνια;

Λύση. Ας υπολογίσουμε το απαιτούμενο μέγεθος δείγματος, άτομα, σύμφωνα με τον τύπο μη επαναλαμβανόμενης επιλογής (6.31), δεδομένου ότι t = 2 με R = 0,954:

Έτσι, ένα δείγμα 47 ατόμων. παρέχει την καθορισμένη ακρίβεια με μη επαναλαμβανόμενη επιλογή.

Η μέθοδος δειγματοληψίας χρησιμοποιείται ευρέως στη στατιστική πρακτική για τη λήψη οικονομικών πληροφοριών.

Η επιλεκτική μέθοδος αποκτά μεγάλη σημασία στις τρέχουσες συνθήκες μετάβασης στην οικονομία της αγοράς. Οι αλλαγές στη φύση των οικονομικών σχέσεων, το ενοίκιο, η ιδιοκτησία μεμονωμένων ομάδων και ατόμων προκαλούν αλλαγές στις λειτουργίες λογιστικής και στατιστικής, μείωση και απλοποίηση της υποβολής εκθέσεων. Ταυτόχρονα, οι αυξανόμενες απαιτήσεις για τη διοίκηση αυξάνουν την ανάγκη για αξιόπιστη πληροφόρηση, αυξάνοντας περαιτέρω την αποτελεσματικότητά της. Όλα αυτά οδηγούν σε ευρύτερη εφαρμογή της μεθόδου δειγματοληψίας στην οικονομία.

Κάποια εμπειρία από δειγματοληπτικές έρευνες έχει ήδη συσσωρευτεί σε εγχώριες στατιστικές.

Ο συνολικός αριθμός αντικειμένων παρατήρησης (άνθρωποι, νοικοκυριά, επιχειρήσεις, οικισμοί κ.λπ.) με ένα συγκεκριμένο σύνολο χαρακτηριστικών (φύλο, ηλικία, εισόδημα, αριθμό, κύκλος εργασιών κ.λπ.), περιορισμένο σε χώρο και χρόνο. Παραδείγματα πληθυσμού

  • Όλοι οι κάτοικοι της Μόσχας (10,6 εκατομμύρια άνθρωποι σύμφωνα με την απογραφή του 2002)
  • Μοσχοβίτες άνδρες (4,9 εκατομμύρια σύμφωνα με την απογραφή του 2002)
  • Ρωσικά νομικά πρόσωπα (2,2 εκατομμύρια στις αρχές του 2005)
  • Καταστήματα λιανικής πώλησης προϊόντων διατροφής (20 χιλιάδες στις αρχές του 2008) κ.λπ.

Δείγμα (πληθυσμός δείγματος)

Μέρος των αντικειμένων από τον πληθυσμό επιλέχτηκε για μελέτη προκειμένου να εξαχθεί ένα συμπέρασμα για το σύνολο του πληθυσμού. Προκειμένου το συμπέρασμα που προκύπτει από τη μελέτη του δείγματος να επεκταθεί σε ολόκληρο τον πληθυσμό, το δείγμα πρέπει να έχει την ιδιότητα να είναι αντιπροσωπευτικό.

Αντιπροσωπευτικότητα δείγματος

Η ιδιότητα του δείγματος να αντικατοπτρίζει σωστά τον γενικό πληθυσμό. Το ίδιο δείγμα μπορεί να είναι ή να μην είναι αντιπροσωπευτικό διαφορετικών πληθυσμών.
Παράδειγμα:

  • Ένα δείγμα που αποτελείται εξ ολοκλήρου από Μοσχοβίτες που διαθέτουν αυτοκίνητο δεν αντιπροσωπεύει ολόκληρο τον πληθυσμό της Μόσχας.
  • Το δείγμα των ρωσικών επιχειρήσεων με έως και 100 υπαλλήλους δεν αντιπροσωπεύει όλες τις επιχειρήσεις στη Ρωσία.
  • Το δείγμα των Μοσχοβιτών που πραγματοποιούν αγορές στην αγορά δεν αντιπροσωπεύει την αγοραστική συμπεριφορά όλων των Μοσχοβιτών.

Ταυτόχρονα, αυτά τα δείγματα (υπό τους άλλους όρους) μπορούν να αντιπροσωπεύουν τέλεια Μοσχοβίτες ιδιοκτήτες αυτοκινήτων, μικρές και μεσαίες ρωσικές επιχειρήσεις και αγοραστές που πραγματοποιούν αγορές στις αγορές, αντίστοιχα.
Είναι σημαντικό να κατανοήσουμε ότι η αντιπροσωπευτικότητα του δείγματος και το δειγματοληπτικό σφάλμα είναι διαφορετικά φαινόμενα. Η αντιπροσωπευτικότητα, σε αντίθεση με το σφάλμα, δεν εξαρτάται από το μέγεθος του δείγματος.
Παράδειγμα:
Όσο κι αν αυξήσουμε τον αριθμό των ερωτηθέντων Μοσχοβιτών-ιδιοκτητών αυτοκινήτων, δεν θα μπορέσουμε να εκπροσωπήσουμε όλους τους Μοσχοβίτες με αυτό το δείγμα.

Σφάλμα δειγματοληψίας (διάστημα εμπιστοσύνης)

Η απόκλιση των αποτελεσμάτων που προέκυψαν με τη βοήθεια δειγματοληπτικής παρατήρησης από τα αληθινά δεδομένα του γενικού πληθυσμού.
Υπάρχουν δύο τύποι σφαλμάτων δειγματοληψίας: στατιστικό και συστηματικό. Το στατιστικό σφάλμα εξαρτάται από το μέγεθος του δείγματος. Όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο χαμηλότερο είναι.
Παράδειγμα:
Για ένα απλό τυχαίο δείγμα 400 μονάδων, το μέγιστο στατιστικό σφάλμα (με βεβαιότητα 95%) είναι 5%, για δείγμα 600 μονάδων - 4%, για δείγμα 1100 μονάδων - 3% .
Το συστηματικό σφάλμα εξαρτάται από διάφορους παράγοντες που έχουν σταθερό αντίκτυπο στη μελέτη και ωθούν τα αποτελέσματα της μελέτης προς μια συγκεκριμένη κατεύθυνση.
Παράδειγμα:

  • Η χρήση οποιουδήποτε δείγματος πιθανοτήτων υποτιμά το ποσοστό των ενεργών ατόμων υψηλού εισοδήματος. Αυτό συμβαίνει λόγω του γεγονότος ότι τέτοιοι άνθρωποι είναι πολύ πιο δύσκολο να βρεθούν σε οποιοδήποτε συγκεκριμένο μέρος (για παράδειγμα, στο σπίτι).
  • Το πρόβλημα των ερωτηθέντων που αρνούνται να απαντήσουν σε ερωτήσεις (το μερίδιο των "refuseniks" στη Μόσχα, για διαφορετικές έρευνες, κυμαίνεται από 50% έως 80%)

Σε ορισμένες περιπτώσεις, όταν είναι γνωστές οι πραγματικές κατανομές, η μεροληψία μπορεί να εξουδετερωθεί με την εισαγωγή ποσοστώσεων ή τη στάθμιση των δεδομένων, αλλά στις περισσότερες πραγματικές μελέτες, ακόμη και η εκτίμησή της μπορεί να είναι αρκετά προβληματική.

Τύποι δειγμάτων

Τα δείγματα χωρίζονται σε δύο τύπους:

  • πιθανολογικός
  • απιθανότητα

1. Δείγματα πιθανοτήτων
1.1 Τυχαία δειγματοληψία (απλή τυχαία επιλογή)
Ένα τέτοιο δείγμα προϋποθέτει την ομοιογένεια του γενικού πληθυσμού, την ίδια πιθανότητα διαθεσιμότητας όλων των στοιχείων, την παρουσία μιας πλήρους λίστας όλων των στοιχείων. Κατά την επιλογή στοιχείων, κατά κανόνα, χρησιμοποιείται ένας πίνακας τυχαίων αριθμών.
1.2 Μηχανική (συστηματική) δειγματοληψία
Ένα είδος τυχαίου δείγματος, ταξινομημένο κατά κάποιο χαρακτηριστικό (αλφαβητική σειρά, αριθμός τηλεφώνου, ημερομηνία γέννησης κ.λπ.). Το πρώτο στοιχείο επιλέγεται τυχαία και, στη συνέχεια, κάθε 'k' στοιχείο επιλέγεται σε προσαυξήσεις του 'n'. Το μέγεθος του γενικού πληθυσμού, ενώ - N=n*k
1.3 Στρωματοποιημένο (ζωνικό)
Χρησιμοποιείται σε περίπτωση ετερογένειας του γενικού πληθυσμού. Ο γενικός πληθυσμός χωρίζεται σε ομάδες (στρώματα). Σε κάθε στρώμα, η επιλογή πραγματοποιείται τυχαία ή μηχανικά.
1.4 Σειριακή (ένθετη ή ομαδοποιημένη) δειγματοληψία
Με τη σειριακή δειγματοληψία, οι μονάδες επιλογής δεν είναι τα ίδια τα αντικείμενα, αλλά οι ομάδες (συστάδες ή φωλιές). Οι ομάδες επιλέγονται τυχαία. Τα αντικείμενα εντός των ομάδων ερευνώνται παντού.

2. Απίστευτα δείγματα
Η επιλογή σε ένα τέτοιο δείγμα πραγματοποιείται όχι σύμφωνα με τις αρχές της τύχης, αλλά με υποκειμενικά κριτήρια - προσβασιμότητα, τυπικότητα, ίση εκπροσώπηση κ.λπ.
2.1. Δειγματοληψία ποσοστώσεων
Αρχικά, κατανέμεται ένας ορισμένος αριθμός ομάδων αντικειμένων (για παράδειγμα, άνδρες ηλικίας 20-30 ετών, 31-45 ετών και 46-60 ετών· άτομα με εισόδημα έως 30 χιλιάδες ρούβλια, με εισόδημα από 30 έως 60 χιλιάδες ρούβλια και με εισόδημα άνω των 60 χιλιάδων ρούβλια ) Για κάθε ομάδα, προσδιορίζεται ο αριθμός των αντικειμένων που πρόκειται να ερευνηθούν. Ο αριθμός των αντικειμένων που πρέπει να εμπίπτουν σε καθεμία από τις ομάδες ορίζεται, τις περισσότερες φορές, είτε σε αναλογία με το προηγουμένως γνωστό μερίδιο της ομάδας στον γενικό πληθυσμό, είτε ο ίδιος για κάθε ομάδα. Μέσα στις ομάδες, τα αντικείμενα επιλέγονται τυχαία. Η δειγματοληψία ποσοστώσεων χρησιμοποιείται αρκετά συχνά.
2.2. Μέθοδος χιονοστιβάδας
Το δείγμα κατασκευάζεται ως εξής. Κάθε ερωτώμενος, ξεκινώντας από τον πρώτο, καλείται να επικοινωνήσει με τους φίλους, τους συναδέλφους, τους γνωστούς του που θα ταίριαζαν στις συνθήκες επιλογής και θα μπορούσαν να λάβουν μέρος στη μελέτη. Έτσι, με εξαίρεση το πρώτο βήμα, το δείγμα διαμορφώνεται με τη συμμετοχή των ίδιων των αντικειμένων της μελέτης. Η μέθοδος χρησιμοποιείται συχνά όταν είναι απαραίτητο να βρεθούν και να συνεντεύξεις δυσπρόσιτες ομάδες ερωτηθέντων (για παράδειγμα, ερωτηθέντες με υψηλό εισόδημα, ερωτηθέντες που ανήκουν στην ίδια επαγγελματική ομάδα, ερωτηθέντες που έχουν κάποια παρόμοια χόμπι / πάθη κ.λπ. )
2.3 Αυθόρμητη δειγματοληψία
Οι πιο προσιτοί ερωτηθέντες ερωτήθηκαν. Τυπικά παραδείγματα αυθόρμητων δειγμάτων υπάρχουν σε εφημερίδες/περιοδικά που δίνονται στους ερωτηθέντες για αυτοσυμπλήρωση, οι περισσότερες έρευνες στο Διαδίκτυο. Το μέγεθος και η σύνθεση των αυθόρμητων δειγμάτων δεν είναι γνωστά εκ των προτέρων και καθορίζεται από μία μόνο παράμετρο - τη δραστηριότητα των ερωτηθέντων.
2.4 Δείγμα τυπικών περιπτώσεων
Επιλέγονται μονάδες του γενικού πληθυσμού που έχουν μια μέση (τυπική) τιμή του χαρακτηριστικού. Αυτό εγείρει το πρόβλημα της επιλογής ενός χαρακτηριστικού και του προσδιορισμού της τυπικής του τιμής.

Μάθημα διαλέξεων για τη θεωρία της στατιστικής

Περισσότερες λεπτομερείς πληροφορίες σχετικά με τις παρατηρήσεις δειγμάτων μπορούν να ληφθούν με προβολή.

Διαστημική εκτίμηση πιθανότητας γεγονότος. Τύποι για τον υπολογισμό του αριθμού των δειγμάτων στην περίπτωση μεθόδου τυχαίας επιλογής.

Για να προσδιορίσουμε τις πιθανότητες των γεγονότων που μας ενδιαφέρουν, χρησιμοποιούμε τη μέθοδο δειγματοληψίας: πραγματοποιούμε nανεξάρτητα πειράματα, σε καθένα από τα οποία το γεγονός Α μπορεί να συμβεί (ή να μην συμβεί) (πιθανότητα Rη εμφάνιση του γεγονότος Α σε κάθε πείραμα είναι σταθερή). Τότε η σχετική συχνότητα p* εμφανίσεων γεγονότων ΕΝΑσε μια σειρά από nΟι δοκιμές λαμβάνονται ως σημειακή εκτίμηση για την πιθανότητα Πεμφάνιση ενός γεγονότος ΕΝΑσε ξεχωριστό τεστ. Σε αυτήν την περίπτωση, καλείται η τιμή p* δείγμα μεριδίου περιστατικά συμβάντων ΕΝΑ, και r - γενική μετοχή .

Δυνάμει της συνέπειας του κεντρικού οριακού θεωρήματος (θεώρημα Moivre-Laplace), η σχετική συχνότητα ενός γεγονότος με μεγάλο μέγεθος δείγματος μπορεί να θεωρηθεί κανονικά κατανεμημένη με τις παραμέτρους M(p*)=p και

Επομένως, για n>30, το διάστημα εμπιστοσύνης για το γενικό κλάσμα μπορεί να κατασκευαστεί χρησιμοποιώντας τους τύπους:


όπου το u cr βρίσκεται σύμφωνα με τους πίνακες της συνάρτησης Laplace, λαμβάνοντας υπόψη τη δεδομένη πιθανότητα εμπιστοσύνης γ: 2Ф(u cr)=γ.

Με ένα μικρό μέγεθος δείγματος n≤30, το οριακό σφάλμα ε προσδιορίζεται από τον πίνακα κατανομής Student:
όπου t cr =t(k; α) και ο αριθμός βαθμών ελευθερίας k=n-1 πιθανότητα α=1-γ (εμβαδόν δύο όψεων).

Οι τύποι ισχύουν εάν η επιλογή πραγματοποιήθηκε τυχαία με επαναλαμβανόμενο τρόπο (ο γενικός πληθυσμός είναι άπειρος), διαφορετικά είναι απαραίτητο να γίνει διόρθωση για τη μη επαναλαμβανόμενη επιλογή (πίνακας).

Μέσο δειγματοληπτικό σφάλμα για τη γενική αναλογία

ΠληθυσμόςΑτελείωτεςαπόλυτος όγκος Ν
Τύπος επιλογήςΑλλεπάλληλοςμη επαναλαμβανόμενο
Μέσο δειγματοληπτικό σφάλμα

Τύποι για τον υπολογισμό του μεγέθους του δείγματος με σωστή μέθοδο τυχαίας επιλογής

Μέθοδος επιλογήςΤύποι μεγεθών δειγμάτων
για μέσηγια μερίδιο
Αλλεπάλληλος
μη επαναλαμβανόμενο
Μερίδιο μονάδων w = . Ακρίβεια ε = . Πιθανότητα γ =

Προβλήματα σχετικά με το γενικό μερίδιο

Στην ερώτηση "Η δεδομένη τιμή του p 0 καλύπτει το διάστημα εμπιστοσύνης;" - μπορεί να απαντηθεί ελέγχοντας τη στατιστική υπόθεση H 0:p=p 0 . Υποτίθεται ότι τα πειράματα διεξάγονται σύμφωνα με το σχήμα δοκιμής Bernoulli (ανεξάρτητο, πιθανότητα Πεμφάνιση ενός γεγονότος ΕΝΑσυνεχής). Δείγμα όγκου nπροσδιορίστε τη σχετική συχνότητα p * εμφάνισης του γεγονότος Α: όπου Μ- αριθμός περιστατικών του συμβάντος ΕΝΑσε μια σειρά από nδοκιμές. Για τον έλεγχο της υπόθεσης H 0, χρησιμοποιούνται στατιστικές που, με ένα αρκετά μεγάλο μέγεθος δείγματος, έχουν μια τυπική κανονική κατανομή (Πίνακας 1).
Πίνακας 1 - Υποθέσεις για το γενικό μερίδιο

Υπόθεση

H0:p=p0H 0:p 1 \u003d p 2
ΥποθέσειςΣχέδιο δοκιμών BernoulliΣχέδιο δοκιμών Bernoulli
Δείγματα εκτιμήσεων
Στατιστική κ
Κατανομή στατιστικών στοιχείων κ Τυπικό κανονικό N(0,1)

Παράδειγμα #1. Χρησιμοποιώντας τυχαία επαναδειγματοληψία, η διοίκηση της εταιρείας πραγματοποίησε τυχαία έρευνα σε 900 υπαλλήλους της. Μεταξύ των ερωτηθέντων ήταν 270 γυναίκες. Σχεδιάστε ένα διάστημα εμπιστοσύνης που, με πιθανότητα 0,95, καλύπτει το πραγματικό ποσοστό των γυναικών σε ολόκληρη την ομάδα της εταιρείας.
Λύση. Ανάλογα με την προϋπόθεση, η αναλογία του δείγματος των γυναικών είναι (η σχετική συχνότητα των γυναικών μεταξύ όλων των ερωτηθέντων). Εφόσον η επιλογή επαναλαμβάνεται και το μέγεθος του δείγματος είναι μεγάλο (n=900), το οριακό σφάλμα δειγματοληψίας καθορίζεται από τον τύπο

Η τιμή του u cr βρίσκεται από τον πίνακα της συνάρτησης Laplace από τη σχέση 2Φ(u cr)=γ, δηλ. Η συνάρτηση Laplace (Παράρτημα 1) παίρνει την τιμή 0,475 στο u cr =1,96. Επομένως, το οριακό σφάλμα και το επιθυμητό διάστημα εμπιστοσύνης
(p – ε, p + ε) = (0,3 – 0,18; 0,3 + 0,18) = (0,12; 0,48)
Έτσι, με πιθανότητα 0,95, μπορούμε να εγγυηθούμε ότι το ποσοστό των γυναικών σε ολόκληρη την ομάδα της εταιρείας κυμαίνεται από 0,12 έως 0,48.

Παράδειγμα #2. Ο ιδιοκτήτης του πάρκινγκ θεωρεί την ημέρα «τυχερή» εάν ο χώρος στάθμευσης είναι γεμάτος περισσότερο από 80%. Κατά τη διάρκεια του έτους πραγματοποιήθηκαν 40 έλεγχοι στάθμευσης αυτοκινήτων, εκ των οποίων οι 24 ήταν «επιτυχείς». Με πιθανότητα 0,98, βρείτε το διάστημα εμπιστοσύνης για την εκτίμηση του πραγματικού ποσοστού των «τυχερών» ημερών κατά τη διάρκεια του έτους.
Λύση. Το κλάσμα δείγματος των «καλών» ημερών είναι
Σύμφωνα με τον πίνακα της συνάρτησης Laplace, βρίσκουμε την τιμή του u cr για ένα δεδομένο
επίπεδο αυτοπεποίθησης
Ф(2,23) = 0,49, u cr = 2,33.
Θεωρώντας ότι η επιλογή δεν είναι επαναλαμβανόμενη (δηλαδή, δύο έλεγχοι δεν πραγματοποιήθηκαν την ίδια ημέρα), βρίσκουμε το οριακό σφάλμα:
όπου n=40, Ν = 365 (ημέρες). Από εδώ
και διάστημα εμπιστοσύνης για το γενικό κλάσμα: (p – ε, p + ε) = (0,6 – 0,17; 0,6 + 0,17) = (0,43, 0,77)
Με πιθανότητα 0,98, μπορεί να αναμένεται ότι η αναλογία των «καλών» ημερών κατά τη διάρκεια του έτους κυμαίνεται από 0,43 έως 0,77.

Παράδειγμα #3. Αφού έλεγξαν 2500 είδη στην παρτίδα, διαπίστωσαν ότι 400 είδη ήταν της υψηλότερης ποιότητας, αλλά τα n-m δεν ήταν. Πόσα προϊόντα πρέπει να ελέγξετε για να προσδιορίσετε το μερίδιο του premium grade με ακρίβεια 0,01 με βεβαιότητα 95%;
Αναζητούμε λύση σύμφωνα με τον τύπο για τον προσδιορισμό του μεγέθους του δείγματος για επανεπιλογή.

Φ(t) = γ/2 = 0,95/2 = 0,475 και σύμφωνα με τον πίνακα Laplace η τιμή αυτή αντιστοιχεί σε t=1,96
Κλάσμα δείγματος w = 0,16; δειγματοληπτικό σφάλμα ε = 0,01

Παράδειγμα #4. Μια παρτίδα προϊόντων γίνεται αποδεκτή εάν η πιθανότητα το προϊόν να πληροί το πρότυπο είναι τουλάχιστον 0,97. Μεταξύ των 200 προϊόντων που επιλέχθηκαν τυχαία της παρτίδας που δοκιμάστηκε, βρέθηκαν 193 προϊόντα που πληρούν το πρότυπο. Είναι δυνατή η αποδοχή της παρτίδας στο επίπεδο σημαντικότητας α=0,02;
Λύση. Διατυπώνουμε τις κύριες και εναλλακτικές υποθέσεις.
H 0: p \u003d p 0 \u003d 0,97 - άγνωστο γενικό μερίδιο Πίση με την καθορισμένη τιμή p 0 =0,97. Σε σχέση με την συνθήκη - η πιθανότητα το τμήμα από τη δοκιμασμένη παρτίδα να είναι σύμφωνο με το πρότυπο είναι 0,97. εκείνοι. παρτίδα προϊόντων μπορεί να γίνει αποδεκτή.
Η1:σελ<0,97 - вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, меньше 0.97; т.е. партию изделий нельзя принять. При такой альтернативной гипотезе критическая область будет левосторонней.
Παρατηρούμενη στατιστική τιμή κ(πίνακας) υπολογίστε για δεδομένες τιμές p 0 =0,97, n=200, m=193


Η κρίσιμη τιμή βρίσκεται από τον πίνακα της συνάρτησης Laplace από την ισότητα


Σύμφωνα με τη συνθήκη α=0,02, άρα F(Kcr)=0,48 και Kcr=2,05. Η κρίσιμη περιοχή είναι αριστερόχειρας, δηλ. είναι το διάστημα (-∞;-K kp)= (-∞;-2,05). Η παρατηρούμενη τιμή Kobs = -0,415 δεν ανήκει στην κρίσιμη περιοχή, επομένως, σε αυτό το επίπεδο σημασίας, δεν υπάρχει λόγος να απορριφθεί η κύρια υπόθεση. Μια παρτίδα προϊόντων μπορεί να γίνει δεκτή.

Παράδειγμα αριθμός 5. Δύο εργοστάσια παράγουν τον ίδιο τύπο ανταλλακτικών. Για την αξιολόγηση της ποιότητάς τους, ελήφθησαν δείγματα από τα προϊόντα αυτών των εργοστασίων και προέκυψαν τα ακόλουθα αποτελέσματα. Από τα 200 επιλεγμένα προϊόντα του πρώτου εργοστασίου, τα 20 ήταν ελαττωματικά και από τα 300 προϊόντα του δεύτερου εργοστασίου, τα 15 ήταν ελαττωματικά.
Σε επίπεδο σημαντικότητας 0,025, μάθετε εάν υπάρχει σημαντική διαφορά στην ποιότητα των ανταλλακτικών που κατασκευάζονται από αυτά τα εργοστάσια.

Σύμφωνα με τη συνθήκη α=0,025, άρα F(Kcr)=0,4875 και Kcr=2,24. Με μια εναλλακτική διπλής όψης, η περιοχή των αποδεκτών τιμών έχει τη μορφή (-2,24; 2,24). Η παρατηρούμενη τιμή Kobs =2,15 εμπίπτει σε αυτό το διάστημα, δηλ. σε αυτό το επίπεδο σημασίας, δεν υπάρχει λόγος να απορριφθεί η κύρια υπόθεση. Τα εργοστάσια παράγουν προϊόντα της ίδιας ποιότητας.