Ασυμπτωτικά κριτήρια επιλογής. Ασυμπτωτική σημειογραφία για το χρόνο εκτέλεσης των προγραμμάτων. Εκτιμήσεις από κάτω, από πάνω, ασυμπτωτικά ακριβείς. Ο κανόνας του αθροίσματος και ο κανόνας του προϊόντος. Προτεινόμενη λίστα διατριβών

Ορισμός. Η κατεύθυνση που ορίζεται από ένα μη μηδενικό διάνυσμα ονομάζεται ασυμπτωτική κατεύθυνση σε σχέση με τη γραμμή δεύτερης τάξης, αν όποιος η ευθεία αυτής της κατεύθυνσης (δηλαδή, παράλληλη με το διάνυσμα ) είτε έχει το πολύ ένα κοινό σημείο με την ευθεία, είτε περιέχεται σε αυτήν την ευθεία.

? Πόσα κοινά σημεία μπορεί να έχει μια ευθεία δεύτερης τάξης και μια ευθεία ασυμπτωτικής διεύθυνσης σε σχέση με αυτή την ευθεία;

Στη γενική θεωρία των γραμμών δεύτερης τάξης αποδεικνύεται ότι αν

Τότε το μη μηδενικό διάνυσμα ( ορίζει την ασυμπτωτική κατεύθυνση ως προς την ευθεία

(γενικό κριτήριο ασυμπτωτικής κατεύθυνσης).

Για γραμμές δεύτερης τάξης

αν , τότε δεν υπάρχουν ασυμπτωτικές κατευθύνσεις,

αν τότε υπάρχουν δύο ασυμπτωτικές κατευθύνσεις,

αν τότε υπάρχει μόνο μία ασυμπτωτική κατεύθυνση.

Το παρακάτω λήμμα αποδεικνύεται χρήσιμο ( κριτήριο για την ασυμπτωτική κατεύθυνση μιας γραμμής παραβολικού τύπου).

Λήμμα . Έστω μια γραμμή παραβολικού τύπου.

Ένα διάνυσμα μη μηδενικό έχει ασυμπτωτική διεύθυνση

σχετικά . (5)

(Πρόβλημα. Αποδείξτε το λήμμα.)

Ορισμός. Η ευθεία ασυμπτωτικής κατεύθυνσης ονομάζεται ασύμπτωτο γραμμές δεύτερης τάξης, εάν αυτή η γραμμή είτε δεν τέμνεται είτε περιέχεται σε αυτήν.

Θεώρημα . Αν έχει ασυμπτωτική διεύθυνση ως προς το , τότε η ασύμπτωτη παράλληλη στο διάνυσμα καθορίζεται από την εξίσωση

Συμπληρώνουμε τον πίνακα.

ΚΑΘΗΚΟΝΤΑ.

1. Βρείτε τα διανύσματα ασυμπτωτικής κατεύθυνσης για τις ακόλουθες γραμμές δεύτερης τάξης:

4 - υπερβολικός τύπος, δύο ασυμπτωτικές κατευθύνσεις.

Ας χρησιμοποιήσουμε το κριτήριο της ασυμπτωτικής κατεύθυνσης:

Έχει ασυμπτωτική κατεύθυνση ως προς τη δεδομένη γραμμή 4 .

Αν =0, τότε =0, δηλαδή μηδέν. Στη συνέχεια διαιρέστε με Παίρνουμε μια τετραγωνική εξίσωση: , όπου t = . Λύνουμε αυτήν την τετραγωνική εξίσωση και βρίσκουμε δύο λύσεις: t = 4 και t = 1. Στη συνέχεια, οι ασυμπτωτικές κατευθύνσεις της ευθείας .

(Μπορούν να εξεταστούν δύο τρόποι, αφού η γραμμή είναι παραβολικού τύπου.)

2. Μάθετε εάν οι άξονες συντεταγμένων έχουν ασυμπτωτικές κατευθύνσεις σε σχέση με τις ευθείες της δεύτερης τάξης:

3. Γράψτε τη γενική εξίσωση μιας γραμμής δεύτερης τάξης για την οποία

α) ο άξονας της τετμημένης έχει ασυμπτωτική κατεύθυνση.

β) Και οι δύο άξονες συντεταγμένων έχουν ασυμπτωτικές κατευθύνσεις.

γ) οι άξονες συντεταγμένων έχουν ασυμπτωτικές κατευθύνσεις και το Ο είναι το κέντρο της ευθείας.

4. Γράψτε τις ασυμπτωτικές εξισώσεις για τις ευθείες:

α) ng w:val="EL-US"/>y=0"> ;

5. Να αποδείξετε ότι αν μια ευθεία δεύτερης τάξης έχει δύο μη παράλληλες ασύμπτωτες, τότε το σημείο τομής τους είναι το κέντρο αυτής της ευθείας.

Σημείωση:Εφόσον υπάρχουν δύο μη παράλληλες ασύμπτωτες, υπάρχουν δύο ασυμπτωτικές κατευθύνσεις, τότε και, επομένως, η γραμμή είναι κεντρική.

Γράψτε τις ασυμπτωτικές εξισώσεις σε γενική μορφή και το σύστημα εύρεσης του κέντρου. Όλα είναι προφανή.

6.(№920) Γράψτε την εξίσωση μιας υπερβολής που διέρχεται από το σημείο A(0, -5) και έχει ασύμπτωτες x - 1 = 0 και 2x - y + 1 = 0.

ένδειξη. Χρησιμοποιήστε τη δήλωση του προηγούμενου προβλήματος.

Εργασία για το σπίτι. , No. 915 (c, e, e), No. 916 (c, d, e), No. 920 (αν δεν είχατε χρόνο);

Κούνια?

Σιλάεφ, Τιμοσένκο. Πρακτικές εργασίες στη γεωμετρία,

1 εξάμηνο Σελ.67, ερωτήσεις 1-8, σελ.70, ερωτήσεις 1-3 (προφορικές).

ΔΙΑΜΕΤΡΕΣ ΓΡΑΜΜΗΣ ΔΕΥΤΕΡΗΣ ΤΑΞΗΣ.

ΔΙΑΜΕΤΡΟΙ ΖΕΥΓΑΖΟΝΤΑΙ.

Δίνεται ένα συγγενικό σύστημα συντεταγμένων.

Ορισμός. διάμετρος γραμμή δεύτερης τάξης, συζευγμένη με διάνυσμα μη ασυμπτωτικής διεύθυνσης ως προς το , είναι το σύνολο των μεσαίων σημείων όλων των χορδών της γραμμής παράλληλης προς το διάνυσμα.

Στη διάλεξη, αποδείχθηκε ότι η διάμετρος είναι ευθεία γραμμή και προέκυψε η εξίσωσή της

συστάσεις: Δείξτε (σε μια έλλειψη) πώς είναι κατασκευασμένο (ορίστε μια μη ασυμπτωτική κατεύθυνση, σχεδιάστε [δύο] ευθείες γραμμές αυτής της κατεύθυνσης που τέμνουν τη γραμμή, βρείτε τα μέσα των αποκομμένων χορδών, σχεδιάστε μια ευθεία γραμμή μέσα από τα μέσα - αυτή είναι η διάμετρος).

Συζητώ:

1. Γιατί λαμβάνεται ένα διάνυσμα μη ασυμπτωτικής διεύθυνσης στον ορισμό της διαμέτρου. Εάν δεν μπορούν να απαντήσουν, τότε ζητήστε τους να φτιάξουν μια διάμετρο, για παράδειγμα, για μια παραβολή.

2. Έχει κάποια γραμμή δεύτερης τάξης τουλάχιστον μία διάμετρο; Γιατί;

3. Στη διάλεξη αποδείχθηκε ότι η διάμετρος είναι ευθεία γραμμή. Ποια συγχορδία είναι η μέση του σημείου Μ στο σχήμα;


4. Κοιτάξτε τις αγκύλες στην εξίσωση (7). Τι θυμίζουν;

Συμπέρασμα: 1) κάθε κέντρο ανήκει σε κάθε διάμετρο.

2) εάν υπάρχει μια ευθεία γραμμή κέντρων, τότε υπάρχει μια ενιαία διάμετρος.

5. Ποια είναι η φορά των διαμέτρων της παραβολικής γραμμής; (Ασυμπτωτικό)

Απόδειξη (μάλλον σε διάλεξη).

Έστω η διάμετρος d που δίνεται από την εξίσωση (7`) συζευγμένη με ένα διάνυσμα μη ασυμπτωτικής διεύθυνσης. Τότε το διάνυσμα κατεύθυνσής του

(-(), ). Ας δείξουμε ότι αυτό το διάνυσμα έχει ασυμπτωτική κατεύθυνση. Ας χρησιμοποιήσουμε το κριτήριο του διανύσματος ασυμπτωτικής κατεύθυνσης για μια παραβολική ευθεία (βλ. (5)). Αντικαθιστούμε και φροντίζουμε (μην το ξεχνάτε .

6. Πόσες διαμέτρους έχει μια παραβολή; Η σχετική τους θέση; Πόσες διαμέτρους έχουν οι υπόλοιπες παραβολικές γραμμές; Γιατί;

7. Πώς να κατασκευάσετε τη συνολική διάμετρο μερικών ζευγών γραμμών δεύτερης τάξης (βλ. ερωτήσεις 30, 31 παρακάτω).

8. Συμπληρώνουμε τον πίνακα, φροντίστε να κάνετε σχέδια.

1. . Γράψτε την εξίσωση για το σύνολο των μεσαίων σημείων όλων των χορδών που είναι παράλληλες στο διάνυσμα

2. Γράψτε μια εξίσωση για τη διάμετρο d που διέρχεται από το σημείο Κ(1,-2) για την ευθεία.

Βήματα λύσης:

1ος τρόπος.

1. Προσδιορίστε τον τύπο (για να μάθετε πώς συμπεριφέρονται οι διάμετροι αυτής της γραμμής).

Σε αυτή την περίπτωση, η γραμμή είναι κεντρική, τότε όλες οι διάμετροι περνούν από το κέντρο C.

2. Συνθέτουμε την εξίσωση μιας ευθείας που διέρχεται από δύο σημεία Κ και Γ. Αυτή είναι η επιθυμητή διάμετρος.

2ος τρόπος.

1. Γράφουμε την εξίσωση για τη διάμετρο d στη μορφή (7`).

2. Αντικαθιστώντας τις συντεταγμένες του σημείου Κ σε αυτή την εξίσωση, βρίσκουμε τη σχέση μεταξύ των συντεταγμένων του συζυγούς διανύσματος με τη διάμετρο d.

3. Ορίζουμε αυτό το διάνυσμα, λαμβάνοντας υπόψη την εξάρτηση που βρέθηκε και συνθέτουμε την εξίσωση για τη διάμετρο d.

Σε αυτό το πρόβλημα, είναι ευκολότερο να υπολογιστεί με τον δεύτερο τρόπο.

3. . Γράψτε την εξίσωση για τη διάμετρο παράλληλη στον άξονα x.

4. Βρείτε τη μέση της συγχορδίας αποκομμένη από τη γραμμή

στη γραμμή x + 3y – 12 =0.

Πρόταση για απόφαση: Φυσικά, μπορείτε να βρείτε τα σημεία τομής της δεδομένης γραμμής και ευθείας , και στη συνέχεια - το μέσο του τμήματος που προκύπτει. Η επιθυμία να το κάνουμε αυτό εξαφανίζεται αν πάρουμε, για παράδειγμα, μια ευθεία γραμμή με την εξίσωση x + 3y - 2009 = 0.

Υπάρχει ένα σύστημα σημειώσεων για την περιγραφή ασυμπτωτικών εκτιμήσεων:

§ Λένε ότι f(n)= Ο(g(n)) αν υπάρχει σταθερά c>0 και αριθμός n0 τέτοιος ώστε η συνθήκη 0≤f(n)≤c*g(n) να ικανοποιείται για όλα τα n≥n0. Πιο επίσημα:

(()) { () | 0, } 0 0 O g n= f n$ντο> $n"n> n£ f n£ cg n

ΟΤο (g(n)) χρησιμοποιείται για να υποδείξει συναρτήσεις που δεν είναι περισσότερες από σταθερές φορές μεγαλύτερες από το g(n), αυτή η παραλλαγή χρησιμοποιείται για την περιγραφή των άνω ορίων (με την έννοια του "όχι χειρότερα από"). Όταν πρόκειται για έναν συγκεκριμένο αλγόριθμο για την επίλυση ενός συγκεκριμένου προβλήματος, ο στόχος της ανάλυσης της χρονικής πολυπλοκότητας αυτού του αλγορίθμου είναι να ληφθεί μια εκτίμηση για τον χειρότερο ή μέσο χρόνο, συνήθως μια ασυμπτωτική ανώτερη εκτίμηση Ο(g(n)), και, εάν είναι δυνατόν, ένα ασυμπτωτικό κάτω όριο W(g(n)), και ακόμη καλύτερα, ένα ασυμπτωτικά ακριβές όριο Q(g(n)).

Αλλά την ίδια στιγμή, το ερώτημα παραμένει - μπορούν να υπάρξουν ακόμη καλύτεροι αλγόριθμοι λύσης για αυτό το πρόβλημα; Αυτή η ερώτηση θέτει το πρόβλημα της εύρεσης μιας χαμηλότερης εκτίμησης της χρονικής πολυπλοκότητας για το ίδιο το πρόβλημα (για όλους τους πιθανούς αλγόριθμους για την επίλυσή του και όχι για έναν από τους γνωστούς αλγόριθμους για την επίλυσή του). Το πρόβλημα της απόκτησης μη τετριμμένων κάτω ορίων είναι πολύ περίπλοκο. Μέχρι σήμερα, δεν υπάρχουν πολλά τέτοια αποτελέσματα, αλλά έχουν αποδειχθεί μη τετριμμένα κατώτατα όρια για ορισμένα περιορισμένα μοντέλα αριθμομηχανών και μερικά από αυτά παίζουν σημαντικό ρόλο στον πρακτικό προγραμματισμό. Ένα από τα προβλήματα για τα οποία είναι γνωστό ένα κατώτερο όριο για την πολυπλοκότητα του χρόνου είναι το πρόβλημα ταξινόμησης:

§ Δίνεται μια ακολουθία από n στοιχεία a1,a2,... ένα επιλεγμένο από ένα σύνολο στο οποίο δίνεται μια γραμμική σειρά.

§ Απαιτείται να βρεθεί μια μετάθεση p αυτών των n στοιχείων που αντιστοιχίζει τη δεδομένη ακολουθία σε μια μη φθίνουσα ακολουθία ap(1),ap(2),... ap(n), δηλ. ap(i)≤ap(i+1) για 1≤i μέθοδος μείωσης . Ας υποθέσουμε ότι έχουμε δύο προβλήματα Α και Β, τα οποία συνδέονται έτσι ώστε το πρόβλημα Α να μπορεί να λυθεί ως εξής:

1) Τα δεδομένα εισόδου για την εργασία Α μετατρέπονται στην αντίστοιχη είσοδο

δεδομένα για την εργασία Β.

2) Το πρόβλημα Β λύνεται.

3) Το αποτέλεσμα της λύσης του προβλήματος Β μετατρέπεται στη σωστή λύση του προβλήματος Α .__ Στην περίπτωση αυτή, λέμε ότι έργο ΕΝΑ μειώνεται στο πρόβλημα Β. Εάν τα βήματα (1) και (3) των παραπάνω πληροφοριών μπορούν να ολοκληρωθούν εγκαίρως Ο(t(n)), όπου, ως συνήθως, n – 25 είναι ο «όγκος» του προβλήματος A , τότε λέμε ότι A t (n)-reducible σε Β, και γράψτε το ως εξής: A μt (n)Β. Γενικά, η αναγωγιμότητα δεν είναι μια συμμετρική σχέση· στη συγκεκριμένη περίπτωση που το Α και το Β είναι αμοιβαία αναγώγιμα, θα τα ονομάσουμε ισοδύναμα. Οι ακόλουθες δύο αυτονόητες δηλώσεις χαρακτηρίζουν τη δύναμη της μεθόδου αναγωγής με την υπόθεση ότι αυτή η μείωση διατηρεί τη σειρά του «όγκου» του προβλήματος.

"Ο" μεγάλοΚαι "ο" μικρόΤα (και ) είναι μαθηματικοί συμβολισμοί για τη σύγκριση της ασυμπτωτικής συμπεριφοράς των συναρτήσεων. Χρησιμοποιούνται σε διάφορους κλάδους των μαθηματικών, αλλά πιο ενεργά - στη μαθηματική ανάλυση, τη θεωρία αριθμών και τη συνδυαστική, καθώς και στην επιστήμη των υπολογιστών και τη θεωρία των αλγορίθμων.

, « Ο small of » σημαίνει «απείρως μικρό σε σχέση με » [ , αμελητέα όταν λαμβάνεται υπόψη. Η έννοια του όρου "Big O" εξαρτάται από το πεδίο εφαρμογής του, αλλά δεν αναπτύσσεται πάντα γρηγορότερα από " Ομεγάλο από " (οι ακριβείς ορισμοί δίνονται παρακάτω).

Συγκεκριμένα:

Συνέχεια 7

η φράση "η πολυπλοκότητα του αλγορίθμου είναι" σημαίνει ότι με την αύξηση της παραμέτρου που χαρακτηρίζει την ποσότητα των πληροφοριών εισόδου του αλγορίθμου, ο χρόνος εκτέλεσης του αλγορίθμου δεν μπορεί να περιοριστεί από μια τιμή που αυξάνεται πιο αργά από n!;

η φράση "η συνάρτηση είναι" o "μικρή της συνάρτησης κοντά στο σημείο" σημαίνει ότι καθώς προσεγγίζεται το k, μειώνεται ταχύτερα από (ο λόγος τείνει στο μηδέν).

Κανόνας αθροίσματος: Έστω ένα πεπερασμένο σύνολο M να διαιρεθεί σε δύο μη τεμνόμενα υποσύνολα M 1 και M 2 (στην ένωση αυτών που δίνουν ολόκληρο το σύνολο M). Τότε η καρδιναλότητα |M| = |M 1 | + |M 2 |.

κανόνας προϊόντος: Έστω σε κάποιο σύνολο το αντικείμενο a μπορεί να επιλεγεί με n τρόπους, και μετά (δηλαδή, αφού επιλέξουμε το αντικείμενο a) το αντικείμενο b μπορεί να επιλεγεί με m τρόπους. Τότε το αντικείμενο ab μπορεί να επιλεγεί με n*m τρόπους.

Σχόλιο: Και οι δύο κανόνες επιτρέπουν την επαγωγική γενίκευση. Εάν ένα πεπερασμένο σύνολο M δέχεται τη διαίρεση σε r κατά ζεύγη ασύνδετα υποσύνολα M 1 , M 2 ,…,M r , τότε η ιδιότητα του |M| = |M 1 |+|M 2 |+…+|M r |. Εάν το αντικείμενο A 1 μπορεί να επιλεγεί με k 1 τρόπους, τότε (αφού επιλεγεί το αντικείμενο A 1) το αντικείμενο A 2 μπορεί να επιλεγεί με k 2 τρόπους, και ούτω καθεξής και τέλος, το αντικείμενο AR μπορεί να επιλεγεί με kr τρόπους, τότε το αντικείμενο A 1 A 2 ...A r μπορεί να επιλεγεί με k 1 k 2 ...k r τρόπους.

Στις σύγχρονες συνθήκες, το ενδιαφέρον για την ανάλυση δεδομένων αυξάνεται συνεχώς και εντατικά σε εντελώς διαφορετικούς τομείς, όπως η βιολογία, η γλωσσολογία, η οικονομία και, φυσικά, η πληροφορική. Η βάση αυτής της ανάλυσης είναι οι στατιστικές μέθοδοι και κάθε ειδικός εξόρυξης δεδομένων που σέβεται τον εαυτό του πρέπει να τις κατανοήσει.

Δυστυχώς, η πραγματικά καλή βιβλιογραφία, τέτοια που θα μπορούσε να παρέχει τόσο μαθηματικά αυστηρές αποδείξεις όσο και κατανοητές διαισθητικές εξηγήσεις, δεν είναι πολύ συνηθισμένη. Και αυτές οι διαλέξεις, κατά τη γνώμη μου, είναι ασυνήθιστα καλές για μαθηματικούς που κατανοούν τη θεωρία πιθανοτήτων ακριβώς για αυτόν τον λόγο. Διδάσκονται σε μεταπτυχιακούς στο Γερμανικό Πανεπιστήμιο Christian-Albrecht στα προγράμματα «Μαθηματικά» και «Χρηματοοικονομικά Μαθηματικά». Και για όσους ενδιαφέρονται για το πώς διδάσκεται αυτό το αντικείμενο στο εξωτερικό, έχω μεταφράσει αυτές τις διαλέξεις. Μου πήρε αρκετούς μήνες για να μεταφράσω, αραίωσα τις διαλέξεις με εικονογραφήσεις, ασκήσεις και υποσημειώσεις σε κάποια θεωρήματα. Σημειώνω ότι δεν είμαι επαγγελματίας μεταφραστής, αλλά απλώς αλτρουιστής και ερασιτέχνης σε αυτόν τον τομέα, οπότε θα δεχτώ οποιαδήποτε κριτική εάν είναι εποικοδομητική.

Εν ολίγοις, οι διαλέξεις αφορούν:


Προσδοκία υπό όρους

Αυτό το κεφάλαιο δεν ασχολείται άμεσα με τη στατιστική, ωστόσο αποτελεί ιδανική αφετηρία για τη μελέτη της. Η υπό όρους προσδοκία είναι η καλύτερη επιλογή για την πρόβλεψη ενός τυχαίου αποτελέσματος με βάση τις πληροφορίες που ήδη έχετε. Και αυτό είναι επίσης τυχαίο. Εδώ εξετάζονται οι διάφορες ιδιότητές του, όπως η γραμμικότητα, η μονοτονία, η μονοτονική σύγκλιση και άλλες.

Βασικά σημεία εκτίμησης

Πώς να αξιολογήσετε την παράμετρο κατανομής; Ποιο είναι το κριτήριο για αυτό; Ποιες μέθοδοι πρέπει να χρησιμοποιηθούν για αυτό; Αυτό το κεφάλαιο σάς επιτρέπει να απαντήσετε σε όλες αυτές τις ερωτήσεις. Εδώ εισάγονται οι έννοιες του αμερόληπτου εκτιμητή και του ομοιόμορφα αμερόληπτου εκτιμητή με ελάχιστη διακύμανση. Εξηγεί από πού προέρχεται η κατανομή χ-τετράγωνο και η κατανομή Student και γιατί είναι σημαντικές για την εκτίμηση των παραμέτρων μιας κανονικής κατανομής. Λέγεται ποια είναι η ανισότητα του Rao-Kramer και οι πληροφορίες του Fisher. Εισάγεται επίσης η έννοια της εκθετικής οικογένειας, η οποία καθιστά πολλές φορές ευκολότερη την απόκτηση μιας καλής εκτίμησης.

Εκτίμηση παραμέτρων Bayesian και Minimax

Μια διαφορετική φιλοσοφική προσέγγιση της αξιολόγησης περιγράφεται εδώ. Σε αυτή την περίπτωση, η παράμετρος θεωρείται άγνωστη επειδή είναι μια πραγματοποίηση κάποιας τυχαίας μεταβλητής με γνωστή (a priori) κατανομή. Παρατηρώντας το αποτέλεσμα του πειράματος, υπολογίζουμε τη λεγόμενη μεταγενέστερη κατανομή της παραμέτρου. Με βάση αυτό, μπορούμε να πάρουμε μια Bayesian εκτίμηση, όπου το κριτήριο είναι η ελάχιστη απώλεια κατά μέσο όρο, ή μια ελάχιστη εκτίμηση, η οποία ελαχιστοποιεί τη μέγιστη δυνατή απώλεια.

Επάρκεια και πληρότητα

Αυτό το κεφάλαιο έχει σοβαρή πρακτική σημασία. Μια επαρκής στατιστική είναι συνάρτηση του δείγματος, έτσι ώστε να αρκεί να αποθηκεύεται μόνο το αποτέλεσμα αυτής της συνάρτησης για να εκτιμηθεί η παράμετρος. Υπάρχουν πολλές τέτοιες λειτουργίες, και μεταξύ αυτών είναι τα λεγόμενα ελάχιστα επαρκή στατιστικά στοιχεία. Για παράδειγμα, για να υπολογίσουμε τη διάμεσο μιας κανονικής κατανομής, αρκεί να αποθηκεύσουμε μόνο έναν αριθμό - τον αριθμητικό μέσο όρο σε ολόκληρο το δείγμα. Αυτό ισχύει και για άλλες διανομές, όπως η διανομή Cauchy; Πώς βοηθούν τα επαρκή στατιστικά στοιχεία στην επιλογή εκτιμήσεων; Εδώ μπορείτε να βρείτε απαντήσεις σε αυτές τις ερωτήσεις.

Ασυμπτωτικές ιδιότητες εκτιμήσεων

Ίσως η πιο σημαντική και απαραίτητη ιδιότητα μιας εκτίμησης είναι η συνέπειά της, δηλαδή η τάση προς την αληθινή παράμετρο με αύξηση του μεγέθους του δείγματος. Αυτό το κεφάλαιο περιγράφει τις ιδιότητες των εκτιμήσεων που είναι γνωστές σε εμάς, που αποκτήθηκαν με τις στατιστικές μεθόδους που περιγράφηκαν στα προηγούμενα κεφάλαια. Εισάγονται οι έννοιες της ασυμπτωτικής αμερόληπτης, της ασυμπτωτικής αποτελεσματικότητας και της απόστασης Kullback-Leibler.

Βασικές δοκιμές

Εκτός από το ερώτημα πώς να αξιολογήσουμε μια παράμετρο άγνωστη σε εμάς, πρέπει με κάποιο τρόπο να ελέγξουμε αν ικανοποιεί τις απαιτούμενες ιδιότητες. Για παράδειγμα, διεξάγεται ένα πείραμα στο οποίο δοκιμάζεται ένα νέο φάρμακο. Πώς ξέρετε αν έχετε περισσότερες πιθανότητες να γίνετε καλά με αυτό παρά με παλαιότερα φάρμακα; Αυτό το κεφάλαιο εξηγεί πώς δημιουργούνται τέτοιες δοκιμές. Θα μάθετε ποιο είναι το ομοιόμορφα πιο ισχυρό τεστ, το τεστ Neyman-Pearson, το επίπεδο σημαντικότητας, το διάστημα εμπιστοσύνης και επίσης από πού προέρχονται το περιβόητο Gaussian test και το t-test.

Ασυμπτωτικές ιδιότητες κριτηρίων

Όπως και οι εκτιμήσεις, τα κριτήρια πρέπει να ικανοποιούν ορισμένες ασυμπτωτικές ιδιότητες. Μερικές φορές μπορεί να προκύψουν καταστάσεις όπου είναι αδύνατο να κατασκευαστεί το απαιτούμενο κριτήριο, ωστόσο, χρησιμοποιώντας το γνωστό θεώρημα κεντρικού ορίου, κατασκευάζουμε ένα κριτήριο που τείνει ασυμπτωτικά στο απαραίτητο. Εδώ θα μάθετε ποιο είναι το επίπεδο ασυμπτωτικής σημασίας, η μέθοδος αναλογίας πιθανότητας και πώς κατασκευάζονται το τεστ Bartlett και το τεστ ανεξαρτησίας του χ-τετράγωνου.

Γραμμικό μοντέλο

Αυτό το κεφάλαιο μπορεί να θεωρηθεί ως προσθήκη, δηλαδή, η εφαρμογή της στατιστικής στην περίπτωση της γραμμικής παλινδρόμησης. Θα καταλάβετε ποιοι βαθμοί είναι καλοί και υπό ποιες προϋποθέσεις. Θα μάθετε από πού προήλθε η μέθοδος των ελαχίστων τετραγώνων, πώς να δημιουργήσετε κριτήρια και γιατί χρειάζεστε μια κατανομή F.

Όπως σημειώθηκε στην προηγούμενη ενότητα, η μελέτη των κλασικών αλγορίθμων σε πολλές περιπτώσεις μπορεί να πραγματοποιηθεί με χρήση ασυμπτωτικών μεθόδων μαθηματικών στατιστικών, ειδικότερα με χρήση μεθόδων CLT και κληρονομικότητας σύγκλισης. Ο διαχωρισμός της κλασικής μαθηματικής στατιστικής από τις ανάγκες της εφαρμοσμένης έρευνας εκδηλώθηκε, ειδικότερα, στο γεγονός ότι οι δημοφιλείς μονογραφίες δεν διαθέτουν τον απαραίτητο μαθηματικό εξοπλισμό, ιδίως για τη μελέτη στατιστικών δύο δειγμάτων. Η ουσία είναι ότι πρέπει να πάτε στο όριο όχι κατά μία παράμετρο, αλλά κατά δύο - τους όγκους δύο δειγμάτων. Έπρεπε να αναπτύξω μια κατάλληλη θεωρία - τη θεωρία της κληρονομικότητας της σύγκλισης, που εκτίθεται στη μονογραφία μας.

Ωστόσο, τα αποτελέσματα μιας τέτοιας μελέτης θα πρέπει να εφαρμοστούν με πεπερασμένα μεγέθη δειγμάτων. Υπάρχει ένα σωρό προβλήματα που σχετίζονται με μια τέτοια μετάβαση. Μερικά από αυτά συζητήθηκαν σε σχέση με τη μελέτη των ιδιοτήτων των στατιστικών που κατασκευάστηκαν από δείγματα από συγκεκριμένες κατανομές.

Ωστόσο, όταν συζητείται η επίδραση των αποκλίσεων από τις αρχικές παραδοχές στις ιδιότητες των στατιστικών διαδικασιών, προκύπτουν πρόσθετα προβλήματα. Ποιες αποκλίσεις θεωρούνται τυπικές; Πρέπει κανείς να επικεντρωθεί στις πιο «βλαβερές» αποκλίσεις που παραμορφώνουν τις ιδιότητες των αλγορίθμων στο μέγιστο βαθμό ή πρέπει να επικεντρωθεί στις «τυπικές» αποκλίσεις;

Με την πρώτη προσέγγιση, έχουμε ένα εγγυημένο αποτέλεσμα, αλλά το «τίμημα» αυτού του αποτελέσματος μπορεί να είναι άσκοπα υψηλό. Ως παράδειγμα, αναφέρουμε την καθολική ανισότητα Berry-Esseen για το σφάλμα στο CLT. Πολύ σωστά τονίζει ο Α.Α. Ο Borovkov ότι «ο ρυθμός σύγκλισης στα πραγματικά προβλήματα, κατά κανόνα, αποδεικνύεται καλύτερος».

Στη δεύτερη προσέγγιση, τίθεται το ερώτημα ποιες αποκλίσεις θεωρούνται «τυπικές». Μπορείτε να προσπαθήσετε να απαντήσετε σε αυτήν την ερώτηση αναλύοντας μεγάλες σειρές πραγματικών δεδομένων. Είναι πολύ φυσικό οι απαντήσεις διαφορετικών ερευνητικών ομάδων να διαφέρουν, όπως φαίνεται, για παράδειγμα, από τα αποτελέσματα που παρουσιάζονται στο άρθρο.

Μία από τις ψευδείς ιδέες είναι η χρήση στην ανάλυση πιθανών αποκλίσεων μόνο μιας συγκεκριμένης παραμετρικής οικογένειας - των κατανομών Weibull-Gnedenko, της οικογένειας τριών παραμέτρων των κατανομών γάμμα, κ.λπ. Πίσω στο 1927, ακαδ. Ακαδημία Επιστημών της ΕΣΣΔ S.N. Ο Bernstein συζήτησε το μεθοδολογικό σφάλμα της αναγωγής όλων των εμπειρικών κατανομών σε μια οικογένεια Pearson τεσσάρων παραμέτρων. Ωστόσο, οι παραμετρικές μέθοδοι στατιστικής εξακολουθούν να είναι πολύ δημοφιλείς, ειδικά μεταξύ των εφαρμοσμένων επιστημόνων, και το σφάλμα για αυτήν την παρανόηση έγκειται κυρίως στους δασκάλους στατιστικών μεθόδων (βλ. παρακάτω, καθώς και το άρθρο).

15. Επιλογή ενός από τα πολλά κριτήρια για τον έλεγχο μιας συγκεκριμένης υπόθεσης

Σε πολλές περιπτώσεις, έχουν αναπτυχθεί πολλές μέθοδοι για την επίλυση ενός συγκεκριμένου πρακτικού προβλήματος και ένας ειδικός στις μεθόδους μαθηματικής έρευνας αντιμετωπίζει ένα πρόβλημα: ποια πρέπει να προσφερθεί σε ένα εφαρμοσμένο άτομο για την ανάλυση συγκεκριμένων δεδομένων;

Ως παράδειγμα, εξετάστε το πρόβλημα του ελέγχου της ομοιογένειας δύο ανεξάρτητων δειγμάτων. Όπως γνωρίζετε, για τη λύση του, μπορείτε να προσφέρετε πολλά κριτήρια: Student, Cramer-Welch, Lord, chi-square, Wilcoxon (Mann-Whitney), Van - der - Warden, Savage, N.V. Smirnov, όπως ωμέγα-τετράγωνο (Lehmann-Rosenblatt), G.V. Ποιο να επιλέξω τον Martynov, κλπ.

Η ιδέα της «ψηφοφορίας» μου έρχεται φυσικά στο μυαλό: να δοκιμάζουμε με πολλά κριτήρια και μετά να αποφασίζουμε «με την πλειοψηφία των ψήφων». Από τη σκοπιά της στατιστικής θεωρίας, μια τέτοια διαδικασία απλώς οδηγεί στην κατασκευή ενός άλλου κριτηρίου, το οποίο εκ των προτέρων δεν είναι καλύτερο από τα προηγούμενα, αλλά είναι πιο δύσκολο να μελετηθεί. Από την άλλη πλευρά, εάν οι λύσεις είναι ίδιες για όλα τα εξεταζόμενα στατιστικά κριτήρια που βασίζονται σε διαφορετικές αρχές, τότε, σύμφωνα με την έννοια της σταθερότητας, αυτό αυξάνει την εμπιστοσύνη στη συνολική λύση που προκύπτει.

Υπάρχει μια ευρέως διαδεδομένη, ειδικά μεταξύ των μαθηματικών, ψευδής και επιβλαβής άποψη για την ανάγκη αναζήτησης βέλτιστων μεθόδων, λύσεων κ.λπ. Γεγονός είναι ότι η βέλτιστη συνήθως εξαφανίζεται όταν υπάρχει απόκλιση από τις αρχικές παραδοχές. Έτσι, ο αριθμητικός μέσος όρος ως εκτίμηση της μαθηματικής προσδοκίας είναι βέλτιστος μόνο όταν η αρχική κατανομή είναι κανονική, ενώ μια σταθερή εκτίμηση είναι πάντα, αν υπάρχει μόνο η μαθηματική προσδοκία. Από την άλλη πλευρά, για οποιαδήποτε αυθαίρετη μέθοδο εκτίμησης ή δοκιμής υποθέσεων, μπορεί κανείς συνήθως να διατυπώσει την έννοια της βελτιστοποίησης με τέτοιο τρόπο ώστε η υπό εξέταση μέθοδος να γίνει βέλτιστη - από αυτήν την ειδικά επιλεγμένη σκοπιά. Πάρτε, για παράδειγμα, τη διάμεσο του δείγματος ως εκτίμηση της μαθηματικής προσδοκίας. Είναι, φυσικά, βέλτιστο, αν και με διαφορετική έννοια από τον αριθμητικό μέσο όρο (βέλτιστη για μια κανονική κατανομή). Συγκεκριμένα, για την κατανομή Laplace, η διάμεσος του δείγματος είναι η εκτίμηση της μέγιστης πιθανότητας, και επομένως η βέλτιστη (με την έννοια που ορίζεται στη μονογραφία).

Τα κριτήρια ομοιογένειας έχουν αναλυθεί σε μονογραφία. Υπάρχουν διάφορες φυσικές προσεγγίσεις για τη σύγκριση κριτηρίων - με βάση την ασυμπτωτική σχετική αποτελεσματικότητα σύμφωνα με τους Bahadur, Hodges-Lehman, Pitman. Και αποδείχθηκε ότι κάθε κριτήριο είναι βέλτιστο με την αντίστοιχη εναλλακτική ή μια κατάλληλη κατανομή στο σύνολο των εναλλακτικών. Ταυτόχρονα, οι μαθηματικοί υπολογισμοί χρησιμοποιούν συνήθως την εναλλακτική μετατόπισης, η οποία είναι σχετικά σπάνια στην πρακτική της ανάλυσης πραγματικών στατιστικών δεδομένων (σε σχέση με το κριτήριο Wilcoxon, αυτή η εναλλακτική συζητήθηκε και επικρίθηκε από εμάς στο ). Το αποτέλεσμα είναι λυπηρό - η λαμπρή μαθηματική τεχνική που καταδείχθηκε στο , δεν μας επιτρέπει να δώσουμε συστάσεις για την επιλογή ενός τεστ ομοιογένειας κατά την ανάλυση πραγματικών δεδομένων. Με άλλα λόγια, από τη σκοπιά του υπαλλήλου εφαρμογής, δηλ. ανάλυση συγκεκριμένων δεδομένων, η μονογραφία είναι άχρηστη. Η λαμπρή μαεστρία των μαθηματικών και η μεγάλη επιμέλεια που επέδειξε ο συγγραφέας αυτής της μονογραφίας, δυστυχώς, δεν έφεραν τίποτα στην πράξη.

Φυσικά, κάθε πρακτικά εργαζόμενος στατιστικολόγος με τον ένα ή τον άλλο τρόπο λύνει μόνος του το πρόβλημα της επιλογής ενός στατιστικού κριτηρίου. Με βάση μια σειρά μεθοδολογικών εκτιμήσεων, επιλέξαμε το κριτήριο τύπου ωμέγα-τετράγωνο (Lehmann-Rosenblatt) που είναι συνεπές έναντι οποιασδήποτε εναλλακτικής λύσης. Ωστόσο, υπάρχει ένα αίσθημα δυσαρέσκειας λόγω της ανεπαρκούς εγκυρότητας αυτής της επιλογής.

Το Exact Tests παρέχει δύο πρόσθετες μεθόδους για τον υπολογισμό των επιπέδων σημαντικότητας για τα στατιστικά στοιχεία που είναι διαθέσιμα μέσω των διαδικασιών Crosstabs και Nonparametric Tests. Αυτές οι μέθοδοι, η ακριβής μέθοδος και η μέθοδος Monte Carlo, παρέχουν ένα μέσο για την απόκτηση ακριβών αποτελεσμάτων όταν τα δεδομένα σας δεν πληρούν καμία από τις υποκείμενες υποθέσεις που είναι απαραίτητες για αξιόπιστα αποτελέσματα χρησιμοποιώντας την τυπική ασυμπτωτική μέθοδο. Διατίθεται μόνο εάν έχετε αγοράσει τις Επιλογές Ακριβών Δοκιμών.

παράδειγμα.Τα ασυμπτωτικά αποτελέσματα που λαμβάνονται από μικρά σύνολα δεδομένων ή αραιούς ή μη ισορροπημένους πίνακες μπορεί να είναι παραπλανητικά. Οι ακριβείς δοκιμές σάς δίνουν τη δυνατότητα να αποκτήσετε ένα ακριβές επίπεδο σημασίας χωρίς να βασίζεστε σε υποθέσεις που ενδέχεται να μην πληρούνται από τα δεδομένα σας. Για παράδειγμα, τα αποτελέσματα μιας εισαγωγικής εξέτασης για 20 πυροσβέστες σε μια μικρή πόλη δείχνουν ότι και οι πέντε λευκοί υποψήφιοι έλαβαν αποτέλεσμα επιτυχίας, ενώ τα αποτελέσματα για τους μαύρους, τους Ασιάτες και τους Ισπανόφωνους υποψήφιους είναι μικτά. Ένα chi-square Pearson που δοκιμάζει τη μηδενική υπόθεση ότι τα αποτελέσματα είναι ανεξάρτητα από τη φυλή παράγει ένα επίπεδο ασυμπτωτικής σημασίας 0,07. Αυτό το αποτέλεσμα οδηγεί στο συμπέρασμα ότι τα αποτελέσματα των εξετάσεων είναι ανεξάρτητα από τη φυλή του εξεταζόμενου. Ωστόσο, επειδή τα δεδομένα περιέχουν μόνο 20 περιπτώσεις και τα κελιά έχουν αναμενόμενες συχνότητες μικρότερες από 5, αυτό το αποτέλεσμα δεν είναι αξιόπιστο. Η ακριβής σημασία του Pearson chi-square είναι 0,04, που οδηγεί στο αντίθετο συμπέρασμα. Με βάση την ακριβή σημασία, θα συμπεράνατε ότι τα αποτελέσματα των εξετάσεων και η φυλή του εξεταζόμενου σχετίζονται. Αυτό καταδεικνύει τη σημασία της απόκτησης ακριβών αποτελεσμάτων όταν οι υποθέσεις της ασυμπτωτικής μεθόδου δεν μπορούν να ικανοποιηθούν. Η ακριβής σημασία είναι πάντα αξιόπιστη, ανεξάρτητα από το μέγεθος, την κατανομή, την αραιότητα ή την ισορροπία των δεδομένων.

στατιστική.ασυμπτωματική σημασία. Προσέγγιση Monte Carlo με επίπεδο εμπιστοσύνης ή ακριβής σημασία.

  • ασυμπτωτικός. Το επίπεδο σημαντικότητας με βάση την ασυμπτωτική κατανομή μιας στατιστικής δοκιμής. Συνήθως, μια τιμή μικρότερη από 0,05 θεωρείται σημαντική. Η ασυμπτωτική σημασία βασίζεται στην υπόθεση ότι το σύνολο δεδομένων είναι μεγάλο. Εάν το σύνολο δεδομένων είναι μικρό ή κακώς κατανεμημένο, αυτό μπορεί να μην είναι καλή ένδειξη σημασίας.
  • Εκτίμηση Μόντε Κάρλο. Μια αμερόληπτη εκτίμηση του ακριβούς επιπέδου σημαντικότητας, που υπολογίζεται με επανειλημμένες δειγματοληψίες από ένα σύνολο πινάκων αναφοράς με τις ίδιες διαστάσεις και περιθώρια σειρών και στηλών με τον παρατηρούμενο πίνακα. Η μέθοδος Monte Carlo σας επιτρέπει να εκτιμήσετε την ακριβή σημασία χωρίς να βασίζεστε στις υποθέσεις που απαιτούνται για την ασυμπτωτική μέθοδο. Αυτή η μέθοδος είναι πιο χρήσιμη όταν το σύνολο δεδομένων είναι πολύ μεγάλο για να υπολογιστεί η ακριβής σημασία, αλλά τα δεδομένα δεν πληρούν τις υποθέσεις της ασυμπτωτικής μεθόδου.
  • Ακριβής. Η πιθανότητα του παρατηρούμενου αποτελέσματος ή ενός πιο ακραίου αποτελέσματος υπολογίζεται ακριβώς. Συνήθως, ένα επίπεδο σημαντικότητας μικρότερο από 0,05 θεωρείται σημαντικό, υποδεικνύοντας ότι υπάρχει κάποια σχέση μεταξύ των μεταβλητών της γραμμής και της στήλης.