Pamantayan sa pagpili ng asymptotic. asymptotically pinakamainam. Distansya ng impormasyon at mga posibilidad ng malalaking paglihis ng mga mapaghihiwalay na istatistika

Sa modernong mga kondisyon, ang interes sa pagsusuri ng data ay patuloy at masinsinang lumalaki sa ganap na magkakaibang mga lugar, tulad ng biology, linguistics, economics, at, siyempre, IT. Ang batayan ng pagsusuring ito ay mga istatistikal na pamamaraan, at ang bawat may paggalang sa sarili na espesyalista sa pagmimina ng data ay kailangang maunawaan ang mga ito.

Sa kasamaang-palad, ang talagang mahusay na literatura, upang makapagbigay ito ng parehong mathematically rigorous proofs at understandable intuitive explanations, ay hindi masyadong karaniwan. At ang mga lektura na ito, sa aking palagay, ay hindi pangkaraniwang mabuti para sa mga mathematician na nakakaintindi ng probability theory para sa kadahilanang ito. Itinuro sila sa mga masters sa German Christian-Albrecht University sa mga programang "Mathematics" at "Financial Mathematics". At para sa mga interesado kung paano itinuturo ang paksang ito sa ibang bansa, isinalin ko ang mga lekturang ito. Kinailangan ako ng ilang buwan upang magsalin, pinalabnaw ko ang mga lektura gamit ang mga ilustrasyon, pagsasanay at talababa sa ilang mga theorems. Pansinin ko na hindi ako isang propesyonal na tagasalin, ngunit isang altruista at baguhan lamang sa larangang ito, kaya't tatanggapin ko ang anumang pagpuna kung ito ay nakabubuo.

Sa madaling salita, ang mga lektura ay tungkol sa:

May kondisyong inaasahan

Ang kabanatang ito ay hindi direktang tumatalakay sa mga istatistika, gayunpaman, ito ay isang mainam na panimulang punto para sa pag-aaral nito. Ang kondisyong inaasahan ay ang pinakamahusay na pagpipilian para sa paghula ng isang random na resulta batay sa impormasyong mayroon ka na. At ito ay random din. Dito, isinasaalang-alang ang iba't ibang katangian nito, tulad ng linearity, monotonicity, monotonikong convergence, at iba pa.

Mga Pangunahing Kaalaman sa Pagtataya ng Punto

Paano suriin ang parameter ng pamamahagi? Ano ang pamantayan para dito? Anong mga pamamaraan ang dapat gamitin para dito? Ang kabanatang ito ay nagpapahintulot sa iyo na sagutin ang lahat ng mga tanong na ito. Dito ipinakilala ang mga konsepto ng walang pinapanigan na estimator at pantay na walang pinapanigan na may pinakamababang pagkakaiba. Ipinapaliwanag kung saan nagmumula ang chi-squared distribution at ang distribution ng Student at kung bakit mahalaga ang mga ito sa pagtantya ng mga parameter ng isang normal na distribution. Sinasabi kung ano ang hindi pagkakapantay-pantay ni Rao-Kramer at ang impormasyon ni Fisher. Ang konsepto ng isang exponential na pamilya ay ipinakilala din, na ginagawang maraming beses na mas madaling makakuha ng isang mahusay na pagtatantya.

Bayesian at Minimax Parameter Estimation

Ang ibang pilosopikal na diskarte sa pagsusuri ay inilarawan dito. Sa kasong ito, ang parameter ay itinuturing na hindi alam dahil ito ay isang pagsasakatuparan ng ilang random na variable na may kilalang (a priori) na distribusyon. Ang pagmamasid sa resulta ng eksperimento, kinakalkula namin ang tinatawag na posterior distribution ng parameter. Batay dito, makakakuha tayo ng isang pagtatantya ng Bayesian, kung saan ang pamantayan ay ang pinakamababang pagkawala sa karaniwan, o isang pagtatantya ng minimax, na nagpapaliit sa pinakamataas na posibleng pagkawala.

Sapat at pagkakumpleto

Ang kabanatang ito ay may seryosong praktikal na kahalagahan. Ang isang sapat na istatistika ay isang function ng sample, kung kaya't sapat na upang iimbak lamang ang resulta ng function na ito upang matantya ang parameter. Mayroong maraming mga naturang pag-andar, at kabilang sa mga ito ay ang tinatawag na minimal na sapat na istatistika. Halimbawa, upang matantya ang median ng isang normal na distribusyon, sapat na upang mag-imbak lamang ng isang numero - ang arithmetic mean sa buong sample. Gumagana rin ba ito para sa iba pang mga pamamahagi, tulad ng pamamahagi ng Cauchy? Paano nakakatulong ang sapat na istatistika sa pagpili ng mga pagtatantya? Dito mahahanap mo ang mga sagot sa mga tanong na ito.

Asymptotic na katangian ng mga pagtatantya

Marahil ang pinakamahalaga at kinakailangang pag-aari ng isang pagtatantya ay ang pagkakapare-pareho nito, iyon ay, ang pagkahilig sa totoong parameter na may pagtaas sa laki ng sample. Inilalarawan ng kabanatang ito ang mga katangian ng mga pagtatantya na alam sa amin, na nakuha ng mga istatistikal na pamamaraan na inilarawan sa mga nakaraang kabanata. Ang mga konsepto ng asymptotic unbiasedness, asymptotic na kahusayan, at distansya ng Kullback-Leibler ay ipinakilala.

Mga Pangunahing Kaalaman sa Pagsubok

Bilang karagdagan sa tanong kung paano suriin ang isang parameter na hindi alam sa amin, dapat nating suriin kung natutugunan nito ang mga kinakailangang katangian. Halimbawa, ang isang eksperimento ay isinasagawa kung saan ang isang bagong gamot ay sinusuri. Paano mo malalaman kung mas malamang na gumaling ka dito kaysa sa mas lumang mga gamot? Ipinapaliwanag ng kabanatang ito kung paano binuo ang mga naturang pagsubok. Malalaman mo kung ano ang pantay-pantay na pinakamakapangyarihang pagsubok, ang Neyman-Pearson test, antas ng kahalagahan, agwat ng kumpiyansa, at kung saan nagmula ang kilalang-kilalang Gaussian test at t-test.

Asymptotic na katangian ng pamantayan

Tulad ng mga pagtatantya, dapat matugunan ng pamantayan ang ilang partikular na asymptotic na katangian. Minsan maaaring lumitaw ang mga sitwasyon kung imposibleng buuin ang kinakailangang pamantayan, gayunpaman, gamit ang kilalang sentral na teorama ng limitasyon, bumuo kami ng isang pamantayan na asymptotically ay may posibilidad na kinakailangan. Dito ay malalaman mo kung ano ang antas ng asymptotic significance, ang paraan ng ratio ng posibilidad, at kung paano binuo ang pagsubok ng Bartlett at ang pagsubok sa kalayaan ng chi-square.

Linear na modelo

Ang kabanatang ito ay maaaring ituring bilang karagdagan, ibig sabihin, ang aplikasyon ng mga istatistika sa kaso ng linear regression. Mauunawaan mo kung anong mga grado ang maganda at sa ilalim ng anong mga kondisyon. Matututuhan mo kung saan nanggaling ang paraan ng least squares, kung paano bumuo ng pamantayan at kung bakit kailangan mo ng F-distribution.

Mayroong isang sistema ng mga notasyon para sa paglalarawan ng mga pagtatantya na walang sintomas:

§ Sinasabi nila na f(n)= O(g(n)) kung mayroong isang pare-parehong c>0 at isang numerong n0 na ang kundisyong 0≤f(n)≤c*g(n) ay nasiyahan para sa lahat ng n≥n0. Mas pormal:

(()) { () | 0, } 0 0 O g n= f n$c> $n"n> n£ f n£ cg n

O Ang (g(n)) ay ginagamit upang ipahiwatig ang mga function na hindi hihigit sa isang pare-parehong bilang ng beses na mas malaki kaysa sa g(n), ang variant na ito ay ginagamit upang ilarawan ang mga upper bounds (sa kahulugan ng "hindi mas malala kaysa"). Pagdating sa isang partikular na algorithm para sa paglutas ng isang partikular na problema, ang layunin ng pagsusuri sa pagiging kumplikado ng oras ng algorithm na ito ay upang makakuha ng isang pagtatantya para sa pinakamasama o average na oras, karaniwang isang asymptotic na itaas na pagtatantya O(g(n)), at, kung maaari, isang asymptotic na mas mababang pagtatantya W(g(n)), at mas mabuti, isang asymptotically sharp na pagtatantya Q(g(n)).

Ngunit sa parehong oras, nananatili ang tanong - maaari bang magkaroon ng mas mahusay na mga algorithm ng solusyon para sa problemang ito? Ang tanong na ito ay nagdudulot ng problema sa paghahanap ng mas mababang pagtatantya ng pagiging kumplikado ng oras para sa problema mismo (para sa lahat ng posibleng mga algorithm para sa paglutas nito, at hindi para sa isa sa mga kilalang algorithm para sa paglutas nito). Ang problema sa pagkuha ng hindi mahalaga na mas mababang mga hangganan ay napakakumplikado. Sa ngayon, wala pang ganoong mga resulta, ngunit napatunayan na ang mga hindi maliit na mas mababang hangganan para sa ilang limitadong modelo ng mga calculator, at ang ilan sa mga ito ay may mahalagang papel sa praktikal na programming. Ang isa sa mga problema kung saan nalalaman ang mas mababang limitasyon sa pagiging kumplikado ng oras ay ang problema sa pag-uuri:

§ Dahil sa pagkakasunod-sunod ng n elemento a1,a2,... isang pinili mula sa isang set kung saan binibigyan ang isang linear na pagkakasunud-sunod.

§ Kinakailangang maghanap ng permutation p ng mga n elementong ito na nagmamapa sa ibinigay na sequence sa isang hindi bumababa na sequence ap(1),ap(2),... ap(n), i.e. ap(i)≤ap(i+1) para sa 1≤i paraan ng pagbabawas . Ipagpalagay na mayroon tayong dalawang problema A at B, na magkakaugnay upang ang problema A ay malutas tulad ng sumusunod:

1) Ang input data para sa gawain A ay na-convert sa kaukulang input

datos para sa gawain B.

2) Nalutas ang problema B.

3) Ang resulta ng solusyon ng problema B ay binago sa tamang solusyon ng problema A .__ Sa kasong ito, sinasabi natin na gawain A nabawasan sa problema B. Kung ang mga hakbang (1) at (3) ng impormasyon sa itaas ay maaaring makumpleto sa oras O(t(n)), kung saan, gaya ng dati, n – 25 ang “volume” ng problema A , pagkatapos ay sasabihin natin na A t (n)-nababawasan sa B, at isulat ito ng ganito: A μt (n) B. Sa pangkalahatan, ang reducibility ay hindi isang simetriko na ugnayan, sa partikular na kaso kapag ang A at B ay kapwa mababawasan, tatawagin natin silang katumbas. Ang sumusunod na dalawang maliwanag na pahayag ay nagpapakilala sa kapangyarihan ng paraan ng pagbabawas sa pagpapalagay na ang pagbabawas na ito ay nagpapanatili ng pagkakasunud-sunod ng "volume" ng problema.

"O" malaki At "o" maliit( at ) ay mga mathematical notation para sa paghahambing ng asymptotic na pag-uugali ng mga function. Ginagamit ang mga ito sa iba't ibang sangay ng matematika, ngunit pinaka-aktibo - sa pagsusuri sa matematika, teorya ng numero at kombinatorika, pati na rin sa agham ng computer at teorya ng mga algorithm.

, « O maliit ng " ay nangangahulugang "walang katapusan na maliit na may paggalang sa" [ , bale-wala kapag isinasaalang-alang. Ang kahulugan ng terminong "Big O" ay nakasalalay sa larangan ng aplikasyon nito, ngunit palaging lumalaki nang hindi mas mabilis kaysa sa, " O malaki ng " (ibinigay ang mga eksaktong kahulugan sa ibaba).

Sa partikular:

Karugtong 7

ang pariralang "ang pagiging kumplikado ng algorithm ay" ay nangangahulugan na sa isang pagtaas sa parameter na nagpapakilala sa dami ng impormasyon ng input ng algorithm, ang oras ng pagtakbo ng algorithm ay hindi maaaring limitahan ng isang halaga na lumalaki nang mas mabagal kaysa sa n!;

ang pariralang "ang function ay" o "maliit ng function sa paligid ng punto" ay nangangahulugan na habang ang k ay nilapitan, ito ay bumababa nang mas mabilis kaysa sa (ang ratio ay may posibilidad na zero).

Panuntunan ng kabuuan: Hayaang hatiin ang isang may hangganan na hanay ng M sa dalawang hindi magkakasalubong na subset na M 1 at M 2 (sa unyon ng mga nagbibigay ng buong hanay ng M). Tapos yung cardinality |M| = |M 1 | + |M 2 |.

tuntunin ng produkto: Hayaan sa ilang set object a ay maaaring mapili sa n mga paraan, at pagkatapos nito (iyon ay, pagkatapos pumili ng object a) object b ay maaaring mapili sa m paraan. Pagkatapos ang object ab ay maaaring mapili sa n*m na paraan.

Magkomento: Ang parehong mga panuntunan ay nagbibigay-daan sa inductive generalization. Kung ang isang finite set M ay tinatanggap ang partition sa r pairwise disjoint subsets M 1 , M 2 ,…,M r , kung gayon ang cardinality ng |M| = |M 1 |+|M 2 |+…+|M r |. Kung ang object A 1 ay maaaring piliin sa k 1 na mga paraan, pagkatapos (pagkatapos ng object A 1 ay pinili) object A 2 ay maaaring mapili sa k 2 na paraan, at iba pa at sa wakas, object AR ay maaaring mapili sa kr na paraan, pagkatapos ay object A 1 A 2 ... At maaaring mapili ang r sa k 1 k 2 …k r na paraan.

480 kuskusin. | 150 UAH | $7.5 ", MOUSEOFF, FGCOLOR, "#FFFFCC",BGCOLOR, "#393939");" onMouseOut="return nd();"> Thesis - 480 rubles, pagpapadala 10 minuto 24 na oras sa isang araw, pitong araw sa isang linggo at mga pista opisyal

Kolodzei Alexander Vladimirovich Asymptotic properties ng goodness-of-fit na pamantayan para sa pagsubok ng mga hypotheses sa isang scheme ng pagpili nang walang kapalit, batay sa pagpuno ng mga cell sa isang pangkalahatang pamamaraan ng alokasyon: disertasyon ... kandidato ng pisikal at matematikal na agham: 01.01.05.- Moscow, 2006 .- 110 p.: may sakit. RSL OD, 61 07-1/496

Panimula

1 Entropy at Distansya ng Impormasyon 36

1.1 Mga pangunahing kahulugan at simbolo 36

1.2 Entropy ng Discrete Distributions na may Bounded Expectation 39

1.3 Logarithmic generalized metric sa isang hanay ng mga discrete distribution 43

1.4 Compactness ng mga function ng isang mabibilang na hanay ng mga argumento. 46

1.5 Pagpapatuloy ng distansya ng impormasyon ng Kullback-Leibler-Sanov 49

1.6 Konklusyon 67

2 Malaking posibilidad ng paglihis 68

2.1 Mga probabilidad ng malalaking paglihis ng mga function mula sa bilang ng mga cell na may ibinigay na pagpuno 68

2.1.1 Lokal na limit theorem 68

2.1.2 Integral limit theorem 70

2.1.3 Layo ng impormasyon at malaking posibilidad ng paglihis ng mga mapaghihiwalay na istatistika 75

2.2 Malaking mga posibilidad ng paglihis ng mga mapaghihiwalay na istatistika na hindi nakakatugon sa kondisyon ng Cramer 81

2.3 Konklusyon 90

3 Asymptotic na katangian ng goodness-of-fit na pamantayan 92

3.1 Pamantayan sa pagtanggap para sa pamamaraan ng pagpili ng hindi pagbabalik. 92

3.2 Asymptotic relative efficiency ng goodness of fit tests 94

3.3 Pamantayan batay sa bilang ng mga cell sa mga pangkalahatang layout 95

3.4 Konklusyon 98

Konklusyon 99

Panitikan 103

Panimula sa trabaho

Ang layunin ng pananaliksik at ang kaugnayan ng paksa. Sa teorya ng istatistikal na pagsusuri ng mga discrete sequence, ang isang espesyal na lugar ay inookupahan ng goodness-of-fit na mga pagsubok para sa pagsubok sa posibleng kumplikadong null hypothesis, na para sa isang random na pagkakasunud-sunod pQ)?=i tulad na

Хі Є Ім,і= 1,...,n, Ім = (o, i,..., M), para sa anumang і = 1,..., n, at para sa anumang k їм ang posibilidad ng Ang kaganapan (Хі = k) ay hindi nakadepende sa r. Nangangahulugan ito na ang sequence (Xi)f = 1 ay sa ilang kahulugan ay nakatigil.

Sa isang bilang ng mga inilapat na problema, bilang isang pagkakasunud-sunod (Х() =1, ang pagkakasunud-sunod ng mga kulay ng mga bola ay isinasaalang-alang kapag pumipili nang hindi bumabalik sa pagkahapo mula sa urn na naglalaman ng rik - 1 > 0 bola ng kulay k, k 1, .. .,pd/ - 1) Hayaang maglaman ang urn ng n - 1 bola, m n-l= (n fc -l).

Tukuyin sa pamamagitan ng r(k) _ r(fc) r(fc) ang pagkakasunod-sunod ng mga bilang ng mga bola ng kulay k sa sample. Isaalang-alang ang pagkakasunod-sunod h" = (^,...,)). M fc) =ri fc) , ^ = ^-^ = 2,...,^-1, _ (fc)

Ang pagkakasunud-sunod h^ ay tinukoy sa pamamagitan ng mga distansya sa pagitan ng mga lugar ng katabing mga bola ng kulay k sa paraang *Ф = n.

Ang hanay ng mga sequence h(fc) para sa lahat ng k Є їm ay katangi-tanging tumutukoy sa pagkakasunud-sunod ang pagkakasunud-sunod ng mga kulay ng mga bola ay natatanging tinutukoy ng pagkakasunud-sunod h() ng mga distansya sa pagitan ng mga lugar ng kalapit na mga bola ng parehong nakapirming kulay.Hayaan ang isang urn na naglalaman ng n - 1 bola ng dalawang magkaibang kulay ay naglalaman ng N - 1 bola ng kulay 0. Ang isa ay maaaring magtatag ng isa-sa-isang sulat sa pagitan ng set M(N-l,n - N) at isang set ng 9 \ Nі m vectors h( n, N) = (hi,..., /i#) na may mga positibong bahagi ng integer na ganyan

Ang set na 9\n,m ay tumutugma sa set ng lahat ng natatanging partition ng isang positive integer n sa N ordered summands.

Ang pagkakaroon ng pagbibigay ng ilang probability distribution sa set ng mga vectors 9H n g, nakuha namin ang kaukulang probability distribution sa set Wl(N - l,n - N). Ang set Y\n,s ay isang subset ng set 2J n ,iv ng mga vector na may mga non-negative na integer na bahagi na nagbibigay-kasiyahan (0.1). Bilang probability distributions sa set ng vectors JZ p d sa dissertation work, distributions ng form

P(x, N) = (r t..., r N)) = P(& = rn, u = 1,..., N\ & = n), (0.2) kung saan 6 > , n - independent non-negative integer random variable.

Ang mga distribusyon ng anyo (0.2) sa /24/ ay tinatawag na mga pangkalahatang scheme para sa paglalagay ng n particle sa mga N cell. Sa partikular, kung ang mga random na variable h..., n sa (0.2) ay ipinamamahagi ayon sa mga batas ng Poisson na may mga parameter na Ai,...,Alg, ayon sa pagkakabanggit, kung gayon ang vector h(n,N) ay may polynomial distribution na may mga probabilidad ng mga kinalabasan

Pu \u003d m--~t~\u003e ^ \u003d 1,---, ^-

Li + ... + l^

Kung ang mga random na variable i> >&v sa (0.2) ay pantay na ipinamamahagi ayon sa geometric na batas V(Zi = k)= P k - 1 (l-p),k=l,2,..., kung saan ang p ay alinman sa ang pagitan 0

Tulad ng nabanggit sa /14/,/38/, isang espesyal na lugar sa pagsubok ng mga hypotheses tungkol sa pamamahagi ng frequency vectors h(n, N) = (hi,..., h^) sa mga pangkalahatang scheme para sa paglalagay ng n particle sa N cells ay inookupahan ng mga pamantayan na binuo batay sa mga istatistika ng form

Фк "%,%..;$, (0.4) kung saan ang /j/, v = 1,2,... at φ ay ilang real-valued na function,

Mg \u003d E 1 (K \u003d g), g \u003d 0.1, .... 1 / \u003d 1

Ang mga dami //r sa /27/ ay tinawag na bilang ng mga cell na naglalaman ng eksaktong r particle.

Ang mga istatistika ng form (0.3) sa /30/ ay tinatawag na separable (additively separable) statistics. Kung ang mga function na /„ in (0.3) ay hindi nakadepende sa u, kung gayon ang mga naturang istatistika ay tinawag sa /31/ symmetric separable statistics.

Para sa anumang r, ang istatistikang fx r ay isang simetriko na mapaghihiwalay na istatistika. Mula sa pagkakapantay-pantay

DM = DFg (0.5) ito ay sumusunod na ang klase ng simetriko separable statistics sa h u coincides sa klase ng linear function sa fi r. Bukod dito, ang klase ng mga function ng form (0.4) ay mas malawak kaysa sa klase ng simetriko na mga istatistikang mapaghihiwalay.

H 0 = (R0(n, L0) ay isang sequence ng simpleng null hypotheses na ang distribution ng vector h(n, N) ay (0.2), kung saan ang random variables i,..., n, at (0.2) ay magkaparehong distributed at P(ti = k)=p k ,k = 0,l,2,..., mga parameter n, N pagbabago sa gitnang rehiyon.

Isaalang-alang ang ilang РЄ (0,1) at isang pagkakasunud-sunod ng, sa pangkalahatan, kumplikadong mga alternatibo n = (H(n,N)) kung kaya't mayroong isang n

P(Fm > OpAR)) >: 0-Tatanggihan namin ang hypothesis Hq(ti,N) kung fm > a w m((3). Kung may limitasyon jim ~1nP(0lg > a n, N (P)) = Sh ), kung saan ang probabilidad para sa bawat N ay kinakalkula sa ilalim ng hypothesis #o(n,iV), pagkatapos ay ang halaga j (fi,lcl) ay tinatawag sa /38/ ang criterion index φ sa punto (/?,Н) . Ang huling limitasyon ay maaaring, sa pangkalahatan, ay wala. Samakatuwid, sa gawaing disertasyon, bilang karagdagan sa criterion index, ang halaga lim (_IlnP(tor > a N (J3))) =іф(Р,П) ay isinasaalang-alang, na, sa pamamagitan ng pagkakatulad, ay tinawag ng may-akda ng ang disertasyon ay gumagana ang mas mababang index ng criterion f sa punto (/3,Н) . Dito at sa ibaba, lim adg, lim a# jV-yuo LG-yuo ibig sabihin, ayon sa pagkakabanggit, ang lower at upper limit ng sequence (odr) bilang N -> syu,

Kung mayroong isang criterion index, kung gayon ang subscript ng criterion ay tumutugma dito. Ang subscript ng criterion ay palaging umiiral. Kung mas malaki ang halaga ng criterion index (mas mababang index ng criterion), mas maganda ang statistical criterion sa itinuturing na kahulugan. Sa /38/ nalutas ang problema sa pagbuo ng goodness-of-fit na pamantayan para sa mga pangkalahatang iskema ng alokasyon na may pinakamataas na halaga ng criterion index sa klase ng pamantayan, na tinatanggihan ang hypothesis na Ho(n,N) kung saan ang m > 0 ay ilang nakapirming numero, ang pagkakasunud-sunod ng mga constant hal ay pinili batay sa ibinigay na mga halaga ng kapangyarihan ng criterion para sa isang pagkakasunud-sunod ng mga alternatibo, ft - real function ng m + 1 argumento.

Ang mga indeks ng pamantayan ay tinutukoy ng mga probabilidad ng malalaking paglihis. Gaya ng ipinapakita sa /38/, ang magaspang (hanggang sa logarithmic equivalence) asymptotics ng mga probabilities ng malalaking deviations ng separable statistics kapag nasiyahan ang Cramer condition para sa random variable /() ay tinutukoy ng kaukulang distansya ng impormasyon ng Kullback-Leibler-Sanov (ang random variable na μ ay nakakatugon sa kondisyon ng Cramer , kung para sa ilang # > 0 ang moment generating function na Me f7? ay may hangganan sa pagitan \t\

Ang tanong ng mga probabilidad ng malalaking paglihis ng mga istatistika mula sa isang walang hangganang numero fi r , pati na rin ang mga di-makatwirang mapaghihiwalay na istatistika na hindi nakakatugon sa kondisyon ng Cramer, ay nanatiling bukas. Hindi nito ginawang posible na sa wakas ay malutas ang problema ng pagbuo ng pamantayan para sa pagsubok ng mga hypotheses sa pangkalahatang mga scheme ng alokasyon na may pinakamataas na rate ng convergence sa zero para sa posibilidad ng isang error ng unang uri sa kaso ng converging alternatibo sa klase ng pamantayan. batay sa mga istatistika ng form (0.4). Ang kaugnayan ng pananaliksik sa disertasyon ay tinutukoy ng pangangailangang makumpleto ang solusyon sa problemang ito.

Alinsunod sa layunin ng pag-aaral, ang mga sumusunod na gawain ay itinakda: upang siyasatin ang mga katangian ng entropy at layo ng impormasyon ng Kullback - Leibler - Sanov para sa mga discrete distribution na may mabibilang na bilang ng mga resulta; pag-aralan ang mga probabilidad ng malalaking paglihis ng mga istatistika ng form (0.4); pag-aralan ang mga probabilidad ng malalaking deviations ng simetriko separable statistics (0.3) na hindi nakakatugon sa kondisyon ng Cramer; - maghanap ng ganoong istatistika na ang pamantayan ng kasunduan na binuo batay sa mga pagsubok sa hypotheses sa mga pangkalahatang iskema ng alokasyon ay may pinakamalaking halaga ng index sa klase ng pamantayan ng form (0.7).

Scientific novelty: ang konsepto ng isang pangkalahatang sukatan ay ibinigay - isang function na umaamin ng walang katapusang mga halaga at natutugunan ang mga axiom ng pagkakakilanlan, simetrya at hindi pagkakapantay-pantay ng tatsulok. May nakitang pangkalahatang sukatan at ipinahiwatig ang mga set kung saan ang mga function ng entropy at distansya ng impormasyon, na ibinigay sa isang pamilya ng mga discrete distribution na may mabibilang na bilang ng mga resulta, ay tuloy-tuloy sa sukatang ito; sa pangkalahatang pamamaraan ng paglalaan, ang isang magaspang (hanggang sa logarithmic equivalence) asymptotics ay matatagpuan para sa mga probabilidad ng malalaking paglihis ng mga istatistika ng form (0.4) na nagbibigay-kasiyahan sa kaukulang anyo ng kondisyon ni Cramer; sa pangkalahatang pamamaraan ng paglalaan, ang isang magaspang (hanggang sa logarithmic equivalence) na mga asymptotics ay matatagpuan para sa mga probabilidad ng malalaking paglihis ng simetriko na mapaghihiwalay na mga istatistika na hindi nakakatugon sa kondisyon ng Cramer; sa klase ng pamantayan ng form (0.7), isang criterion na may pinakamalaking halaga ng criterion index ay binuo.

Pang-agham at praktikal na halaga. Sa papel, ang isang bilang ng mga katanungan tungkol sa pag-uugali ng malalaking posibilidad ng paglihis sa mga pangkalahatang scheme ng alokasyon ay nalutas. Ang mga resulta na nakuha ay maaaring magamit sa proseso ng edukasyon sa mga espesyalidad ng matematikal na istatistika at teorya ng impormasyon, sa pag-aaral ng mga istatistikal na pamamaraan para sa pagsusuri ng mga discrete sequence at ginamit sa /3/, /21/ kapag binibigyang-katwiran ang seguridad ng isang klase ng mga sistema ng impormasyon. Mga panukala na ipagtanggol: pagbabawas ng problema sa pagsuri, gamit ang isang solong pagkakasunud-sunod ng mga kulay ng mga bola, ang hypothesis na ang pagkakasunud-sunod na ito ay nakuha bilang isang resulta ng isang pagpipilian nang walang kapalit hanggang sa pagkaubos ng mga bola mula sa urn na naglalaman ng mga bola ng dalawang kulay, at bawat ganoong pagpipilian ay may parehong posibilidad, sa pagbuo ng goodness-of-fit na pamantayan upang subukan ang mga hypotheses sa kaukulang pangkalahatang layout; continuity ng Kullback-Leibler-Sanov entropy at information distance functions sa isang infinite-dimensional simplex na may ipinakilalang logarithmic generalized metric; isang theorem sa magaspang (hanggang sa logarithmic equivalence) asymptotics ng mga probabilities ng malalaking deviations ng simetriko separable statistics na hindi nakakatugon sa kondisyon ng Cramer sa generalised allocation scheme sa pitong exionential case; isang teorama sa magaspang (hanggang sa logarithmic equivalence) asymptotics ng mga probabilidad ng malalaking deviations para sa mga istatistika ng form (0.4); - pagbuo ng isang criterion ng kasunduan para sa pagsubok ng mga hypotheses sa mga pangkalahatang scheme ng alokasyon na may pinakamalaking halaga ng index sa klase ng pamantayan ng form (0.7).

Pag-apruba ng trabaho. Ang mga resulta ay iniulat sa mga seminar ng Kagawaran ng Discrete Mathematics ng Mathematical Institute. V. A. Steklov RAS, Department of Information Security ITMiVT sa kanila. S. A. Lebedev RAS at sa: ang ikalimang All-Russian Symposium on Applied and Industrial Mathematics. Sesyon ng tagsibol, Kislovodsk, Mayo 2 - 8, 2004; ang ikaanim na International Petrozavodsk conference "Probabilistic Methods in Discrete Mathematics" Hunyo 10 - 16, 2004; ang pangalawang International conference "Mga sistema ng impormasyon at teknolohiya (IST"2004)", Minsk, Nobyembre 8 - 10, 2004;

International conference "Modern Problems and new Trends in Probability Theory", Chernivtsi, Ukraine, Hunyo 19 - 26, 2005.

Ang mga pangunahing resulta ng gawain ay ginamit sa gawaing pananaliksik na "Apologia", na isinagawa ng ITMiVT RAS. S. A. Lebedev sa mga interes ng Federal Service for Technical and Export Control ng Russian Federation, at kasama sa ulat sa pagpapatupad ng yugto ng pananaliksik /21/. Ang mga hiwalay na resulta ng disertasyon ay kasama sa ulat ng pananaliksik na "Pag-unlad ng mga problema sa matematika ng cryptography" ng Academy of Cryptography ng Russian Federation para sa 2004/22/.

Ang may-akda ay nagpapahayag ng kanyang malalim na pasasalamat sa siyentipikong tagapayo, Doctor of Physical and Mathematical Sciences na si Ronzhin A.F. at scientific consultant, Doctor of Physical and Mathematical Sciences, Senior Researcher Knyazev A.V. Mathematical Sciences I. A. Kruglov para sa atensyon na ipinakita sa trabaho at isang bilang ng mga mahalagang pangungusap.

Istraktura at nilalaman ng gawain.

Sinisiyasat ng unang kabanata ang mga katangian ng entropy at distansya ng impormasyon para sa mga distribusyon sa hanay ng mga hindi negatibong integer.

Sa unang talata ng unang kabanata, ang notasyon ay ipinakilala at ang mga kinakailangang kahulugan ay ibinigay. Sa partikular, ang sumusunod na notasyon ay ginagamit: x = (:ro,i, ---) ay isang infinite-dimensional vector na may mabibilang na bilang ng mga bahagi;

H(x) - -Ex^oXvlnx,; trunc m (x) = (x 0 ,x 1 ,...,x t,0,0,...); SI* = (x, x u > 0, u = 0,1,..., E~ o xn 0,v = 0,l,...,E? =Q x v = 1); fi 7 \u003d (x Є O, L 0 vx v \u003d 7); %] = (хЄП, Ео»х at

16 mі = e o ** v \ &c = Ue>1 | 5 є Q 7) o

Malinaw na ang hanay ng Vt ay tumutugma sa pamilya ng mga pamamahagi ng probabilidad sa hanay ng mga di-negatibong integer, P 7 - sa pamilya ng mga pamamahagi ng probabilidad sa hanay ng mga hindi negatibong integer na may inaasahan sa matematika.

Оє(у) - (х eO,x v

Sa ikalawang talata ng unang kabanata, pinatutunayan namin ang isang teorama sa boundedness ng entropy ng discrete distributions na may bounded mathematical expectation.

Theorem 1. Sa boundedness ng entropy ng discrete distributions na may bounded mathematical expectation. Para sa anumang wbp 7

Kung ang x Є fi 7 ay tumutugma sa isang geometric distribution na may mathematical prediction 7 ; yan ay

7xn = (1-p)p\ v = 0,1,..., kung saan p = --,

1 + 7 pagkatapos ay ang pagkakapantay-pantay na H(x) = F(1) ay hawak.

Ang assertion ng theorem ay maaaring tingnan bilang resulta ng isang pormal na aplikasyon ng paraan ng conditional Lagrange multiplier sa kaso ng isang walang katapusang bilang ng mga variable. Ang theorem na ang tanging distribusyon sa set (k, k + 1, k + 2,...) na may ibinigay na mathematical expectation at maximum entropy ay isang geometric distribution na may ibinigay na mathematical expectation ay ibinibigay (nang walang patunay) sa /47 /. Ang may-akda, gayunpaman, ay nagbigay ng isang mahigpit na patunay.

Sa ikatlong talata ng unang kabanata, ang isang kahulugan ng isang pangkalahatang sukatan ay ibinigay - isang sukatan na umaamin ng mga walang katapusang halaga.

Para sa x, y Є Гі, ang function na p(x, y) ay tinukoy bilang pinakamababang є > 0 na may property na y v e~ e

Kung walang ganoong є, pagkatapos ay ipinapalagay na p(x, y) = oo.

Napatunayan na ang function na p(x, y) ay isang pangkalahatang sukatan sa pamilya ng mga distribusyon sa hanay ng mga di-negatibong integer, gayundin sa buong hanay na Ci*. Sa halip na e sa kahulugan ng sukatan na p(x, y), maaari kang gumamit ng anumang iba pang positibong numero maliban sa 1. Ang mga resultang sukatan ay mag-iiba sa pamamagitan ng multiplicative constant. Ipahiwatig sa pamamagitan ng J(x, y) ang distansya ng impormasyon

Dito at sa ibaba ay ipinapalagay na 0 Sa 0 = 0.01n ^ = 0. Ang distansya ng impormasyon ay tinukoy para sa naturang x, y, na x v - 0 para sa lahat at tulad na y v = 0. Kung ang kundisyong ito ay hindi nasiyahan, kung gayon tayo ay ipagpalagay na J (S,y) = co. Hayaan ang A C $1. Pagkatapos ay ilalarawan natin ang J(Ay)="mU(x,y).

Hayaan ang J(Jb,y) = 00.

Sa ikaapat na talata ng unang kabanata, isang kahulugan ang ibinigay para sa pagiging compact ng mga function na tinukoy sa set Π*. Ang pagiging compact ng isang function na may mabibilang na bilang ng mga argumento ay nangangahulugan na, sa anumang antas ng katumpakan, ang halaga ng function ay maaaring tantiyahin sa pamamagitan ng mga halaga ng function na ito sa mga punto kung saan ang isang tiyak na bilang ng mga argumento ay nonzero. Ang pagiging compact ng entropy at mga function ng distansya ng impormasyon ay napatunayan.

Para sa anumang 0

Kung, para sa ilang 0 0, ang function na \(x) = J(x, p) ay compact sa set ^ 7 ] P 0 r (p).

Sa ikalimang talata ng unang kabanata, ang mga katangian ng distansya ng impormasyon na ibinigay sa isang walang katapusang-dimensional na espasyo ay isinasaalang-alang. Kung ikukumpara sa finite-dimensional na kaso, ang sitwasyon na may pagpapatuloy ng function ng distansya ng impormasyon ay nagbabago nang husay. Ipinapakita na ang function ng information distance ay hindi tuloy-tuloy sa set Г2 sa alinman sa mga sukatan pi(,y)= E|z„-i/„|, (

00 \ 2 p 2 (x, y) = sup (x^-ij^.

Ang bisa ng mga sumusunod na hindi pagkakapantay-pantay para sa mga function ng entropy H(x) at distansya ng impormasyon J(x,p) ay napatunayan:

1. Para sa anumang x, x "Є fi \ H (x) - H (x") \

2. Kung para sa ilang x, p є P mayroong є > 0 na ang x є O є (p), kung gayon para sa alinmang X i Є Q \J(x,p) - J(x",p)\

Mula sa mga hindi pagkakapantay-pantay na ito, na isinasaalang-alang ang Theorem 1, sumusunod na ang entropy at mga function ng distansya ng impormasyon ay pare-parehong tuloy-tuloy sa kaukulang mga subset fi sa sukatan ng p(x,y), ibig sabihin,

Para sa alinmang 7 tulad ng 0

Kung para sa ilang 70, 0

20 pagkatapos para sa anumang 0 0 ang function \p(x) = J(x t p) ay pare-parehong tuloy-tuloy sa set П 7 ] П О є (р) sa metric р(х,у).

Ang kahulugan ng non-extremality ng isang function ay ibinigay. Ang kundisyong non-extremality ay nangangahulugan na ang function ay walang lokal na extrema, o ang function ay tumatagal ng parehong mga halaga sa lokal na minima (local maxima). Ang kundisyong non-extremality ay nagpapahina sa pangangailangan na walang lokal na extrema. Halimbawa, ang function na sin x sa hanay ng mga tunay na numero ay may lokal na extrema, ngunit natutugunan ang kondisyon ng non-extremality.

Hayaan para sa ilang 7 > 0, ang lugar A ay ibinibigay ng kundisyon

А = (хЄЇ1 1 ,Ф(х) >а), (0.9) kung saan ang Ф(х) ay isang real-valued function, ang a ay ilang tunay na pare-pareho, inf Ф(х)

At 3y, ang tanong ay lumitaw, sa ilalim ng anong mga kondisyon „a f „ f na may u_ „ na mga parameter n, N sa gitnang rehiyon, ^ -> 7, para sa lahat ng sapat na malalaking halaga ng mga ito ay mayroong mga di-negatibong integer ko, k \, ..., k n, which is ko + hi + ... + k n = N,

21 k\ + 2/... + nk n - N

Kq k \ k n . ^"iv"-"iv" 0 " 0 "-")>a -

Ito ay pinatunayan na para dito ay sapat na upang hilingin na ang function na φ ay hindi extremal, compact at tuloy-tuloy sa metric p(x, y), at gayundin na para sa hindi bababa sa isang punto x kasiya-siya (0.9), para sa ilang є > 0 mayroong isang may hangganang sandali ng degree 1 + є Ml + = і 1+є x at 0 para sa anumang u = 0.1,....

Sa ikalawang kabanata, pinag-aaralan namin ang magaspang (hanggang sa logarithmic equivalence) asymptotics ng posibilidad ng malaking deviations ng mga function mula sa D = (fio,..., n, 0,...) - ang bilang ng mga cell na may ibinigay na pagpuno sa gitnang rehiyon ng mga parameter N,n . Ang mga magaspang na asymptotics ng mga probabilidad ng malalaking paglihis ay sapat na upang pag-aralan ang mga indeks ng kabutihan ng mga pagsubok na angkop.

Hayaang ang mga random na variable ^ sa (0.2) ay magkaparehong distributed at

Р(Сі = k)=р b k = 0.1,... > P(z) - pagbuo ng function ng random variable i - nagtatagpo sa isang bilog na radius 1

22 Ipahiwatig ang p(.) = (p(ad = o), Pn) = i),...).

Kung mayroong isang solusyon z 1 ng equation

M(*) = 7, pagkatapos ito ay natatangi /38/. Kahit saan sa ibaba ay ipagpalagay natin na Pjfc>0,fc = 0,l,....

Sa unang talata ng unang talata ng ikalawang kabanata, mayroong isang asymptotics ng logarithms ng mga probabilities ng form.

Ang sumusunod na teorama ay napatunayan.

Theorem 2. Isang magaspang na lokal na teorama sa mga probabilidad ng malalaking paglihis. Hayaan n, N - * w upang - -> 7> 0

Ang pahayag ng theorem ay direktang sumusunod mula sa pormula para sa magkasanib na pamamahagi /to, A*b / sa /26/ at ang sumusunod na pagtatantya: kung ang mga non-negative na integer na halaga ay fii,fi2,/ ay natutugunan ang kundisyon /І1 + 2 // 2 + ... + 71/ = 71, kung gayon ang bilang ng mga di-zero na halaga sa mga ito ay 0(l/n). Ito ay isang magaspang na pagtatantya na hindi sinasabing bago. Ang bilang ng mga non-zero r sa mga pangkalahatang layout ay hindi lalampas sa halaga ng maximum na pagpuno ng mga cell, na sa gitnang rehiyon na may posibilidad na 1 ay hindi lalampas sa halagang 0(\np) /25/,/27/ . Gayunpaman, ang nagresultang pagtatantya na 0(y/n) ay nasiyahan sa probabilidad 1, at ito ay sapat na upang makakuha ng isang magaspang na asymptotics.

Sa ikalawang talata ng unang talata ng ikalawang kabanata, ang halaga ng limitasyon ay matatagpuan kung saan ang adz ay isang sequence ng mga tunay na numero na nagko-converging sa ilang a Є R, φ(x) ay isang real-valued function. Ang sumusunod na teorama ay napatunayan.

Theorem 3. Isang magaspang na integral theorem sa mga probabilidad ng malalaking deviations. Hayaang matugunan ang mga kundisyon ng Theorem 2, para sa ilang r > 0, (> 0 ang tunay na function φ(x) ay compact, pare-parehong tuloy-tuloy sa metric p sa set

A = 0 rH (p(r 1))np n] at natutugunan ang kondisyon ng non-extremality sa set r2 7 . Kung para sa ilang pare-pareho ang tulad na inf φ(x)

24 mayroong vector p a fi 7 P 0 r (p(z 7)) ; ganyan

Ф(pа) > a J(( (x) >а,хЄ П 7 ),р(2; 7)) = J(p a ,p(^y)), mo para sa anumang pagkakasunod-sunod na a^ nagtatagpo sa a, ^ -^\nP(φ(φ, ^,...)>a m) = Pr a,p(r,)). (0.11)

Sa ilalim ng karagdagang mga paghihigpit sa function na φ(x), ang layo ng impormasyon na J(pa, P(zy)) sa (2.3) ay maaaring kalkulahin nang mas partikular. Ibig sabihin, totoo ang sumusunod na theorem. Theorem 4. Distansya ng impormasyon. Hayaan para sa ilang 0

Kung ang ilang r > 0, C > 0 ang tunay na function na φ(x) at ang first-order na partial derivatives nito ay compact at pare-parehong tuluy-tuloy sa generalised metric p(x, y) sa set

A = 0 r (p)PP bl] , mayroong T > 0, R > 0 na para sa lahat ng \t\ 0 p v v 1+ z u exp(i--φ(x))

0(p(gaL)) = a, / x X v \Z,t) T, u= oX LJ (Z,t)

Pagkatapos p(z a, t a) Є ft, u J ((z Є L, 0 (x) = a), p) = J (p (z a , t a), p) d _ 9 = 7111 + t a "-^ OFaL)) - Sa 2Wexp( a --0(p(r a, i a))). j/=0 CnEi/ ^_o CX(/

Kung ang function na φ(x) ay isang linear function, at ang function fix) ay tinukoy gamit ang pagkakapantay-pantay (0.5), kung gayon ang kundisyon (0.12) ay magiging kondisyon ng Cramer para sa random variable na f(,(z)). Ang kondisyon (0.13) ay isang anyo ng kundisyon (0.10) at ginagamit upang patunayan ang presensya sa mga domain ng anyo (x Є T2, φ(x) > a) ng hindi bababa sa isang punto mula 0(n, N) para sa lahat sapat na malaki n, N.

Hayaang ang v ()(n,iV) = (/i,...,/ijv) ang frequency vector sa generalized allocation scheme (0.2). Bilang resulta ng Theorems 3 at 4, ang sumusunod na theorem ay nabuo.

Theorem 5. Isang magaspang na integral theorem sa mga probabilities ng malalaking deviations ng simetriko separable statistics sa isang generalised allocation scheme.

Hayaan n, N -> w upang ang jfr - 7» 0 0, R > 0 na para sa lahat \t\ Pagkatapos ay para sa anumang pagkakasunod-sunod na a# nagtatagpo sa a, 1 i iv =

Ang theorem na ito ay unang pinatunayan ni AF Ronzhin sa /38/ gamit ang saddle point method.

Sa ikalawang seksyon ng ikalawang kabanata, pinag-aaralan namin ang mga probabilidad ng malalaking paglihis ng mga mapaghihiwalay na istatistika sa pangkalahatang pagsasaayos ng cxj^iax sa kaso ng hindi pagtupad sa kondisyon ng Cramer para sa random variable /((z)). Ang kundisyon ng Cramer para sa random variable na f(,(z)) ay hindi nasiyahan, sa partikular, kung ang (z) ay isang Poisson random variable, at /(x) = x 2 . Tandaan na ang kundisyon ng Cramer para sa mga ihihiwalay na istatistika mismo sa mga pangkalahatang iskema ng alokasyon ay palaging nasiyahan, dahil para sa anumang nakapirming n, N ang bilang ng mga posibleng resulta sa mga iskema na ito ay may hangganan.

Tulad ng nabanggit sa /2/, kung ang kondisyon ni Cramer ay hindi nasiyahan, pagkatapos ay upang mahanap ang mga asymptotics ng mga probabilidad ng malalaking paglihis ng mga kabuuan ng magkaparehong ibinahagi na mga random na variable, kinakailangan upang matupad ang mga karagdagang, f kundisyon para sa tamang pagbabago sa pamamahagi ng termino. Sa papel (isinasaalang-alang ang kaso na tumutugma sa katuparan ng kundisyon (3) sa /2/, iyon ay, ang pitong exponential case. Hayaan ang P(i = k) > 0 para sa lahat

28 k = 0.1,... at ang function na p(k) = -\nP(t = k), ay maaaring palawigin sa isang function ng tuluy-tuloy na argumento - isang regular na nag-iiba-iba na function ng order p, 0 oo P(tx) , r v P(t )

Hayaang ang function na f(x) para sa sapat na malalaking halaga ng argumento ay maging positibo, mahigpit na tumataas, regular na nag-iiba-iba ng function ng order q > 1, sa natitirang bahagi ng totoong axis

Pagkatapos s. V. Ang /(i) ay may mga sandali ng anumang pagkakasunud-sunod at hindi nakakatugon sa kundisyon ni Cramer, ip(x) = o(x) bilang x -> oo, at ang sumusunod na theorem ay hawak. ^p ay hindi tumataas nang monotonically, n, N --> oo para jf - A, 0 b(z\), kung saan b(z) = M/(1(2)), mayroong isang limitasyon l(n,l)) > cN] = "(c ~ b( zx))l b""ї

Kasunod nito mula sa Theorem 6 na, kung ang kondisyon ng Cramer ay hindi nasiyahan, ang limitasyon (^ lim ~\nP(L N (h(n,N)) > cN) = 0, "" Dv

L/-too iV at iyon ang nagpapatunay sa bisa ng hypothesis na nakasaad sa /39/. Kaya, ang halaga ng index ng goodness-of-fit criterion sa generalized allocation schemes -^ kapag hindi nasiyahan ang kondisyon ni Cramer, ay palaging katumbas ng zero. Sa kasong ito, sa klase ng mga pamantayan, kapag ang kondisyon ng Cramer ay nasiyahan, ang mga pamantayan na may hindi zero na halaga ng index ay binuo. Mula dito maaari nating tapusin na ang paggamit ng mga pamantayan na ang mga istatistika ay hindi nakakatugon sa kondisyon ng Cramer, halimbawa, ang chi-square na pagsubok sa isang polynomial scheme, upang makabuo ng mga goodness-of-fit na mga pagsubok para sa pagsubok ng mga hypotheses na may hindi lumalapit na mga alternatibo ay asymptotically inefficient sa ganitong kahulugan. Ang isang katulad na konklusyon ay ginawa sa /54/ batay sa mga resulta ng paghahambing ng mga istatistika ng chi-square at ang maximum na ratio ng posibilidad sa isang polynomial scheme.

Sa ikatlong kabanata, nilulutas namin ang problema sa pagbuo ng goodness-of-fit na pamantayan na may pinakamataas na halaga ng criterion index (ang pinakamalaking halaga ng mas mababang index ng criterion) para sa pagsubok ng mga hypotheses sa mga pangkalahatang layout. Batay sa mga resulta ng una at ikalawang kabanata sa mga katangian ng mga pag-andar ng entropy, distansya ng impormasyon, at mga probabilidad ng malalaking paglihis, sa ikatlong kabanata, ang isang function ng form (0.4) ay natagpuan na ang goodness-of-fit criterion na binuo sa batayan nito ay may pinakamalaking halaga ng eksaktong mas mababang index sa klase ng pamantayang isinasaalang-alang. Ang sumusunod na teorama ay napatunayan. Theorem 7. Sa pagkakaroon ng index. Hayaang matugunan ang mga kondisyon ng Theorem 3, 0 ,... ay isang sequence ng mga alternatibong distribusyon, 0^(/3, iV) ay ang maximum na bilang kung saan, sa ilalim ng hypothesis Н Р (lo, ang hindi pagkakapantay-pantay

P(φ(^^,...) > a φ (P, M)) > (3, mayroong limitasyon mayroong index ng criterion f

3ff,K) = 3((φ(x) >a,xe 3D.P^)).

Kasabay nito, sph(0,th)N NP(e(2 7) = fc)"

Ang Konklusyon ay binabalangkas ang mga resulta na nakuha sa kanilang kaugnayan sa pangkalahatang layunin at mga tiyak na gawain na itinakda sa disertasyon, bumubuo ng mga konklusyon batay sa mga resulta ng pananaliksik sa disertasyon, nagpapahiwatig ng siyentipikong bagong bagay, teoretikal at praktikal na halaga ng trabaho, pati na rin ang tiyak na siyentipikong pananaliksik. mga problema na natukoy ng may-akda at ang solusyon na tila may kaugnayan. .

Isang maikling pagsusuri ng literatura sa paksa ng pananaliksik.

Isinasaalang-alang ng gawaing disertasyon ang problema sa pagbuo ng goodness of fit na pamantayan sa mga pangkalahatang scheme ng alokasyon na may pinakamalaking halaga ng criterion index sa klase ng mga function ng form (0.4) na may mga hindi lumalapit na alternatibo.

Ang mga pangkalahatang iskema ng alokasyon ay ipinakilala ni VF Kolchin sa /24/. Ang mga halaga ng fi r sa polynomial scheme ay tinawag na bilang ng mga cell na may r shot at pinag-aralan nang detalyado sa monograph ni V. F. Kolchin, B. A. Sevastyanov, V. P. Chistyakov /27/. Ang mga halaga sa mga pangkalahatang layout ay pinag-aralan ni VF Kolchin sa /25/,/26/. Ang mga istatistika ng anyo (0.3) ay unang isinaalang-alang ni Yu. I. Medvedev sa /30/ at tinawag na separable (additively separable) na istatistika. Kung ang mga function na /„ in (0.3) ay hindi nakasalalay sa u, ang mga naturang istatistika ay tinawag sa /31/ symmetric separable statistics. Ang asymptotic na pag-uugali ng mga sandali ng mga mapaghihiwalay na istatistika sa mga pangkalahatang scheme ng alokasyon ay nakuha ni GI Ivchenko sa /9/. Ang mga teorema ng limitasyon para sa isang pangkalahatang pamamaraan ng alokasyon ay isinasaalang-alang din sa /23/. Ang mga pagsusuri sa mga resulta ng limit theorems at goodness of fit sa discrete probabilistic scheme ng uri (0.2) ay ibinigay ni V. A. Ivanov, G. I. Ivchenko, Yu. I. Medvedev sa /8/ at G. I. Ivchenko, Yu. I. Medvedev , A.F. Ronzhin sa /14/. Ang goodness-of-fit na pamantayan para sa mga pangkalahatang layout ay isinasaalang-alang ni A.F. Ronzhin sa /38/.

Ang paghahambing ng mga katangian ng mga pagsusulit sa istatistika sa mga gawaing ito ay isinagawa mula sa punto ng view ng kamag-anak na asymptotic na kahusayan. Ang kaso ng papalapit na (contigual) hypotheses - kahusayan sa kahulugan ng Pitman at hindi converging hypotheses - kahusayan sa kahulugan ng Bahadur, Hodges - Lehman at Chernov ay isinasaalang-alang. Ang kaugnayan sa pagitan ng iba't ibang uri ng relatibong pagganap ng mga istatistikal na pagsusulit ay tinalakay, halimbawa, sa /49/. Tulad ng mga sumusunod mula sa mga resulta ng Yu. I. Medvedev sa /31/ sa pamamahagi ng mga nabubulok na istatistika sa isang polynomial scheme, ang pagsusulit batay sa chi-square statistic ay may pinakamataas na asymptotic power sa ilalim ng converging hypotheses sa klase ng decomposable statistics sa ang mga frequency ng mga kinalabasan sa isang polynomial scheme. Ang resultang ito ay ginawang pangkalahatan ng A.F. Ronzhin para sa mga scheme ng uri (0.2) sa /38/. II Viktorova at VP Chistyakov sa /4/ ay nagtayo ng pinakamainam na pamantayan para sa isang polynomial scheme sa klase ng mga linear na function ng fi r . Si A. F. Ronzhin sa /38/ ay gumawa ng isang criterion na, sa kaso ng isang pagkakasunud-sunod ng mga alternatibong hindi lumalapit sa null hypothesis, pinaliit ang logarithmic rate ng posibilidad ng isang error ng unang uri na may posibilidad na maging zero sa klase ng mga istatistika ng form. (0.6). Ang isang paghahambing ng kamag-anak na pagganap ng istatistika ng chi-square at ang maximum na ratio ng posibilidad para sa nagtatagpo at hindi nagtatagpo na mga hypotheses ay ginawa sa /54/. Sa gawaing disertasyon, isinaalang-alang ang kaso ng mga hindi lumalapit na hypotheses. Ang pag-aaral ng relatibong istatistikal na kahusayan ng mga pamantayan sa ilalim ng nonconverging hypotheses ay nangangailangan ng pag-aaral ng mga probabilidad ng superlarge deviations - ng pagkakasunud-sunod ng 0(y/n). Sa kauna-unahang pagkakataon ang gayong problema para sa isang polynomial distribution na may nakapirming bilang ng mga resulta ay nalutas ng IN Sanov sa /40/. Ang asymptotic optimality ng goodness-of-fit na pamantayan para sa pagsubok ng simple at kumplikadong mga hypotheses para sa isang polynomial distribution sa kaso ng isang may hangganang bilang ng mga resulta na may hindi lumalapit na mga alternatibo ay isinasaalang-alang sa /48/. Ang mga katangian ng distansya ng impormasyon ay dating isinasaalang-alang ng Kullback, Leibler /29/,/53/ at I. II. Sanov /40/, pati na rin ang Heffding /48/. Sa mga papel na ito, ang pagpapatuloy ng distansya ng impormasyon ay isinasaalang-alang sa mga finite-dimensional na espasyo sa Euclidean metric. Isinasaalang-alang din ng may-akda ang isang pagkakasunud-sunod ng mga puwang na may pagtaas ng sukat, halimbawa, sa gawain ni Yu. V. Prokhorov /37/ o sa gawain ni V. I. Bogachev, A. V. Kolesnikov /1/. Ang magaspang (hanggang sa logarithmic equivalence) theorems sa mga probabilities ng malalaking deviations ng separable statistics sa generalized allocation schemes sa ilalim ng Cramer condition ay nakuha ni A. F. Roizhin sa /38/. A. N. Timashev sa /42/,/43/ nakakuha ng eksaktong (hanggang sa katumbas) multidimensional integral at local limit theorems sa mga probabilidad ng malalaking deviations ng vector fir^n, N),..., fi rs (n,N) , kung saan s, гі,..., r s - fixed integers,

Isinaalang-alang ni G. I. Ivchenko, V. V. Levin, E. E. Timonina /10/, /15/, ang mga istatistikal na problema ng pagsubok ng mga hypotheses at pagtatantya ng mga parameter sa isang scheme ng pagpili nang walang kapalit sa isang bahagyang naiibang pagbabalangkas, kung saan nalutas ang mga problema sa pagtatantya para sa isang may hangganang populasyon, nang ang ang bilang ng mga elemento nito ay isang hindi kilalang halaga, ang asymptotic na normalidad ng multivariate S-statistics mula sa mga independiyenteng sample sa isang scheme ng pagpili nang walang kapalit ay napatunayan. Ang problema sa pag-aaral ng mga random na variable na nauugnay sa mga pag-uulit sa mga pagkakasunud-sunod ng mga independiyenteng pagsubok ay pinag-aralan ni A. M. Zubkov, V. G. Mikhailov, A. M. Shoitov sa /6/, /7/, /32/, /33/, / 34/. Ang pagsusuri ng mga pangunahing problema sa istatistika ng pagtatantya at pagsubok ng mga hypotheses sa balangkas ng pangkalahatang modelo ng Markov-Poya ay isinagawa ni G. I. Ivchenko, Yu. I. Medvedev sa /13/, ang probabilistic analysis na ibinigay sa /11 /. Ang isang paraan para sa pagtukoy ng mga di-malamang na hakbang sa isang hanay ng mga pinagsama-samang bagay na hindi mababawasan sa isang pangkalahatang pamamaraan ng paglalaan (0.2) ay inilarawan sa GI Ivchenko, Yu. I. Medvedev /12/. Ang isang bilang ng mga problema sa teorya ng posibilidad, kung saan ang sagot ay maaaring makuha bilang isang resulta ng mga kalkulasyon gamit ang mga recursive formula, ay ipinahiwatig ng AM Zubkov sa /5/.

Ang mga hindi pagkakapantay-pantay para sa entropy ng mga discrete distribution ay nakuha sa /50/ (sinipi sa abstract ng A. M. Zubkov sa RZhMat). Kung ang (p n )Lo ay isang probability distribution,

Pn = E Pk, k=n A = supp^Pn+i

I + (Sa -f-) (X Rp - P p + 1)

Рп= (x f 1)n+v n>Q. (0.15)

Tandaan na ang extremal distribution (0.15) ay isang geometric distribution na may expectation A, at ang function na F(X) ng parameter (0.14) ay tumutugma sa function ng expectation sa Theorem 1.

Entropy ng Discrete Distributions na may Bounded Expectation

Kung mayroong isang criterion index, kung gayon ang subscript ng criterion ay tumutugma dito. Ang subscript ng criterion ay palaging umiiral. Kung mas malaki ang halaga ng criterion index (mas mababang index ng criterion), mas maganda ang statistical criterion sa itinuturing na kahulugan. Sa /38/, ang problema sa pagbuo ng goodness-of-fit na pamantayan para sa mga pangkalahatang layout na may pinakamataas na halaga ng criterion index sa klase ng pamantayan na tumatanggi sa hypothesis na Ho(n,N) ay nalutas kung saan ang m 0 ay ilang nakapirming numero, ang pagkakasunud-sunod ng mga constants hal ay pinili batay sa ibinigay na halaga ang kapangyarihan ng criterion para sa isang sequence ng mga alternatibo, ft ay isang tunay na function ng m + 1 argumento.

Ang mga indeks ng pamantayan ay tinutukoy ng mga probabilidad ng malalaking paglihis. Gaya ng ipinapakita sa /38/, ang magaspang (hanggang sa logarithmic equivalence) asymptotics ng mga probabilities ng malalaking deviations ng separable statistics kapag nasiyahan ang Cramer condition para sa random variable /() ay tinutukoy ng kaukulang distansya ng impormasyon ng Kullback-Leibler-Sanov (ang random variable μ ay nakakatugon sa kondisyon ng Cramer , kung para sa ilang # 0 ang moment generating function na Mef7? ay may hangganan sa pagitan ng \t\ H /28/).

Ang tanong ng mga probabilidad ng malalaking paglihis ng mga istatistika mula sa isang walang hangganang numero ng fir, pati na rin ng mga di-makatwirang mapaghihiwalay na istatistika na hindi nakakatugon sa kondisyon ng Cramer, ay nanatiling bukas. Hindi nito ginawang posible na sa wakas ay malutas ang problema ng pagbuo ng pamantayan para sa pagsubok ng mga hypotheses sa pangkalahatang mga scheme ng alokasyon na may pinakamataas na rate ng convergence sa zero para sa posibilidad ng isang error ng unang uri sa kaso ng converging alternatibo sa klase ng pamantayan. batay sa mga istatistika ng form (0.4). Ang kaugnayan ng pananaliksik sa disertasyon ay tinutukoy ng pangangailangang makumpleto ang solusyon sa problemang ito.

Ang layunin ng gawaing disertasyon ay bumuo ng goodness-of-fit na pamantayan na may pinakamataas na halaga ng criterion index (mas mababang index ng criterion) para sa pagsubok ng mga hypotheses sa scheme ng pagpili nang walang pag-ulit sa klase ng pamantayan na tumatanggi sa hypothesis W( n, N) kung saan ang φ ay isang function ng isang mabibilang na bilang ng mga argumento, at ang mga parameter n, N ay nagbabago sa gitnang rehiyon. Alinsunod sa layunin ng pag-aaral, ang mga sumusunod na gawain ay itinakda: - upang siyasatin ang mga katangian ng entropy at ang distansya ng impormasyon ng Kullback - Leibler - Sanov para sa mga discrete distribution na may mabibilang na bilang ng mga resulta; - imbestigahan ang mga probabilidad ng malalaking paglihis ng mga istatistika ng form (0.4); - imbestigahan ang mga probabilidad ng malalaking paglihis ng simetriko na mapaghihiwalay na istatistika (0.3) na hindi nakakatugon sa kondisyon ng Cramer; - maghanap ng ganoong istatistika na ang pamantayan ng kasunduan na binuo batay sa mga pagsubok sa hypotheses sa mga pangkalahatang iskema ng alokasyon ay may pinakamalaking halaga ng index sa klase ng pamantayan ng form (0.7). Scientific novelty: - ang konsepto ng isang pangkalahatang sukatan ay ibinibigay - isang function na umaamin ng walang katapusang mga halaga at natutugunan ang mga axiom ng pagkakakilanlan, symmetry at hindi pagkakapantay-pantay ng tatsulok. May nakitang pangkalahatang sukatan at ipinahiwatig ang mga set kung saan ang mga function ng entropy at distansya ng impormasyon, na ibinigay sa isang pamilya ng mga discrete distribution na may mabibilang na bilang ng mga resulta, ay tuloy-tuloy sa sukatang ito; - sa pangkalahatang pamamaraan ng paglalaan, ang isang magaspang (hanggang sa logarithmic equivalence) asymptotics ay matatagpuan para sa mga probabilidad ng malalaking paglihis ng mga istatistika ng form (0.4) na nagbibigay-kasiyahan sa kaukulang anyo ng kondisyon ng Cramer; - sa pangkalahatang pamamaraan ng paglalaan, ang isang magaspang (hanggang sa logarithmic equivalence) na asymptotics ay matatagpuan para sa mga probabilidad ng malalaking paglihis ng simetriko na mapaghihiwalay na mga istatistika na hindi nakakatugon sa kondisyon ng Cramer; - sa klase ng pamantayan ng form (0.7), isang criterion na may pinakamalaking halaga ng criterion index ay binuo. Pang-agham at praktikal na halaga. Sa papel, ang isang bilang ng mga katanungan tungkol sa pag-uugali ng malalaking posibilidad ng paglihis sa mga pangkalahatang scheme ng alokasyon ay nalutas. Ang mga resulta na nakuha ay maaaring magamit sa proseso ng edukasyon sa mga espesyalidad ng matematikal na istatistika at teorya ng impormasyon, sa pag-aaral ng mga istatistikal na pamamaraan para sa pagsusuri ng mga discrete sequence at ginamit sa /3/, /21/ kapag binibigyang-katwiran ang seguridad ng isang klase ng mga sistema ng impormasyon. Ang mga probisyon na iniharap para sa pagtatanggol: - pagbabawas ng problema sa pagsuri, gamit ang isang solong pagkakasunud-sunod ng mga kulay ng mga bola, ang hypothesis na ang pagkakasunud-sunod na ito ay nakuha bilang isang resulta ng isang pagpipilian nang walang kapalit hanggang sa pagkaubos ng mga bola mula sa isang urn na naglalaman ng mga bola ng dalawa mga kulay, at ang bawat naturang pagpipilian ay may parehong posibilidad, sa pagbuo ng kasunduan sa pamantayan upang subukan ang mga hypotheses sa kaukulang pangkalahatang layout; - pagpapatuloy ng mga function ng entropy at Kullback - Leibler - Sanov na distansya ng impormasyon sa isang walang hanggan-dimensional na simplex na may ipinakilalang logarithmic generalized metric; - isang theorem sa magaspang (hanggang sa logarithmic equivalence) asymptotics ng mga probabilities ng malalaking deviations ng simetriko separable statistics na hindi nakakatugon sa kondisyon ng Cramer sa generalised allocation scheme sa pitong exionential case;

Pagpapatuloy ng Distansya ng Impormasyon ng Kullback-Leibler-Sanov

Ang mga pangkalahatang iskema ng alokasyon ay ipinakilala ni VF Kolchin sa /24/. Ang mga halaga ng fir sa polynomial scheme ay tinawag na bilang ng mga cell na may r shot at pinag-aralan nang detalyado sa monograph ni V. F. Kolchin, B. A. Sevastyanov, V. P. Chistyakov /27/. Ang mga halaga sa mga pangkalahatang layout ay pinag-aralan ni VF Kolchin sa /25/,/26/. Ang mga istatistika ng anyo (0.3) ay unang isinaalang-alang ni Yu. I. Medvedev sa /30/ at tinawag na separable (additively separable) na istatistika. Kung ang mga function na /„ in (0.3) ay hindi nakasalalay sa u, ang mga naturang istatistika ay tinawag sa /31/ symmetric separable statistics. Ang asymptotic na pag-uugali ng mga sandali ng mga mapaghihiwalay na istatistika sa mga pangkalahatang scheme ng alokasyon ay nakuha ni GI Ivchenko sa /9/. Ang mga teorema ng limitasyon para sa isang pangkalahatang pamamaraan ng alokasyon ay isinasaalang-alang din sa /23/. Ang mga pagsusuri sa mga resulta ng limit theorems at goodness of fit sa discrete probabilistic scheme ng uri (0.2) ay ibinigay ni V. A. Ivanov, G. I. Ivchenko, Yu. I. Medvedev sa /8/ at G. I. Ivchenko, Yu. I. Medvedev , A.F. Ronzhin sa /14/. Ang goodness-of-fit na pamantayan para sa mga pangkalahatang layout ay isinasaalang-alang ni A.F. Ronzhin sa /38/.

Ang paghahambing ng mga katangian ng mga pagsusulit sa istatistika sa mga gawaing ito ay isinagawa mula sa punto ng view ng kamag-anak na asymptotic na kahusayan. Ang kaso ng papalapit na (contigual) hypotheses - kahusayan sa kahulugan ng Pitman at hindi converging hypotheses - kahusayan sa kahulugan ng Bahadur, Hodges - Lehman at Chernov ay isinasaalang-alang. Ang kaugnayan sa pagitan ng iba't ibang uri ng relatibong pagganap ng mga istatistikal na pagsusulit ay tinalakay, halimbawa, sa /49/. Tulad ng mga sumusunod mula sa mga resulta ng Yu. I. Medvedev sa /31/ sa pamamahagi ng mga mapaghihiwalay na istatistika sa isang polynomial scheme, ang pagsubok na batay sa istatistika ng chi-square ay may pinakamataas na asymptotic na kapangyarihan sa ilalim ng converging hypotheses sa klase ng mga mapaghihiwalay na istatistika sa ang mga frequency ng mga kinalabasan sa isang polynomial scheme. Ang resultang ito ay ginawang pangkalahatan ng A.F. Ronzhin para sa mga scheme ng uri (0.2) sa /38/. II Viktorova at VP Chistyakov sa /4/ ay nagtayo ng pinakamainam na criterion para sa isang polynomial scheme sa klase ng mga linear na function ng fir. Si A. F. Ronzhin sa /38/ ay gumawa ng isang criterion na, sa kaso ng isang pagkakasunud-sunod ng mga alternatibong hindi lumalapit sa null hypothesis, pinaliit ang logarithmic rate ng posibilidad ng isang error ng unang uri na may posibilidad na maging zero sa klase ng mga istatistika ng form. (0.6). Ang isang paghahambing ng kamag-anak na pagganap ng istatistika ng chi-square at ang maximum na ratio ng posibilidad para sa nagtatagpo at hindi nagtatagpo na mga hypotheses ay ginawa sa /54/. Sa gawaing disertasyon, isinaalang-alang ang kaso ng mga hindi lumalapit na hypotheses. Ang pag-aaral ng relatibong istatistikal na kahusayan ng mga pamantayan sa ilalim ng nonconverging hypotheses ay nangangailangan ng pag-aaral ng mga probabilidad ng superlarge deviations - ng pagkakasunud-sunod ng 0(y/n). Sa kauna-unahang pagkakataon ang gayong problema para sa isang polynomial distribution na may nakapirming bilang ng mga resulta ay nalutas ng IN Sanov sa /40/. Ang asymptotic optimality ng goodness-of-fit na pamantayan para sa pagsubok ng simple at kumplikadong mga hypotheses para sa isang polynomial distribution sa kaso ng isang may hangganang bilang ng mga resulta na may hindi lumalapit na mga alternatibo ay isinasaalang-alang sa /48/. Ang mga katangian ng distansya ng impormasyon ay dating isinasaalang-alang ng Kullback, Leibler /29/,/53/ at I. II. Sanov /40/, pati na rin ang Heffding /48/. Sa mga papel na ito, ang pagpapatuloy ng distansya ng impormasyon ay isinasaalang-alang sa may hangganan-dimensional na mga puwang sa Euclidean metric. Isinasaalang-alang din ng may-akda ang isang pagkakasunud-sunod ng mga puwang na may pagtaas ng sukat, halimbawa, sa gawain ni Yu. V. Prokhorov /37/ o sa gawain ni V. I. Bogachev, A. V. Kolesnikov /1/. Ang magaspang (hanggang sa logarithmic equivalence) theorems sa mga probabilities ng malalaking deviations ng separable statistics sa generalized allocation schemes sa ilalim ng Cramer condition ay nakuha ni A. F. Roizhin sa /38/. A. N. Timashev sa /42/,/43/ ay nakakuha ng eksaktong (hanggang sa katumbas) multidimensional integral at local limit theorems sa mga probabilidad ng malalaking deviations ng isang vector

Ang pag-aaral ng mga posibilidad ng malalaking paglihis kapag ang kondisyon ni Cramer ay hindi natugunan para sa kaso ng mga independiyenteng random na mga variable ay isinagawa sa mga gawa ng A. V. Nagaev /35/. Ang paraan ng mga pamamahagi ng conjugate ay inilarawan ni Feller /45/.

Isinaalang-alang ni G. I. Ivchenko, V. V. Levin, E. E. Timonina /10/, /15/, ang mga problema sa istatistika ng pagsubok ng mga hypotheses at pagtatantya ng mga parameter sa isang scheme ng pagpili nang walang kapalit sa isang bahagyang naiibang pagbabalangkas, kung saan nalutas ang mga problema sa pagtatantya para sa isang may hangganang populasyon, nang ang ang bilang ng mga elemento nito ay isang hindi kilalang halaga, ang asymptotic na normalidad ng multivariate S-statistics mula sa mga independiyenteng sample sa isang scheme ng pagpili nang walang kapalit ay napatunayan. Ang problema sa pag-aaral ng mga random na variable na nauugnay sa mga pag-uulit sa mga pagkakasunud-sunod ng mga independiyenteng pagsubok ay pinag-aralan ni A. M. Zubkov, V. G. Mikhailov, A. M. Shoitov sa /6/, /7/, /32/, /33/, /34/. Ang pagsusuri ng mga pangunahing problema sa istatistika ng pagtatantya at pagsubok ng mga hypotheses sa balangkas ng pangkalahatang modelo ng Markov-Poya ay isinagawa ni G. I. Ivchenko, Yu. I. Medvedev sa /13/, ang probabilistic analysis na ibinigay sa /11 /. Ang isang paraan para sa pagtukoy ng mga di-malamang na hakbang sa isang hanay ng mga pinagsama-samang bagay na hindi mababawasan sa isang pangkalahatang pamamaraan ng paglalaan (0.2) ay inilarawan sa GI Ivchenko, Yu. I. Medvedev /12/. Ang isang bilang ng mga problema sa teorya ng posibilidad, kung saan ang sagot ay maaaring makuha bilang isang resulta ng mga kalkulasyon gamit ang mga recursive formula, ay ipinahiwatig ng AM Zubkov sa /5/.

Distansya ng impormasyon at mga posibilidad ng malalaking paglihis ng mga mapaghihiwalay na istatistika

Kapag hindi nasiyahan ang kondisyon ni Cramer, ang malalaking paglihis ng mga mapaghihiwalay na istatistika sa pangkalahatang pamamaraan ng alokasyon sa itinuturing na pitong exponential na kaso ay tinutukoy ng posibilidad ng paglihis ng isang independiyenteng termino. Kapag ang kondisyon ni Cramer ay nasiyahan, ito, gaya ng binibigyang-diin sa /39/, ay hindi ang kaso. Puna 10. Ang function na φ(x) ay tulad na ang mathematical expectation na Ee (A) ay may hangganan sa 0 t 1 at infinite sa t 1. Remark 11. Para sa mga mapaghihiwalay na istatistika na hindi nakakatugon sa kondisyon ng Cramer, ang limitasyon (2.14) ay katumbas ng 0, na nagpapatunay sa bisa ng haka-haka na ipinahayag sa /39/. Puna 12. Para sa chi-square statistic sa polynomial scheme para sa n, ./V - co na - A, ito ay direktang sumusunod sa theorem na Ang resultang ito ay nakuha nang direkta sa /54/. Sa kabanatang ito, sa gitnang hanay ng mga parameter ng pangkalahatang mga scheme para sa pamamahagi ng mga particle sa mga cell, magaspang (hanggang sa logarithmic equivalence) asymptotics ng mga probabilidad ng malalaking deviations ng additively separable na istatistika mula sa cell filling at function ng bilang ng mga cell na may isang ang ibinigay na pagpuno ay natagpuan.

Kung ang kondisyon ng Cramer ay nasiyahan, kung gayon ang magaspang na asymptotics ng mga probabilidad ng malalaking paglihis ay tinutukoy ng magaspang na asymptotics ng mga probabilidad ng pagbagsak sa isang pagkakasunud-sunod ng mga puntos na may mga rational na coordinate na nagtatagpo sa kahulugan sa itaas hanggang sa punto kung saan ang extremum ng kaukulang naabot ang distansya ng impormasyon.

Ang pitong exponential na kaso ng hindi pagtupad sa kondisyon ng Cramer para sa mga random na variable na f(i),..., f(x) ay isinasaalang-alang, kung saan ang b, x ay mga independent random variable na bumubuo ng generalized partitioning scheme (0.2), Ang f(k) ay isang function sa kahulugan ng isang simetriko additively separable statistic sa (0.3). Iyon ay, ipinapalagay na ang mga function na p(k) = - lnP(i = k) at f(k) ay maaaring palawigin sa regular na iba't ibang function ng isang tuluy-tuloy na argumento ng order p 0 at q 0, ayon sa pagkakabanggit, at p q . Ito ay naka-out na ang pangunahing kontribusyon sa magaspang na asymptotics ng mga probabilities ng malaking deviations ng separable statistics sa generalised alokasyon scheme ay katulad na ginawa sa pamamagitan ng magaspang na asymptotics ng allocation probabilidad sa kaukulang sequence ng mga puntos. Ito ay kagiliw-giliw na tandaan na mas maaga ang teorama sa mga probabilidad ng malalaking paglihis para sa mga mapaghihiwalay na istatistika ay napatunayan gamit ang paraan ng saddle point, na ang pangunahing kontribusyon sa asymptotics ay ginawa ng isang solong saddle point. Ang kaso ay nanatiling hindi ginalugad kapag, kung ang kondisyon ng Cramer ay hindi nasiyahan, ang 2-kN na kondisyon ay hindi nasiyahan.

Kung ang kundisyon ni Cramer ay hindi nasiyahan, kung gayon ang ipinahiwatig na kundisyon ay maaaring hindi masiyahan lamang sa kaso ng p 1. Tulad ng sumusunod nang direkta mula sa logarithm ng kaukulang distribusyon ng probabilidad, para sa Poisson distribution at geometric distribution p=1. Mula sa resulta sa mga asymptotics ng mga probabilidad ng malalaking paglihis kapag ang kondisyon ng Cramer ay hindi nasiyahan, maaari nating tapusin na ang mga pamantayan na ang mga istatistika ay hindi nakakatugon sa kondisyon ng Cramer ay may makabuluhang mas mababang rate ng convergence sa zero ng mga probabilidad ng mga pagkakamali ng pangalawa. uri para sa isang nakapirming posibilidad ng pagkakamali ng unang uri at hindi lumalapit na mga alternatibo kumpara sa pamantayan na ang mga istatistika ay nakakatugon sa kondisyon ng Cramer. Hayaang pumili ng isang urn na naglalaman ng N - 1 1 puting un-JV 1 itim na bola nang walang kapalit hanggang sa ito ay maubos. Iugnay natin ang mga posisyon ng mga puting bola sa pagpipiliang 1 i\ ... r -i n - 1 sa pagkakasunud-sunod ng mga distansya hi,..., h sa pagitan ng mga katabing puting bola tulad ng sumusunod: Pagkatapos hv l,v =1, ... ,N,M EjLi i/ - n- Tukuyin natin ang probability distribution sa set ng mga vectors h = (hi,..., λg) sa pamamagitan ng pagtatakda ng V(hv = rv,v = l,... ,N) kung saan i,... ,lg - independent non-negative integer random variables (r.v.), ibig sabihin, isaalang-alang ang generalised allocation scheme (0.2). Ang distribusyon ng vector h ay nakasalalay sa n,N, ngunit ang kaukulang mga indeks, kung saan posible, ay aalisin para sa kadalian ng notasyon. Puna 14. Kung ang bawat isa sa (]) paraan ng pagpili ng mga bola mula sa isang urn ay itinalaga ng parehong probabilidad (\) mn para sa anumang r i,..., rg tulad na rn 1,u = l,...,N , T,v=\ru = n, ang posibilidad na ang mga distansya sa pagitan ng mga katabing puting bola sa pagpipilian ay kukuha ng mga halagang ito

Pamantayan batay sa bilang ng mga cell sa mga pangkalahatang layout

Ang layunin ng gawaing disertasyon ay upang bumuo ng goodness-of-fit na pamantayan para sa pagsubok ng mga hypotheses sa isang scheme ng pagpili nang hindi bumabalik mula sa isang urn na naglalaman ng mga bola ng 2 kulay. Nagpasya ang may-akda na pag-aralan ang mga istatistika batay sa dalas ng mga distansya sa pagitan ng mga bola ng parehong kulay. Sa pagbabalangkas na ito, ang problema ay nabawasan sa problema ng pagsubok ng mga hypotheses sa isang angkop na pangkalahatang layout.

Sa gawaing disertasyon ay - sinisiyasat ang mga katangian ng entropy at distansya ng impormasyon ng mga discrete distribution na may walang limitasyong bilang ng mga resulta na may limitadong inaasahan sa matematika; - isang magaspang (hanggang sa logarithmic equivalence) asymptotics ng mga probabilities ng malalaking deviations ng isang malawak na klase ng mga istatistika sa isang generalised allocation scheme ay nakuha; - sa batayan ng nakuha na mga resulta, ang isang criterion function na may pinakamataas na logarithmic rate ng convergence sa zero ng posibilidad ng isang error ng unang uri ay binuo para sa isang nakapirming posibilidad ng isang error ng pangalawang uri at hindi lumalapit na mga alternatibo; - Napatunayan na ang mga istatistika na hindi nakakatugon sa kondisyon ng Cramer ay may mas mababang rate ng tending to zero ng mga probabilidad ng malalaking deviations kumpara sa mga istatistika na nakakatugon sa naturang kundisyon. Ang maka-agham na pagiging bago ng akda ay ang mga sumusunod. - ang konsepto ng isang pangkalahatang sukatan ay ibinibigay - isang function na umaamin ng walang katapusang mga halaga at natutugunan ang mga axiom ng pagkakakilanlan, simetrya at hindi pagkakapantay-pantay ng tatsulok. May nakitang pangkalahatang sukatan at ipinahiwatig ang mga set kung saan ang mga function ng entropy at distansya ng impormasyon, na ibinigay sa isang pamilya ng mga discrete distribution na may mabibilang na bilang ng mga resulta, ay tuloy-tuloy sa sukatang ito; - sa pangkalahatang pamamaraan ng paglalaan, ang isang magaspang (hanggang sa logarithmic equivalence) asymptotics ay matatagpuan para sa mga probabilidad ng malalaking paglihis ng mga istatistika ng form (0.4) na nagbibigay-kasiyahan sa kaukulang anyo ng kondisyon ng Cramer; - sa pangkalahatang pamamaraan ng paglalaan, ang isang magaspang (hanggang sa logarithmic equivalence) na asymptotics ay matatagpuan para sa mga probabilidad ng malalaking paglihis ng simetriko na mapaghihiwalay na mga istatistika na hindi nakakatugon sa kondisyon ng Cramer; - sa klase ng pamantayan ng form (0.7), isang criterion na may pinakamalaking halaga ng criterion index ay binuo. Sa papel, ang isang bilang ng mga katanungan tungkol sa pag-uugali ng malalaking posibilidad ng paglihis sa mga pangkalahatang scheme ng alokasyon ay nalutas. Ang mga resulta na nakuha ay maaaring magamit sa proseso ng edukasyon sa mga espesyalidad ng matematikal na istatistika at teorya ng impormasyon, sa pag-aaral ng mga istatistikal na pamamaraan para sa pagsusuri ng mga discrete sequence at ginamit sa /3/, /21/ kapag binibigyang-katwiran ang seguridad ng isang klase ng mga sistema ng impormasyon. Gayunpaman, maraming mga katanungan ang nananatiling bukas. Nilimitahan ng may-akda ang kanyang sarili sa pagsasaalang-alang sa gitnang sona ng pagkakaiba-iba ng mga parameter n, N ng pangkalahatang kaayusan ng n mga particle sa mga selulang V. Kung ang carrier ng pamamahagi ng mga random na variable na bumubuo ng generalised allocation scheme (0.2) ay hindi isang set ng form r, r 4-1, r + 2,..., pagkatapos ay kapag pinatutunayan ang pagpapatuloy ng function ng distansya ng impormasyon at pag-aaral ng mga probabilidad ng malalaking deviations, kinakailangang isaalang-alang ang arithmetic structure ng naturang carrier, na hindi isinasaalang-alang sa gawa ng may-akda. Para sa praktikal na aplikasyon ng mga pamantayan na binuo batay sa iminungkahing function na may pinakamataas na halaga ng index, kinakailangan na pag-aralan ang pamamahagi nito kapwa sa ilalim ng null hypothesis at sa ilalim ng mga alternatibo, kabilang ang mga converging. Interesado rin na ilipat ang mga binuong pamamaraan at gawing pangkalahatan ang mga nakuhang resulta sa ibang probabilistikong mga iskema maliban sa mga pangkalahatang iskema ng alokasyon. Kung ang //1,/ 2,-.. ay ang mga frequency ng mga distansya sa pagitan ng mga numero ng kinalabasan 0 sa binomial scheme na may mga probabilidad ng mga resulta рї 1 -POj, kung gayon maipapakita na sa kasong ito ay napatunayan sa /26 /, sumusunod na ang pamamahagi (3.3), sa pangkalahatan, ay hindi maaaring katawanin sa pangkalahatang kaso bilang isang pinagsamang pamamahagi ng mga halaga ng z sa anumang pangkalahatang pamamaraan para sa paglalagay ng mga particle sa mga cell. Ang distribusyon na ito ay isang espesyal na kaso ng mga distribusyon sa hanay ng mga combinatorial object na ipinakilala sa /12/. Tila isang kagyat na gawain na ilipat ang mga resulta ng gawaing disertasyon para sa mga pangkalahatang layout sa kasong ito, na tinalakay sa /52/.

asymptotically pinakamainam

- isang konsepto na iginigiit ang pagiging walang kinikilingan ng pagtatantya sa limitasyon. Hayaan ay isang sequence ng mga random na variable sa isang probability space, kung saan ang Pm ay isa sa mga sukat ng pamilya...
Mathematical Encyclopedia
- isang konsepto na iginigiit ang pagiging walang kinikilingan ng criterion sa limitasyon ...
Mathematical Encyclopedia
- isang solusyon ng isang differential system na matatag sa kahulugan ng Lyapunov at umaakit sa lahat ng iba pang mga solusyon na may sapat na malapit na mga paunang halaga ...
Mathematical Encyclopedia
- isang konsepto na nagpapalawak ng ideya ng mahusay na pagtatantya sa kaso ng malalaking sample. Hindi malabo na kahulugan ng A. e. O. ay wala. Halimbawa, sa klasikal variant na pinag-uusapan natin ang tungkol sa asymptotic ...
Mathematical Encyclopedia
- kanais-nais, kapaki-pakinabang ...
Sanggunian komersyal na diksyunaryo
- 1. ang pinakamahusay, ang pinaka-kanais-nais, ang pinaka-angkop para sa ilang mga kundisyon at mga gawain 2 ...
Malaking Economic Dictionary
- ang pinaka-kanais-nais, ang pinakamahusay na posible ...
Great Soviet Encyclopedia
- ang pinakamahusay, pinakaangkop para sa ilang mga kundisyon at gawain ...
Modern Encyclopedia
- ang pinakamahusay, pinakaangkop para sa ilang mga kundisyon at gawain ...
Malaking encyclopedic dictionary
- ...
- ...
Spelling Dictionary
- ...
Spelling Dictionary
- ...
Spelling Dictionary
- ...
Spelling Dictionary
- ...
Spelling Dictionary
- ...
Spelling Dictionary

"asymptotically optimal" sa mga libro

Pinakamainam na Visual Contrast (OVC)

Mula sa aklat na Color and Contrast. Teknolohiya at malikhaing pagpili may-akda Zheleznyakov Valentin Nikolaevich

Optimal Visual Contrast (HVAC) Isipin ang isang itim na suit na naiilawan ng araw at isang puting kamiseta na naiilawan ng buwan. Kung susukatin natin ang kanilang ningning gamit ang isang instrumento, lumalabas na sa ilalim ng mga kundisyong ito ang isang itim na suit ay maraming beses na mas maliwanag kaysa sa isang puting kamiseta, ngunit alam natin iyon

Ano ang pinakamainam na sukat?

Mula sa aklat na Twitonomics. Lahat ng kailangan mong malaman tungkol sa ekonomiya, maikli at to the point may-akda Compton Nick

Ano ang pinakamainam na sukat? Ang may-akda ng konsepto ng pinakamainam na sukat ay ang pilosopong Aleman-British na si Fritz Schumacher, may-akda ng aklat na "Less is better: the economy as a human being." Binanggit niya ang katotohanan na ang kapitalistang ugali patungo sa "gigantismo" ay hindi lamang.

8.4.2. Pinakamainam na landas ng paglago

Mula sa aklat na Economic Theory: Textbook may-akda Makhovikova Galina Afanasievna

8.4.2. Optimal Growth Path Ipagpalagay na ang mga presyo ng mapagkukunan ay nananatiling pare-pareho habang ang badyet ng kumpanya ay patuloy na lumalaki. Sa pamamagitan ng pagkonekta sa mga punto ng contact ng isoquants na may isocosts, nakukuha namin ang linyang 0G - ang "landas ng pag-unlad" (ang landas ng paglago). Ipinapakita ng linyang ito ang rate ng paglago ng ratio

Ang pinakamahusay na pagpipilian

Mula sa aklat ng USSR: mula sa pagkawasak hanggang sa kapangyarihan ng mundo. Ang tagumpay ng Sobyet may-akda Boff Giuseppe

Pinakamainam na opsyon Sa apoy ng mga labanan noong 1928, ang unang limang taong plano ay isinilang. Simula noong 1926, sunod-sunod na inihanda ang iba't ibang draft na plano sa dalawang institusyon, ang State Planning Commission at ang Supreme Economic Council. Ang kanilang pag-unlad ay sinamahan ng patuloy na talakayan. Bilang isang scheme

Pinakamahusay na OPTION

Mula sa librong Russian rock. Maliit na encyclopedia may-akda Bushueva Svetlana

Pinakamainam

Mula sa aklat na Great Soviet Encyclopedia (OP) ng may-akda TSB

Pinakamainam na Order

Mula sa CSS3 Book para sa mga Web Designer ni Siderholm Dan

Pinakamainam na pagkakasunud-sunod Kapag gumagamit ng mga prefix ng browser, mahalagang tandaan ang pagkakasunud-sunod kung saan nakalista ang mga katangian. Maaari mong mapansin na sa nakaraang halimbawa, ang mga katangian ng prefix ay unang nakasulat, na sinusundan ng hindi na-prefix na katangian.

Ang tao ay pinakamainam

Mula sa aklat na Computerra Magazine No. 40 na may petsang Oktubre 31, 2006 may-akda Computerra magazine

Pinakamainam na Tao May-akda: Vladimir GurievAng ilang mga paksa na sikat mga apatnapung taon na ang nakalilipas, ngayon ay tila napaka marginal na halos hindi na pinag-uusapan nang seryoso. Kasabay nito - sa paghusga sa tono ng mga artikulo sa mga sikat na magasin - tila may kaugnayan sila at kahit na

Ang pinakamahusay na pagpipilian

Mula sa aklat na Stalin's First Strike 1941 [Collection] ang may-akda Kremlev Sergey

Pinakamainam na variant Ang pagsusuri ng mga posibleng sitwasyon para sa pagbuo ng mga kaganapan ay hindi maiiwasang pinipilit ang isa na mag-isip tungkol sa pagpili ng pinakamainam na variant. Hindi masasabi na ang iba't ibang mga pagpipilian sa "tag-init", iyon ay, ang mga alternatibong nakatali sa Mayo-Hunyo - Hulyo 1941, ay nagbibigay inspirasyon sa optimismo. Hindi sila

Ang pinakamahusay na pagpipilian

Mula sa aklat na Great Patriotic Alternative may-akda Isaev Alexey Valerievich

Pinakamainam na variant Ang pagsusuri ng mga posibleng sitwasyon para sa pagbuo ng mga kaganapan ay hindi maiiwasang pinipilit ang isa na mag-isip tungkol sa pagpili ng pinakamainam na variant. Hindi masasabi na ang iba't ibang mga pagpipilian sa "tag-init", i.e., mga alternatibong nakatali sa Mayo - Hunyo - Hulyo 1941, ay nagbibigay inspirasyon sa optimismo. Hindi sila

Pinakamainam na kontrol

Mula sa aklat na Pagpapahalaga sa Sarili sa mga bata at kabataan. Libro para sa mga magulang ang may-akda Eyestad Guru

Pinakamainam na kontrol Ano ang ibig sabihin ng katamtamang paghawak? Dapat mong matukoy ito sa iyong sarili, batay sa kaalaman ng iyong sariling anak at sa mga kondisyon ng kapaligiran kung saan ka nakatira. Sa karamihan ng mga kaso, sinisikap ng mga magulang ng mga tinedyer na protektahan ang kanilang mga anak mula sa paninigarilyo, pag-inom ng alak,

Pinakamainam na paraan

Mula sa aklat na The Perfectionist Paradox may-akda Ben-Shahar Tal

Patuloy tayong inaatake ng Optimal Path Perfection. Ang pabalat ng Men's Health ay pinalamutian ni Adonis, ang pabalat ng Vogue ni Elena Prekrasnaya; babae at lalaki sa malawak na screen sa loob ng isa o dalawang oras ayusin ang kanilang mga salungatan, i-play ang perpektong plot, sumuko sa perpektong pag-ibig. Narinig naming lahat

Pinakamainam na Diskarte

Mula sa aklat na Expert No. 07 (2013) may-akda Expert Magazine

Pinakamainam na Diskarte Sergey Kostyaev, Ph.D.

Ang pinakamahusay na pagpipilian

Mula sa aklat na Two Seasons may-akda Arseniev L

Ang pinakamagandang opsyon - Sabihin mo sa akin, makatwiran bang maglaro sa maraming larangan nang sabay-sabay? - tinanong ng mga mamamahayag sina Bazilevich at Lobanovsky sa pinakadulo simula ng panahon ng 75. - Hindi makatwiran, siyempre, - sagot nila. - Ngunit ito ay kinakailangan. Naniniwala kami na kailangang pag-iba-ibahin ang kahalagahan

Pinakamainam na kontrol

Mula sa aklat na Personal (Family) Finance Management. Diskarte sa mga sistema may-akda Steinbock Mikhail

Pinakamainam na kontrol >> Sa pinakamainam na kontrol, hinahati namin ang lahat ng mga gastos sa dalawang malalaking grupo: - "normal" - mga regular na gastos, - isa-beses o hindi karaniwang mga gastos. Magagamit lamang ang pinakamainam na kontrol pagkatapos ng ilang buwan ng detalyadong kontrol.