Critères de sélection asymptotiques. asymptotiquement optimale. Distance d'information et probabilités de grands écarts de statistiques séparables

Dans les conditions modernes, l'intérêt pour l'analyse des données augmente constamment et intensément dans des domaines complètement différents, tels que la biologie, la linguistique, l'économie et, bien sûr, l'informatique. La base de cette analyse repose sur les méthodes statistiques, et tout spécialiste du data mining qui se respecte doit les comprendre.

Malheureusement, la littérature de très bonne qualité, capable de fournir à la fois des preuves mathématiquement rigoureuses et des explications intuitives compréhensibles, n’est pas très courante. Et ces conférences, à mon avis, sont particulièrement utiles pour les mathématiciens qui comprennent la théorie des probabilités précisément pour cette raison. Ils sont enseignés en master à l'Université allemande Christian-Albrecht dans les programmes « Mathématiques » et « Mathématiques financières ». Et pour ceux qui s'intéressent à la manière dont cette matière est enseignée à l'étranger, j'ai traduit ces conférences. Il m'a fallu plusieurs mois pour traduire, j'ai dilué les cours avec des illustrations, des exercices et des notes de bas de page pour certains théorèmes. Je précise que je ne suis pas un traducteur professionnel, mais juste un altruiste et amateur dans ce domaine, j'accepterai donc toute critique si elle est constructive.

En bref, les cours portent sur :


Attente conditionnelle

Ce chapitre ne traite pas directement des statistiques, mais il constitue un point de départ idéal pour les étudier. L’espérance conditionnelle est le meilleur choix pour prédire un résultat aléatoire sur la base des informations dont vous disposez déjà. Et c'est aussi aléatoire. Ici, ses différentes propriétés sont prises en compte, telles que la linéarité, la monotonie, la convergence monotone, etc.

Bases de l'estimation de points

Comment évaluer le paramètre de distribution ? Quel est le critère pour cela ? Quelles méthodes faut-il utiliser pour cela ? Ce chapitre vous permet de répondre à toutes ces questions. Ici, les concepts d'estimateur sans biais et d'estimateur uniformément sans biais avec variance minimale sont introduits. Explique d'où proviennent la distribution du chi carré et la distribution de Student et pourquoi elles sont importantes pour estimer les paramètres d'une distribution normale. On explique ce que sont l'inégalité de Rao-Kramer et les informations de Fisher. Le concept de famille exponentielle est également introduit, ce qui facilite grandement l'obtention d'une bonne estimation.

Estimation des paramètres bayésiens et minimax

Une approche philosophique différente de l’évaluation est décrite ici. Dans ce cas, le paramètre est considéré comme inconnu car il s’agit d’une réalisation d’une variable aléatoire avec une distribution connue (a priori). En observant le résultat de l'expérience, nous calculons la distribution dite postérieure du paramètre. Sur cette base, nous pouvons obtenir une estimation bayésienne, où le critère est la perte minimale en moyenne, ou une estimation minimax, qui minimise la perte maximale possible.

Suffisance et exhaustivité

Ce chapitre est d’une grande importance pratique. Une statistique suffisante est fonction de l'échantillon, de sorte qu'il suffit de stocker uniquement le résultat de cette fonction pour estimer le paramètre. Il existe de nombreuses fonctions de ce type, parmi lesquelles figurent les statistiques dites minimales suffisantes. Par exemple, pour estimer la médiane d'une distribution normale, il suffit de stocker un seul nombre : la moyenne arithmétique sur l'ensemble de l'échantillon. Cela fonctionne-t-il également pour d'autres distributions, comme la distribution Cauchy ? Comment des statistiques suffisantes aident-elles à choisir des estimations ? Ici vous pouvez trouver des réponses à ces questions.

Propriétés asymptotiques des estimations

La propriété la plus importante et la plus nécessaire d'une estimation est peut-être sa cohérence, c'est-à-dire la tendance vers le paramètre réel avec une augmentation de la taille de l'échantillon. Ce chapitre décrit les propriétés des estimations connues, obtenues par les méthodes statistiques décrites dans les chapitres précédents. Les concepts d'impartialité asymptotique, d'efficacité asymptotique et de distance de Kullback-Leibler sont introduits.

Bases des tests

En plus de la question de savoir comment évaluer un paramètre qui nous est inconnu, il faut en quelque sorte vérifier s'il satisfait aux propriétés requises. Par exemple, une expérience est en cours dans laquelle un nouveau médicament est testé. Comment savoir si vous avez plus de chances de vous rétablir qu'avec des médicaments plus anciens ? Ce chapitre explique comment de tels tests sont construits. Vous apprendrez quel est le test uniformément le plus puissant, le test de Neyman-Pearson, le niveau de signification, l'intervalle de confiance, et également d'où viennent le fameux test gaussien et le test t.

Propriétés asymptotiques des critères

Comme les estimations, les critères doivent satisfaire à certaines propriétés asymptotiques. Parfois, des situations peuvent survenir lorsqu'il est impossible de construire le critère requis, cependant, en utilisant le théorème central limite bien connu, nous construisons un critère qui tend asymptotiquement vers le critère nécessaire. Ici, vous apprendrez quel est le niveau de signification asymptotique, la méthode du rapport de vraisemblance et comment le test de Bartlett et le test d'indépendance du chi carré sont construits.

Modèle linéaire

Ce chapitre peut être considéré comme un complément, à savoir l'application des statistiques dans le cas de la régression linéaire. Vous comprendrez quelles notes sont bonnes et dans quelles conditions. Vous apprendrez d'où vient la méthode des moindres carrés, comment construire des critères et pourquoi vous avez besoin d'une distribution F.

Il existe un système de notations pour décrire les estimations asymptotiques :

§ On dit que f(n)= Ô(g(n)) s'il existe une constante c>0 et un nombre n0 tel que la condition 0≤f(n)≤c*g(n) est satisfaite pour tout n≥n0. Plus formellement:

(()) { () | 0, } 0 0 O g n= fn$c> $n"n> n£ fn£ cg m

Ô(g(n)) est utilisé pour indiquer des fonctions qui ne sont pas plus d'un nombre constant de fois supérieur à g(n), cette variante est utilisée pour décrire des limites supérieures (dans le sens de « pas pire que »). Lorsqu'il s'agit d'un algorithme spécifique pour résoudre un problème spécifique, l'objectif de l'analyse de la complexité temporelle de cet algorithme est d'obtenir une estimation du pire temps ou du temps moyen, généralement une estimation supérieure asymptotique. Ô(g(n)), et, si possible, une borne inférieure asymptotique W(g(n)), et encore mieux, une borne asymptotiquement exacte Q(g(n)).

Mais en même temps, la question demeure : peut-il exister des algorithmes de solution encore meilleurs pour ce problème ? Cette question pose le problème de trouver une estimation inférieure de la complexité temporelle pour le problème lui-même (pour tous les algorithmes possibles pour le résoudre, et non pour un des algorithmes connus pour le résoudre). Le problème de l’obtention de limites inférieures non triviales est très compliqué. À ce jour, il n’existe pas beaucoup de résultats de ce type, mais des limites inférieures non triviales ont été prouvées pour certains modèles limités de calculatrices, et certains d’entre eux jouent un rôle important dans la programmation pratique. L'un des problèmes pour lesquels une limite inférieure de complexité temporelle est connue est le problème de tri :

§ Étant donné une séquence de n éléments a1,a2,... an choisis dans un ensemble sur lequel un ordre linéaire est donné.

§ Il est nécessaire de trouver une permutation p de ces n éléments qui mappe la séquence donnée en une séquence non décroissante ap(1),ap(2),... ap(n), c'est-à-dire ap(i)≤ap(i+1) pour 1≤i méthode de réduction . Supposons que nous ayons deux problèmes A et B, qui sont connectés de sorte que le problème A puisse être résolu comme suit :

1) Les données d'entrée pour la tâche A sont converties en entrée correspondante

données pour la tâche B.

2) Le problème B est résolu.

3) Le résultat de la solution du problème B est transformé en la solution correcte du problème A .__ Dans ce cas, on dit que tâche UN réduit au problème B. Si les étapes (1) et (3) des informations ci-dessus peuvent être complétées à temps Ô(t(n)), où, comme d’habitude, n – 25 est le « volume » du problème A , alors on dit que A t (n)-réductible à B, et écrivez-le ainsi : A μt (n) B. D'une manière générale, la réductibilité n'est pas une relation symétrique : dans le cas particulier où A et B sont mutuellement réductibles, nous les appellerons équivalents. Les deux évidences suivantes caractérisent la puissance de la méthode de réduction en supposant que cette réduction préserve l'ordre du « volume » du problème.

"Ô" grand Et "o" petit( et ) sont des notations mathématiques permettant de comparer le comportement asymptotique des fonctions. Ils sont utilisés dans diverses branches des mathématiques, mais le plus activement - dans l'analyse mathématique, la théorie des nombres et la combinatoire, ainsi qu'en informatique et en théorie des algorithmes.

, « Ô petit de " signifie "infiniment petit par rapport à" [ , négligeable lorsqu'on le considère. La signification du terme "Big O" dépend de son domaine d'application, mais ne croît toujours pas plus vite que " Ô grand de " (les définitions exactes sont données ci-dessous).

En particulier:

Suite 7

l'expression « la complexité de l'algorithme est » signifie qu'avec une augmentation du paramètre caractérisant la quantité d'informations d'entrée de l'algorithme, le temps d'exécution de l'algorithme ne peut pas être limité par une valeur qui croît plus lentement que n!;

l'expression "la fonction est" o "petite de la fonction au voisinage du point" signifie qu'à mesure que k s'approche, elle diminue plus vite que (le rapport tend vers zéro).

Règle de somme: Soit un ensemble fini M divisé en deux sous-ensembles non sécants M 1 et M 2 (dans l'union de ceux donnant l'ensemble M entier). Alors la cardinalité |M| = |M1 | + |M2|.

Règle du produit: Supposons que dans un ensemble, l'objet a puisse être choisi de n manières, et après cela (c'est-à-dire après avoir choisi l'objet a) l'objet b peut être choisi de m manières. Ensuite, l'objet ab peut être choisi de n*m ​​manières.

Commentaire: Les deux règles permettent une généralisation inductive. Si un ensemble fini M admet une partition en r sous-ensembles disjoints deux à deux M 1 , M 2 ,…,M r , alors la cardinalité de |M| = |M 1 |+|M 2 |+…+|M r |. Si l'objet A 1 peut être choisi de k 1 manières, alors (après que l'objet A 1 a été choisi) l'objet A 2 peut être choisi de k 2 manières, et ainsi de suite et enfin, l'objet AR peut être choisi de kr façons, alors l'objet A 1 A 2 ... Et r peut être choisi de k 1 k 2 …k r façons.

480 roubles. | 150 UAH | 7,5 $", MOUSEOFF, FGCOLOR, "#FFFFCC",BGCOLOR, "#393939");" onMouseOut="return nd();"> Thèse - 480 roubles, frais de port 10 minutes 24h/24, 7j/7 et jours fériés

Kolodzei Alexandre Vladimirovitch Propriétés asymptotiques des critères d'adéquation pour tester des hypothèses dans un schéma de sélection sans remplacement, basé sur le remplissage de cellules dans un schéma d'attribution généralisé : mémoire... candidat en sciences physiques et mathématiques : 01.01.05.- Moscou, 2006 .- 110 p. : ill. RSL OD, 61 07-1/496

Introduction

1 Entropie et distance d'information 36

1.1 Définitions et symboles de base 36

1.2 Entropie des distributions discrètes à espérance limitée 39

1.3 Métrique logarithmique généralisée sur un ensemble de distributions discrètes 43

1.4 Compacité des fonctions d'un ensemble dénombrable d'arguments. 46

1.5 Continuité de la distance d'information Kullback-Leibler-Sanov 49

1.6 Conclusions 67

2 Probabilités de déviation importante 68

2.1 Probabilités de grands écarts de fonctions par rapport au nombre de cellules avec un remplissage donné 68

2.1.1 Théorème limite locale 68

2.1.2 Théorème limite intégral 70

2.1.3 Distance d'information et probabilités de grands écarts des statistiques séparables 75

2.2 Probabilités de grand écart des statistiques séparables qui ne satisfont pas à la condition de Cramer 81

2.3 Conclusions 90

3 Propriétés asymptotiques des critères d'adéquation 92

3.1 Critères d'acceptation du système de sélection sans retour. 92

3.2 Efficacité relative asymptotique des tests d'ajustement 94

3.3 Critères basés sur le nombre de cellules dans les schémas généralisés 95

3.4 Conclusions 98

Conclusion 99

Littérature 103

Introduction au travail

L'objet de la recherche et la pertinence du sujet. Dans la théorie de l'analyse statistique des séquences discrètes, une place particulière est occupée par les critères de qualité d'ajustement pour tester l'hypothèse nulle éventuellement complexe, qui est celle d'une séquence aléatoire pQ)?=i telle que

Хі Є Ім,і= 1,...,n, Ім = (o, i,..., M), pour tout і = 1,..., n, et pour tout k Є їм la probabilité du l’événement (Хі = k) ne dépend pas de r. Cela signifie que la séquence (Xi)f = 1 est en quelque sorte stationnaire.

Dans un certain nombre de problèmes appliqués, sous la forme d'une séquence (Х() =1, la séquence de couleurs des boules est considérée lors du choix sans retour à l'épuisement de l'urne contenant rik - 1 > 0 boules de couleur k, k 1, .. .,pd/ - 1) Que l'urne contienne n - 1 boules, m n-l= (n fc -l).

Notons r(k) _ r(fc) r(fc) la séquence de nombres de boules de couleur k dans l'échantillon. Considérons la séquence h" = (^,...,)). M fc) =ri fc) , ^ = ^-^ = 2,...,^-1, _ (fc)

La séquence h^ est définie au moyen des distances entre les emplacements des boules adjacentes de couleur k de telle sorte que *Ф = n.

L'ensemble des séquences h(fc) pour tout k Є їm détermine de manière unique la séquence la séquence des couleurs des boules est déterminée de manière unique par la séquence h() des distances entre les emplacements des boules voisines de même couleur fixe. Laissez une urne contenant n - 1 boules de deux couleurs différentes contiennent N - 1 boules de couleur 0. On peut établir une correspondance bijective entre l'ensemble M(N-l,n - N) et un ensemble de 9 \ Nі m vecteurs h( n, N) = (hi,..., /i#) avec des composantes entières positives telles que

L'ensemble 9\n,m correspond à l'ensemble de toutes les partitions distinctes d'un entier positif n en N sommes ordonnées.

Ayant donné une distribution de probabilité sur l'ensemble des vecteurs 9H n g, nous obtenons la distribution de probabilité correspondante sur l'ensemble Wl(N - l,n - N). L'ensemble Y\n,s est un sous-ensemble de l'ensemble 2J n ,iv de vecteurs à composantes entières non négatives satisfaisant (0.1). Comme distributions de probabilité sur l'ensemble des vecteurs JZ p d dans le travail de thèse, les distributions de la forme

P(x, N) = (r t..., r N)) = P(& = rn, u = 1,..., N\ & = n), (0.2) où 6 > , n - indépendant variables aléatoires entières non négatives.

Les distributions de la forme (0,2) dans /24/ étaient appelées schémas généralisés pour placer n particules dans N cellules. En particulier, si les variables aléatoires h..., n dans (0.2) sont distribuées selon les lois de Poisson avec respectivement les paramètres Ai,...,Alg, alors le vecteur h(n,N) a une distribution polynomiale avec les probabilités de résultats

Pu = m--~t~\u003e ^ = 1,---, ^-

Li + ... + l^

Si les variables aléatoires i> >&v dans (0.2) sont également distribuées selon la loi géométrique V(Zi = k)= P k - 1 (l-p),k=l,2,..., où p est n'importe lequel dans l'intervalle 0

Comme indiqué dans /14/,/38/, une place particulière dans le test des hypothèses sur la distribution des vecteurs de fréquence h(n, N) = (hi,..., h^) dans les schémas généralisés pour placer n particules dans N cellules est occupé par des critères construits à partir de statistiques de la forme

Фк "%,%..;$, (0.4) où /j/, v = 1,2,... et φ sont des fonctions à valeur réelle,

Mg = E 1 (K = g), g = 0,1, .... 1 / = 1

Les quantités //r dans /27/ étaient appelées le nombre de cellules contenant exactement r particules.

Les statistiques de la forme (0,3) dans /30/ sont appelées statistiques séparables (séparables de manière additive). Si les fonctions /„ dans (0.3) ne dépendent pas de u, alors de telles statistiques ont été appelées dans /31/ statistiques séparables symétriques.

Pour tout r, la statistique fx r est une statistique séparable symétrique. De l'égalité

DM = DFg (0,5), il s'ensuit que la classe des statistiques séparables symétriques dans h u coïncide avec la classe des fonctions linéaires dans fi r . De plus, la classe des fonctions de la forme (0,4) est plus large que la classe des statistiques séparables symétriques.

H 0 = (R0(n, L0) est une séquence d'hypothèses nulles simples selon lesquelles la distribution du vecteur h(n, N) est (0,2), où les variables aléatoires i,..., n et (0,2) sont identiquement distribués et P(ti = k)=p k ,k = 0,l,2,..., les paramètres n, N changent dans la région centrale.

Considérons certains РЄ (0,1) et une séquence d'alternatives complexes, d'une manière générale, n = (H(n,N)) telles qu'il existe un n

P(Fm > OpAR)) > : 0-On rejettera l'hypothèse Hq(ti,N) si fm > a w m((3). S'il existe une limite jim ~1nP(0lg > a n, N (P)) = Sh ), où la probabilité pour chaque N est calculée sous l'hypothèse #o(n,iV), alors la valeur j (fi,lcl) est appelée dans /38/ l'indice critère φ au point (/?,Н) . La dernière limite peut, d’une manière générale, ne pas exister. Ainsi, dans le travail de thèse, en plus de l'indice critère, on considère la valeur lim (_IlnP(tor > a N (J3))) =іф(Р,П) qui, par analogie, a été appelée par l'auteur de la thèse travaille l'indice inférieur du critère f au point (/3,Н) . Ici et ci-dessous, lim adg, lim a# jV-yuo LG-yuo signifient respectivement les limites inférieure et supérieure de la séquence (odr) comme N -> syu,

Si un index de critère existe, alors l'indice du critère lui correspond. L'indice du critère existe toujours. Plus la valeur de l'indice du critère est grande (indice inférieur du critère), meilleur est le critère statistique au sens considéré. Dans /38/, le problème de la construction de critères d'adéquation pour les schémas d'allocation généralisés avec la valeur la plus élevée de l'indice de critère dans la classe de critères a été résolu, ce qui rejette l'hypothèse Ho(n,N) pour laquelle m > 0 est un nombre fixe, la séquence de constantes, par exemple, est sélectionnée en fonction des valeurs de puissance données du critère pour une séquence d'alternatives, ft - fonction réelle de m + 1 arguments.

Les indices critères sont déterminés par les probabilités de grands écarts. Comme cela a été montré dans /38/, l'asymptotique grossière (jusqu'à l'équivalence logarithmique) des probabilités de grands écarts de statistiques séparables lorsque la condition de Cramer pour la variable aléatoire /() est satisfaite est déterminée par l'information Kullback-Leibler-Sanov correspondante. distance (la variable aléatoire μ satisfait la condition de Cramer , si pour certains # > 0 la fonction génératrice de moment Me f7? est finie dans l'intervalle \t\

La question des probabilités de grands écarts de statistiques par rapport à un nombre illimité fi r , ainsi que des statistiques arbitrairement séparables qui ne satisfont pas à la condition de Cramer, sont restées ouvertes. Cela n'a pas permis de résoudre définitivement le problème de la construction de critères de test d'hypothèses dans les schémas d'allocation généralisés avec le taux de convergence vers zéro le plus élevé pour la probabilité d'erreur de première espèce dans le cas d'alternatives convergentes dans la classe de critères basé sur des statistiques de la forme (0,4). La pertinence de la recherche de thèse est déterminée par la nécessité de compléter la solution de ce problème.

L'objectif du travail de thèse est de construire des critères d'adéquation avec la valeur la plus élevée de l'indice du critère (indice inférieur du critère) pour tester les hypothèses dans le schéma de sélection sans rentrer dans la classe des critères qui rejettent l'hypothèse W( n, N) à 0(iv"iv"-""" o """)>CiV "(0" 7) où φ est fonction d'un nombre dénombrable d'arguments, et les paramètres n, N changent dans le centre région.

Conformément à l'objectif de l'étude, les tâches suivantes ont été définies : étudier les propriétés d'entropie et de distance informationnelle de Kullback - Leibler - Sanov pour des distributions discrètes avec un nombre dénombrable de résultats ; étudier les probabilités de grands écarts de statistiques de la forme (0,4) ; étudier les probabilités de grands écarts de statistiques séparables symétriques (0,3) qui ne satisfont pas à la condition de Cramer ; - trouver une statistique telle que le critère d'accord construit sur sa base pour tester des hypothèses dans les schémas d'allocation généralisés ait la plus grande valeur d'indice dans la classe de critères de la forme (0,7).

Nouveauté scientifique : le concept de métrique généralisée est donné - une fonction qui admet des valeurs infinies et satisfait les axiomes d'identité, de symétrie et d'inégalité triangulaire. Une métrique généralisée est trouvée et des ensembles sont indiqués sur lesquels les fonctions d'entropie et de distance d'information, données sur une famille de distributions discrètes avec un nombre dénombrable de résultats, sont continues dans cette métrique ; dans le schéma d'allocation généralisé, une asymptotique grossière (jusqu'à l'équivalence logarithmique) est trouvée pour les probabilités de grands écarts statistiques de la forme (0,4) satisfaisant la forme correspondante de la condition de Cramer ; dans le schéma d'allocation généralisé, une asymptotique grossière (jusqu'à l'équivalence logarithmique) est trouvée pour les probabilités de grands écarts de statistiques séparables symétriques qui ne satisfont pas à la condition de Cramer ; dans la classe de critères de la forme (0,7), un critère avec la plus grande valeur de l'indice de critère est construit.

Valeur scientifique et pratique. Dans cet article, un certain nombre de questions sur le comportement des probabilités de déviation importante dans les schémas d'allocation généralisés sont résolues. Les résultats obtenus peuvent être utilisés dans le processus pédagogique dans les spécialités de statistiques mathématiques et de théorie de l'information, dans l'étude des procédures statistiques pour l'analyse de séquences discrètes et ont été utilisés dans /3/, /21/ pour justifier la sécurité d'une classe des systèmes d’information. Propositions à défendre : réduction du problème de vérification, à l'aide d'une seule séquence de couleurs de boules, l'hypothèse que cette séquence a été obtenue à la suite d'un choix sans remplacement jusqu'à l'épuisement des boules de l'urne contenant des boules de deux couleurs, et chacun de ces choix a la même probabilité de construire des critères d'adéquation pour tester des hypothèses dans la disposition généralisée correspondante ; continuité des fonctions d'entropie et de distance d'information de Kullback-Leibler-Sanov sur un simplexe de dimension infinie avec la métrique logarithmique généralisée introduite ; un théorème sur les asymptotiques grossières (jusqu'à l'équivalence logarithmique) des probabilités de grands écarts de statistiques séparables symétriques qui ne satisfont pas la condition de Cramer dans le schéma d'allocation généralisé dans le cas des sept exionentiels ; un théorème sur les asymptotiques grossières (jusqu'à l'équivalence logarithmique) des probabilités de grands écarts pour les statistiques de la forme (0,4) ; - construction d'un critère d'accord pour tester des hypothèses dans des schémas d'allocation généralisés avec la plus grande valeur d'indice dans la classe de critères de la forme (0,7).

Approbation des travaux. Les résultats ont été présentés lors des séminaires du Département de mathématiques discrètes de l'Institut mathématique. V. A. Steklov RAS, Département de la sécurité de l'information ITMiVT eux. S. A. Lebedev RAS et à : le cinquième Symposium panrusse sur les mathématiques appliquées et industrielles. Session de printemps, Kislovodsk, du 2 au 8 mai 2004 ; la sixième conférence internationale de Petrozavodsk « Méthodes probabilistes en mathématiques discrètes » du 10 au 16 juin 2004 ; la deuxième conférence internationale "Systèmes et technologies d'information (IST" 2004)", Minsk, 8 - 10 novembre 2004 ;

Conférence internationale "Modern Problems and new Trends in Probability Theory", Chernivtsi, Ukraine, 19 - 26 juin 2005.

Les principaux résultats des travaux ont été utilisés dans le travail de recherche "Apologia", réalisé par ITMiVT RAS. S. A. Lebedev dans l'intérêt du Service fédéral de contrôle technique et des exportations de la Fédération de Russie, et ont été inclus dans le rapport sur la mise en œuvre de la phase de recherche /21/. Des résultats distincts de la thèse ont été inclus dans le rapport de recherche "Développement des problèmes mathématiques de cryptographie" de l'Académie de cryptographie de la Fédération de Russie pour 2004 /22/.

L'auteur exprime sa profonde gratitude au conseiller scientifique, docteur en sciences physiques et mathématiques Ronzhin A.F. et au consultant scientifique, docteur en sciences physiques et mathématiques, chercheur principal Knyazev A.V. Sciences mathématiques I. A. Kruglov pour l'attention portée au travail et un certain nombre de précieux remarques.

Structure et contenu de l'œuvre.

Le premier chapitre étudie les propriétés de l'entropie et de la distance d'information pour les distributions sur l'ensemble des entiers non négatifs.

Dans le premier paragraphe du premier chapitre, la notation est introduite et les définitions nécessaires sont données. En particulier, la notation suivante est utilisée : x = (:ro,i, ---) est un vecteur de dimension infinie avec un nombre dénombrable de composantes ;

H(x) - -Ex^oXvlnx,; tronc m (x) = (x 0 ,x 1 ,...,x t,0,0,...); SI* = (x, x u > 0, u = 0,1,..., E~ o xn 0,v = 0,l,...,E? =Q x v = 1); fi 7 \u003d (x Є O, L 0 vx v \u003d 7); %] = (хЄП, Ео»х et

16 mі = eo ** v \ &c = Ue>1 | 5 є Q 7) o

Il est clair que l'ensemble Vt correspond à la famille des distributions de probabilité sur l'ensemble des entiers non négatifs, P 7 - à la famille des distributions de probabilité sur l'ensemble des entiers non négatifs avec espérance mathématique

Оє(у) - (х eO,x v

Dans le deuxième paragraphe du premier chapitre, nous prouvons un théorème sur le caractère limité de l'entropie des distributions discrètes avec une espérance mathématique limitée.

Théorème 1. Sur le caractère limité de l'entropie des distributions discrètes avec une espérance mathématique bornée. Pour tout wbp 7

Si x Є fi 7 correspond à une distribution géométrique avec prédiction mathématique 7 ; c'est

7xn = (1-p)p\ v = 0,1,..., où p = --,

1 + 7 alors l’égalité H(x) = F(1) est vraie.

L'affirmation du théorème peut être considérée comme le résultat d'une application formelle de la méthode des multiplicateurs de Lagrange conditionnels dans le cas d'un nombre infini de variables. Le théorème selon lequel la seule distribution sur l'ensemble (k, k + 1, k + 2,...) avec une espérance mathématique donnée et une entropie maximale est une distribution géométrique avec une espérance mathématique donnée est donné (sans preuve) en /47 /. L'auteur en a cependant donné une preuve rigoureuse.

Dans le troisième paragraphe du premier chapitre, une définition d'une métrique généralisée est donnée - une métrique qui admet des valeurs infinies.

Pour x, y Є Гі, la fonction p(x, y) est définie comme le minimum є > 0 avec la propriété y v e~ e

S'il n'y a pas un tel є, alors on suppose que p(x, y) = oo.

Il est prouvé que la fonction p(x, y) est une métrique généralisée sur la famille des distributions sur l'ensemble des entiers non négatifs, ainsi que sur l'ensemble Ci*. Au lieu de e dans la définition de la métrique p(x, y), vous pouvez utiliser tout autre nombre positif autre que 1. Les métriques résultantes différeront par une constante multiplicative. Notons J(x, y) la distance d'information

Ici et ci-dessous, on suppose que 0 In 0 = 0,01n ^ = 0. La distance d'information est définie pour tel x, y, que x v - 0 pour tous et tel que y v = 0. Si cette condition n'est pas satisfaite, alors nous supposera J (S,y) = co. Soit A C 1 $. On notera alors J(Ay)="mU(x,y).

Soit J(Jb,y) = 00.

Dans le quatrième paragraphe du premier chapitre, une définition est donnée de la compacité des fonctions définies sur l'ensemble Π*. La compacité d'une fonction avec un nombre dénombrable d'arguments signifie que, avec n'importe quel degré de précision, la valeur de la fonction peut être approximée par les valeurs de cette fonction aux points où seul un nombre fini d'arguments est différent de zéro. La compacité des fonctions d'entropie et de distance d'information est prouvée.

Pour tout 0

Si, pour certains 0 0, la fonction \(x) = J(x, p) est compacte sur l'ensemble ^ 7 ] P 0 r (p).

Dans le cinquième paragraphe du premier chapitre, les propriétés de la distance d'information donnée sur un espace de dimension infinie sont considérées. Par rapport au cas de dimension finie, la situation de continuité de la fonction de distance d'information change qualitativement. Il est montré que la fonction de distance d'information n'est continue sur l'ensemble Г2 dans aucune des métriques pi(,y)= E|z„-i/„|, (

00 \ 2 p 2 (x, y) = sup (x^-ij^.

La validité des inégalités suivantes pour les fonctions d'entropie H(x) et de distance d'information J(x,p) est prouvée :

1. Pour tout x, x "Є fi \ H (x) - H (x") \

2. Si pour certains x, p є P il existe є > 0 tel que x є O є (p), alors pour tout X i Є Q \J(x,p) - J(x",p)\

De ces inégalités, compte tenu du théorème 1, il s'ensuit que les fonctions d'entropie et de distance d'information sont uniformément continues sur les sous-ensembles fi correspondants dans la métrique p(x,y), à savoir,

Pour tout 7 tel que 0

Si pour environ 70, 0

20 alors pour tout 0 0 la fonction \p(x) = J(x t p) est uniformément continue sur l'ensemble П 7 ] П О є (р) dans la métrique р(х,у).

La définition de la non-extrémalité d'une fonction est donnée. La condition de non-extremalité signifie que la fonction n'a pas d'extrema locaux, ou que la fonction prend les mêmes valeurs en minima locaux (maximas locaux). La condition de non-extrema affaiblit l’exigence selon laquelle il n’y a pas d’extrema locaux. Par exemple, la fonction sin x sur l'ensemble des nombres réels a des extrema locaux, mais satisfait la condition de non-extremalité.

Soit pour certains 7 > 0, l'aire A est donnée par la condition

А = (хЄЇ1 1 ,Ф(х) >а), (0.9) où Ф(х) est une fonction à valeur réelle, a est une constante réelle, inf Ф(х)

Et 3y, la question s'est posée, dans quelles conditions „a f „ f avec u_ „ paramètres n, N dans la région centrale, ^ -> 7, pour toutes leurs valeurs suffisamment grandes, il existe de tels entiers non négatifs ko, k \, ..., k n, qui est ko + hi + ... + k n = N,

21 k\ + 2/... + nk n - N

Kqk\kn. ^"iv"-"iv" 0 " 0 "-")>a -

Il est prouvé que pour cela il suffit d'exiger que la fonction φ soit non extrémale, compacte et continue dans la métrique p(x, y), et aussi que pour au moins un point x vérifiant (0.9), pour certains є > 0 il existe un moment fini de degré 1 + є Ml + = і 1+є x et 0 pour tout u = 0,1,....

Dans le deuxième chapitre, nous étudions les asymptotiques grossières (jusqu'à l'équivalence logarithmique) de la probabilité de grands écarts des fonctions par rapport à D = (fio,..., n, 0,...) - le nombre de cellules avec un remplir la région centrale des paramètres N,n . L'asymptotique grossière des probabilités de grands écarts est suffisante pour étudier les indices de qualité des tests d'ajustement.

Soient les variables aléatoires ^ dans (0,2) distribuées de manière identique et

Р(Сі = k)=р b k = 0.1,... > P(z) - fonction génératrice de la variable aléatoire i - converge dans un cercle de rayon 1

22 Notons p(.) = (p(ad = o), Pn) = i),...).

S'il existe une solution z 1 de l'équation

M(*) = 7, alors il est unique /38/. Partout ci-dessous nous supposerons que Pjfc>0,fc = 0,l,....

Le premier paragraphe du premier paragraphe du deuxième chapitre contient les asymptotiques des logarithmes des probabilités de la forme

Le théorème suivant est démontré.

Théorème 2. Un théorème local approximatif sur les probabilités de grands écarts. Soit n, N - * w tel que - -> 7> 0

L'énoncé du théorème découle directement de la formule de la distribution conjointe /to, A*b / in /26/ et de l'estimation suivante : si les valeurs entières non négatives fii,fi2,/ satisfont à la condition /І1 + 2 // 2 + ... + 71/ = 71, alors le nombre de valeurs non nulles parmi elles est 0(l/n). Il s’agit d’une estimation approximative qui ne prétend pas être nouvelle. Le nombre de r non nul dans les schémas généralisés ne dépasse pas la valeur du remplissage maximal des cellules, qui dans la région centrale avec une probabilité tendant vers 1 ne dépasse pas la valeur 0(\np) /25/,/27/ . Néanmoins, l’estimation résultante 0(y/n) est satisfaite avec la probabilité 1, et elle suffit pour obtenir une asymptotique grossière.

Dans le deuxième paragraphe du premier paragraphe du deuxième chapitre, la valeur de la limite se trouve où adz est une séquence de nombres réels convergeant vers certains a Є R, φ(x) est une fonction à valeur réelle. Le théorème suivant est démontré.

Théorème 3. Un théorème intégral approximatif sur les probabilités de grands écarts. Soit les conditions du théorème 2 satisfaites, pour certains r > 0, (> 0 la fonction réelle φ(x) est compacte, uniformément continue dans la métrique p sur l'ensemble

A = 0 rH (p(r 1))np n] et satisfait la condition de non-extrémalité sur l'ensemble r2 7 . Si pour une constante a telle que inf φ(x)

24 il existe un vecteur p a fi 7 P 0 r (p(z 7)) ; tel que

Ф(pa) > a J(( (x) >a, xЄ П 7 ),p(2; 7)) = J(p a ,p(^y)), mo pour toute séquence a^ convergeant vers a, ^ -^\nP(φ(φ, ^,...)>a m) = Pr a,p(r,)). (0,11)

Sous des restrictions supplémentaires sur la fonction φ(x), la distance d'information J(pa, P(zy)) dans (2.3) peut être calculée plus spécifiquement. Autrement dit, le théorème suivant est vrai. Théorème 4. Distance d'information. Laissez un peu 0

Que certains r > 0, C > 0, la fonction réelle φ(x) et ses dérivées partielles du premier ordre soient compactes et uniformément continues dans la métrique généralisée p(x, y) sur l'ensemble

A = 0 r (p)PP bl] , il existe T > 0, R > 0 tel que pour tout \t\ 0 p v v 1+ z u exp(i--φ(x))

0(p(gaL)) = a, / x X v \Z,t) T, u= oX LJ (Z,t)

Alors p(z a, t a) Є ft, u J ((z Є L, 0 (x) = a), p) = J (p (z a , t a), p) d _ 9 = 7111 + t a "-^ OFaL)) - Dans 2Wexp( a --0(p(r a, i a))). j/=0 CnEi/ ^_o CX(/

Si la fonction φ(x) est une fonction linéaire et que la fonction fix) est définie en utilisant l'égalité (0,5), alors la condition (0,12) devient la condition de Cramer pour la variable aléatoire f(,(z)). La condition (0.13) est une forme de condition (0.10) et est utilisée pour prouver la présence dans les domaines de la forme (x Є T2, φ(x) > a) d'au moins un point de 0(n, N) pour tout n suffisamment grand, N.

Soit v ()(n,iV) = (/i,...,/ijv) le vecteur fréquence dans le schéma d'allocation généralisé (0.2). Suite aux théorèmes 3 et 4, le théorème suivant est formulé.

Théorème 5. Un théorème intégral approximatif sur les probabilités de grands écarts de statistiques séparables symétriques dans un schéma d'allocation généralisé.

Soit n, N -> w tel que jfr - 7» 0 0, R > 0 tel que pour tout \t\ Alors pour toute séquence a# convergeant vers a, 1 i iv =

Ce théorème a été prouvé pour la première fois par AF Ronzhin dans /38/ en utilisant la méthode du point selle.

Dans la deuxième section du deuxième chapitre, nous étudions les probabilités de grands écarts de statistiques séparables dans les arrangements cxj^iax généralisés dans le cas de non-respect de la condition de Cramer pour la variable aléatoire /((z)). La condition de Cramer pour la variable aléatoire f(,(z)) n'est pas satisfaite, en particulier si (z) est une variable aléatoire de Poisson et /(x) = x 2 . Notez que la condition de Cramer pour les statistiques séparables elles-mêmes dans les schémas d'allocation généralisés est toujours satisfaite, puisque pour tout n fixe, N le nombre de résultats possibles dans ces schémas est fini.

Comme indiqué dans /2/, si la condition de Cramer n'est pas satisfaite, alors afin de trouver l'asymptotique des probabilités de grands écarts de sommes de variables aléatoires distribuées de manière identique, il est nécessaire de remplir des conditions f supplémentaires pour un changement correct sur le répartition du terme. Dans l'article (on considère le cas qui correspond à la réalisation de la condition (3) dans /2/, c'est-à-dire le cas à sept exponentiels. Soit P(i = k) > 0 pour tout

28 k = 0,1,... et la fonction p(k) = -\nP(t = k) peut être étendue à une fonction d'argument continu - une fonction d'ordre p, 0 oo P(tx) , r v variant régulièrement P(t)

Soit la fonction f(x) pour des valeurs suffisamment grandes de l'argument une fonction positive, strictement croissante, variant régulièrement d'ordre q > 1, sur le reste de l'axe réel

Puis l'art. V. /(i) a des moments de n'importe quel ordre et ne satisfait pas à la condition de Cramer, ip(x) = o(x) lorsque x -> oo, et le théorème suivant est valable. ^p n'augmente pas de façon monotone, n, N --> oo de sorte que jf - A, 0 b(z\), où b(z) = M/(1(2)), il existe une limite l(n,l)) > cN] = "(c ~ b( zx))l b""ї

Il résulte du théorème 6 que, si la condition de Cramer n'est pas satisfaite, la limite (^ lim ~\nP(L N (h(n,N)) > cN) = 0, "" Dv

L/-trop iV et cela prouve la validité de l'hypothèse énoncée dans /39/. Ainsi, la valeur de l'indice du critère d'adéquation dans les schémas d'allocation généralisés -^ lorsque la condition de Cramer n'est pas satisfaite, est toujours égale à zéro. Dans ce cas, dans la classe des critères, lorsque la condition de Cramer est satisfaite, des critères avec une valeur d'indice non nulle sont construits. De là, nous pouvons conclure que l'utilisation de critères dont les statistiques ne satisfont pas à la condition de Cramer, par exemple le test du chi carré dans un schéma polynomial, pour construire des tests d'adéquation pour tester des hypothèses avec des alternatives non approchées est asymptotiquement inefficace dans ce sens. Une conclusion similaire a été tirée dans /54/ sur la base des résultats de la comparaison des statistiques du chi carré et du rapport du maximum de vraisemblance dans un schéma polynomial.

Dans le troisième chapitre, nous résolvons le problème de la construction de critères d'adéquation avec la valeur la plus élevée de l'indice du critère (la plus grande valeur de l'indice inférieur du critère) pour tester des hypothèses dans des mises en page généralisées. Sur la base des résultats des premier et deuxième chapitres sur les propriétés des fonctions d'entropie, la distance d'information et les probabilités de grands écarts, dans le troisième chapitre, une fonction de la forme (0,4) est trouvée telle que le critère d'adéquation construit sur sa base a la plus grande valeur de l'indice inférieur exact dans la classe de critères considérée. Le théorème suivant est démontré. Théorème 7. Sur l'existence d'un indice. Soit les conditions du théorème 3 satisfaites, 0 ,... est une suite de distributions alternatives, 0^(/3, iV) est le nombre maximum pour lequel, sous l'hypothèse Н Р (lo, l'inégalité

P(φ(^^,...) > a φ (P, M)) > (3, il existe une limite il existe un indice du critère f

3ff,K) = 3((φ(x) >a,xe 3D.P^)).

En même temps, sph(0,th)N NP(e(2 7) = fc)"

La Conclusion décrit les résultats obtenus dans leur relation avec l'objectif général et les tâches spécifiques définies dans la thèse, formule des conclusions basées sur les résultats de la recherche de la thèse, indique la nouveauté scientifique, la valeur théorique et pratique du travail, ainsi que les spécificités scientifiques. problèmes qui ont été identifiés par l'auteur et dont la solution semble pertinente.

Une brève revue de la littérature sur le sujet de recherche.

Le travail de thèse considère le problème de la construction de critères d'adéquation dans des schémas d'allocation généralisés avec la plus grande valeur de l'indice de critère dans la classe de fonctions de la forme (0,4) avec des alternatives non approchées.

Des schémas d'allocation généralisés ont été introduits par VF Kolchin dans /24/. Les valeurs fi r dans le schéma polynomial ont été appelées nombre de cellules avec r coups et ont été étudiées en détail dans la monographie de V. F. Kolchin, B. A. Sevastyanov, V. P. Chistyakov /27/. Les valeurs \і r dans les tracés généralisés ont été étudiées par VF Kolchin dans /25/,/26/. Les statistiques de la forme (0,3) ont été examinées pour la première fois par Yu. I. Medvedev dans /30/ et étaient appelées statistiques séparables (additifment séparables). Si les fonctions /„ dans (0.3) ne dépendent pas de u, de telles statistiques ont été appelées dans /31/ statistiques séparables symétriques. Le comportement asymptotique des moments de statistiques séparables dans les schémas d'allocation généralisés a été obtenu par GI Ivchenko dans /9/. Des théorèmes limites pour un schéma d'allocation généralisé ont également été examinés dans /23/. Des revues des résultats des théorèmes limites et de la qualité de l'ajustement dans les schémas probabilistes discrets de type (0,2) ont été données par V. A. Ivanov, G. I. Ivchenko, Yu. I. Medvedev dans /8/ et G. I. Ivchenko, Yu. I. Medvedev, A.F. Ronzhin. dans /14/. Les critères d'adéquation pour les mises en page généralisées ont été pris en compte par A.F. Ronzhin dans /38/.

La comparaison des propriétés des tests statistiques dans ces travaux a été réalisée du point de vue de l'efficacité asymptotique relative. Le cas des hypothèses proches (contiguës) - efficacité au sens de Pitman et des hypothèses non convergentes - efficacité au sens de Bahadur, Hodges - Lehman et Chernov ont été considérés. La relation entre les différents types de performances relatives des tests statistiques est discutée, par exemple, dans /49/. Comme il ressort des résultats de Yu. I. Medvedev dans /31/ sur la distribution des statistiques décomposables dans un schéma polynomial, le test basé sur la statistique du chi carré a la puissance asymptotique la plus élevée sous hypothèses convergentes dans la classe des statistiques décomposables sur les fréquences des résultats dans un schéma polynomial. Ce résultat a été généralisé par A.F. Ronzhin pour les schémas de type (0,2) dans /38/. II Viktorova et VP Chistyakov dans /4/ ont construit un critère optimal pour un schéma polynomial dans la classe des fonctions linéaires de sapin. A. F. Ronzhin dans /38/ a construit un critère qui, dans le cas d'une séquence d'alternatives ne se rapprochant pas de l'hypothèse nulle, minimise le taux logarithmique de la probabilité d'une erreur de première espèce tendant vers zéro dans la classe des statistiques de la forme (0,6). Une comparaison de la performance relative de la statistique du chi carré et du rapport du maximum de vraisemblance pour les hypothèses convergentes et non convergentes a été réalisée dans /54/. Dans le travail de thèse, le cas des hypothèses de non-approche a été considéré. L'étude de l'efficacité statistique relative des critères sous des hypothèses non convergentes nécessite l'étude des probabilités d'écarts très importants - de l'ordre de 0(o/n). Pour la première fois, un tel problème pour une distribution polynomiale avec un nombre fixe de résultats a été résolu par IN Sanov dans /40/. L'optimalité asymptotique des critères d'adéquation pour tester des hypothèses simples et complexes pour une distribution polynomiale dans le cas d'un nombre fini de résultats avec des alternatives non proches a été prise en compte dans /48/. Les propriétés de la distance d'information ont été précédemment considérées par Kullback, Leibler /29/,/53/ et I. II. Sanov /40/, ainsi que Heffding /48/. Dans ces articles, la continuité de la distance d'information a été considérée sur des espaces de dimension finie dans la métrique euclidienne. L'auteur a également considéré une séquence d'espaces de dimension croissante, par exemple dans l'œuvre de Yu. V. Prokhorov /37/ ou dans l'œuvre de V. I. Bogachev, A. V. Kolesnikov /1/. Des théorèmes approximatifs (jusqu'à l'équivalence logarithmique) sur les probabilités de grands écarts de statistiques séparables dans des schémas d'allocation généralisés sous la condition de Cramer ont été obtenus par A. F. Roijine dans /38/. A. N. Timashev dans /42/,/43/ a obtenu des théorèmes limites intégraux et locaux multidimensionnels exacts (jusqu'à l'équivalence) sur les probabilités de grands écarts du vecteur fir^n, N),..., fi rs (n,N) , où s, гі,..., r s - nombres entiers fixes,

Les problèmes statistiques de test d'hypothèses et d'estimation de paramètres dans un schéma de sélection sans remplacement dans une formulation légèrement différente ont été examinés par G. I. Ivchenko, V. V. Levin, E. E. Timonina /10/, /15/, où les problèmes d'estimation ont été résolus pour une population finie, lorsque le Le nombre de ses éléments est une valeur inconnue, la normalité asymptotique des statistiques S multivariées à partir de s échantillons indépendants dans un schéma de sélection sans remplacement a été prouvée. Le problème de l'étude des variables aléatoires associées aux répétitions dans des séquences d'essais indépendants a été étudié par A. M. Zubkov, V. G. Mikhailov, A. M. Shoitov dans /6/, /7/, /32/, /33/, /34/. L'analyse des principaux problèmes statistiques d'estimation et de test d'hypothèses dans le cadre du modèle général de Markov-Poya a été réalisée par G. I. Ivchenko, Yu. I. Medvedev dans /13/, dont l'analyse probabiliste a été donnée dans /11 /. Une méthode pour spécifier des mesures non équiprobables sur un ensemble d'objets combinatoires qui n'est pas réductible à un schéma d'allocation généralisé (0.2) a été décrite dans GI Ivchenko, Yu. I. Medvedev /12/. Un certain nombre de problèmes de théorie des probabilités, dans lesquels la réponse peut être obtenue à la suite de calculs utilisant des formules récursives, sont indiqués par AM Zubkov dans /5/.

Les inégalités pour l'entropie des distributions discrètes ont été obtenues dans /50/ (cité dans le résumé de A. M. Zubkov dans RZhMat). Si (p n )Lo est une distribution de probabilité,

Pn = E Pk, k=n A = supp^Pn+i

I + (In -f-) (X Rp - P p + 1)

Рп= (x f 1)n+v n>Q. (0,15)

Notez que la distribution extrémale (0,15) est une distribution géométrique avec l'espérance A, et la fonction F(X) du paramètre (0,14) coïncide avec la fonction de l'espérance dans le théorème 1.

Entropie des distributions discrètes avec attente limitée

Si un index de critère existe, alors l'indice du critère lui correspond. L'indice du critère existe toujours. Plus la valeur de l'indice du critère est grande (indice inférieur du critère), meilleur est le critère statistique au sens considéré. Dans /38/, le problème de la construction de critères d'adéquation pour les mises en page généralisées avec la valeur la plus élevée de l'indice de critère dans la classe de critères qui rejettent l'hypothèse Ho(n,N) a été résolu pour où m 0 est une valeur fixe. nombre, la séquence de constantes par exemple est sélectionnée en fonction de la valeur donnée la puissance du critère pour une séquence d'alternatives, ft est une fonction réelle de m + 1 arguments.

Les indices critères sont déterminés par les probabilités de grands écarts. Comme le montre /38/, l'asymptotique grossière (jusqu'à l'équivalence logarithmique) des probabilités de grands écarts de statistiques séparables lorsque la condition de Cramer pour la variable aléatoire /() est satisfaite est déterminée par la distance d'information Kullback-Leibler-Sanov correspondante. (la variable aléatoire μ satisfait la condition de Cramer , si pour un certain # 0 la fonction génératrice de moment Mef7? est finie dans l'intervalle \t\ H /28/).

La question des probabilités d'écarts importants des statistiques par rapport à un nombre illimité, ainsi que des statistiques arbitrairement séparables qui ne satisfont pas à la condition de Cramer, est restée ouverte. Cela n'a pas permis de résoudre définitivement le problème de la construction de critères de test d'hypothèses dans les schémas d'allocation généralisés avec le taux de convergence vers zéro le plus élevé pour la probabilité d'erreur de première espèce dans le cas d'alternatives convergentes dans la classe de critères basé sur des statistiques de la forme (0,4). La pertinence de la recherche de thèse est déterminée par la nécessité de compléter la solution de ce problème.

L'objectif du travail de thèse est de construire des critères d'adéquation avec la valeur la plus élevée de l'indice du critère (indice inférieur du critère) pour tester des hypothèses dans le schéma de sélection sans récurrence dans la classe de critères qui rejettent l'hypothèse W( n, N) pour où φ est fonction d'un nombre dénombrable d'arguments, et les paramètres n, N changent dans la région centrale. Conformément à l'objectif de l'étude, les tâches suivantes ont été définies : - étudier les propriétés de l'entropie et la distance d'information Kullback - Leibler - Sanov pour des distributions discrètes avec un nombre dénombrable de résultats ; - étudier les probabilités de grands écarts statistiques de la forme (0,4) ; - étudier les probabilités de grands écarts de statistiques séparables symétriques (0,3) qui ne satisfont pas à la condition de Cramer ; - trouver une statistique telle que le critère d'accord construit sur sa base pour tester des hypothèses dans les schémas d'allocation généralisés ait la plus grande valeur d'indice dans la classe de critères de la forme (0,7). Nouveauté scientifique : - le concept de métrique généralisée est donné - une fonction qui admet des valeurs infinies et satisfait les axiomes d'identité, de symétrie et d'inégalité triangulaire. Une métrique généralisée est trouvée et des ensembles sont indiqués sur lesquels les fonctions d'entropie et de distance d'information, données sur une famille de distributions discrètes avec un nombre dénombrable de résultats, sont continues dans cette métrique ; - dans le schéma d'allocation généralisé, une asymptotique grossière (jusqu'à l'équivalence logarithmique) est trouvée pour les probabilités de grands écarts statistiques de la forme (0,4) satisfaisant la forme correspondante de la condition de Cramer ; - dans le schéma d'allocation généralisé, une asymptotique grossière (jusqu'à l'équivalence logarithmique) est trouvée pour les probabilités de grands écarts de statistiques séparables symétriques qui ne satisfont pas à la condition de Cramer ; - dans la classe de critères de la forme (0.7), un critère avec la plus grande valeur de l'indice de critère est construit. Valeur scientifique et pratique. Dans cet article, un certain nombre de questions sur le comportement des probabilités de déviation importante dans les schémas d'allocation généralisés sont résolues. Les résultats obtenus peuvent être utilisés dans le processus pédagogique dans les spécialités de statistiques mathématiques et de théorie de l'information, dans l'étude des procédures statistiques pour l'analyse de séquences discrètes et ont été utilisés dans /3/, /21/ pour justifier la sécurité d'une classe des systèmes d’information. Dispositions avancées pour la défense : - réduction du problème de vérification, à l'aide d'une seule séquence de couleurs de boules, de l'hypothèse que cette séquence a été obtenue à la suite d'un choix sans remplacement jusqu'à l'épuisement des boules d'une urne contenant des boules de deux couleurs, et chacun de ces choix a la même probabilité, à la construction de critères d'accord pour tester des hypothèses dans la disposition généralisée correspondante ; - continuité des fonctions d'entropie et de distance d'information Kullback - Leibler - Sanov sur un simplexe de dimension infinie avec la métrique logarithmique généralisée introduite ; - un théorème sur les asymptotiques grossières (jusqu'à l'équivalence logarithmique) des probabilités de grands écarts de statistiques séparables symétriques qui ne satisfont pas la condition de Cramer dans le schéma d'allocation généralisé dans le cas des sept exionentiels ;

Continuité de la distance d'information Kullback-Leibler-Sanov

Des schémas d'allocation généralisés ont été introduits par VF Kolchin dans /24/. Les valeurs sapin dans le schéma polynomial étaient appelées nombre de cellules avec r coups et ont été étudiées en détail dans la monographie de V. F. Kolchin, B. A. Sevastyanov, V. P. Chistyakov /27/. Les valeurs \іr dans les tracés généralisés ont été étudiées par VF Kolchin dans /25/,/26/. Les statistiques de la forme (0,3) ont été examinées pour la première fois par Yu. I. Medvedev dans /30/ et étaient appelées statistiques séparables (additifment séparables). Si les fonctions /„ dans (0.3) ne dépendent pas de u, de telles statistiques ont été appelées dans /31/ statistiques séparables symétriques. Le comportement asymptotique des moments de statistiques séparables dans les schémas d'allocation généralisés a été obtenu par GI Ivchenko dans /9/. Des théorèmes limites pour un schéma d'allocation généralisé ont également été examinés dans /23/. Des revues des résultats des théorèmes limites et de la qualité de l'ajustement dans les schémas probabilistes discrets de type (0,2) ont été données par V. A. Ivanov, G. I. Ivchenko, Yu. I. Medvedev dans /8/ et G. I. Ivchenko, Yu. I. Medvedev, A.F. Ronzhin. dans /14/. Les critères d'adéquation pour les mises en page généralisées ont été pris en compte par A.F. Ronzhin dans /38/.

La comparaison des propriétés des tests statistiques dans ces travaux a été réalisée du point de vue de l'efficacité asymptotique relative. Le cas des hypothèses proches (contiguës) - efficacité au sens de Pitman et des hypothèses non convergentes - efficacité au sens de Bahadur, Hodges - Lehman et Chernov ont été considérés. La relation entre les différents types de performances relatives des tests statistiques est discutée, par exemple, dans /49/. Comme il ressort des résultats de Yu. I. Medvedev dans /31/ sur la distribution des statistiques séparables dans un schéma polynomial, le test basé sur la statistique du chi carré a la puissance asymptotique la plus élevée sous hypothèses convergentes dans la classe des statistiques séparables sur les fréquences des résultats dans un schéma polynomial. Ce résultat a été généralisé par A.F. Ronzhin pour les schémas de type (0,2) dans /38/. II Viktorova et VP Chistyakov dans /4/ ont construit le critère optimal pour le schéma polynomial dans la classe des fonctions linéaires du sapin. A. F. Ronzhin dans /38/ a construit un critère qui, dans le cas d'une séquence d'alternatives ne se rapprochant pas de l'hypothèse nulle, minimise le taux logarithmique de la probabilité d'une erreur de première espèce tendant vers zéro dans la classe des statistiques de la forme (0,6). Une comparaison de la performance relative de la statistique du chi carré et du rapport du maximum de vraisemblance pour les hypothèses convergentes et non convergentes a été réalisée dans /54/. Dans le travail de thèse, le cas des hypothèses de non-approche a été considéré. L'étude de l'efficacité statistique relative des critères sous des hypothèses non convergentes nécessite l'étude des probabilités d'écarts très importants - de l'ordre de 0(o/n). Pour la première fois, un tel problème pour une distribution polynomiale avec un nombre fixe de résultats a été résolu par IN Sanov dans /40/. L'optimalité asymptotique des critères d'adéquation pour tester des hypothèses simples et complexes pour une distribution polynomiale dans le cas d'un nombre fini de résultats avec des alternatives non proches a été prise en compte dans /48/. Les propriétés de la distance d'information ont été précédemment considérées par Kullback, Leibler /29/,/53/ et I. II. Sanov /40/, ainsi que Heffding /48/. Dans ces articles, la continuité de la distance d'information a été considérée sur des espaces de dimension finie dans la métrique euclidienne. L'auteur a également considéré une séquence d'espaces de dimension croissante, par exemple dans l'œuvre de Yu. V. Prokhorov /37/ ou dans l'œuvre de V. I. Bogachev, A. V. Kolesnikov /1/. Des théorèmes approximatifs (jusqu'à l'équivalence logarithmique) sur les probabilités de grands écarts de statistiques séparables dans des schémas d'allocation généralisés sous la condition de Cramer ont été obtenus par A. F. Roijine dans /38/. A. N. Timashev dans /42/,/43/ a obtenu des théorèmes limites intégraux et locaux multidimensionnels exacts (jusqu'à l'équivalence) sur les probabilités de grandes déviations d'un vecteur

L'étude des probabilités de grands écarts lorsque la condition de Cramer n'est pas remplie dans le cas de variables aléatoires indépendantes a été réalisée dans les travaux de A. V. Nagaev /35/. La méthode des distributions conjuguées est décrite par Feller /45/.

Les problèmes statistiques de test d'hypothèses et d'estimation de paramètres dans un schéma de sélection sans remplacement dans une formulation légèrement différente ont été examinés par G. I. Ivchenko, V. V. Levin, E. E. Timonina /10/, /15/, où les problèmes d'estimation ont été résolus pour une population finie, lorsque le Le nombre de ses éléments est une valeur inconnue, la normalité asymptotique des statistiques S multivariées à partir de s échantillons indépendants dans un schéma de sélection sans remplacement a été prouvée. Le problème de l'étude des variables aléatoires associées aux répétitions dans des séquences d'essais indépendants a été étudié par A. M. Zubkov, V. G. Mikhailov, A. M. Shoitov dans /6/, /7/, /32/, /33/, /34/ . L'analyse des principaux problèmes statistiques d'estimation et de test d'hypothèses dans le cadre du modèle général de Markov-Poya a été réalisée par G. I. Ivchenko, Yu. I. Medvedev dans /13/, dont l'analyse probabiliste a été donnée dans /11 /. Une méthode pour spécifier des mesures non équiprobables sur un ensemble d'objets combinatoires qui n'est pas réductible à un schéma d'allocation généralisé (0.2) a été décrite dans GI Ivchenko, Yu. I. Medvedev /12/. Un certain nombre de problèmes de théorie des probabilités, dans lesquels la réponse peut être obtenue à la suite de calculs utilisant des formules récursives, sont indiqués par AM Zubkov dans /5/.

Distance d'information et probabilités de grands écarts de statistiques séparables

Lorsque la condition de Cramer n'est pas satisfaite, les écarts importants des statistiques séparables dans le schéma d'allocation généralisé dans le cas sept exponentiel considéré sont déterminés par la probabilité d'écart d'un terme indépendant. Lorsque la condition de Cramer est satisfaite, comme le souligne /39/, ce n'est pas le cas. Remarque 10. La fonction φ(χ) est telle que l'espérance mathématique Ee AL) est finie en 0 t 1 et infinie en t 1. Remarque 11. Pour les statistiques séparables qui ne satisfont pas à la condition de Cramer, la limite (2.14) est égal à 0, ce qui prouve la validité de la conjecture exprimée en /39/. Remarque 12. Pour la statistique du chi carré dans le schéma polynomial pour n, ./V - co tel que - A, il découle directement du théorème que ce résultat a été directement obtenu en /54/. Dans ce chapitre, dans la région centrale de variation des paramètres des schémas généralisés de placement de particules dans les cellules, asymptotiques grossières (jusqu'à l'équivalence logarithmique) des probabilités de grands écarts de statistiques additivement séparables du remplissage cellulaire et des fonctions du nombre de cellules avec un remplissage donné ont été trouvés.

Si la condition de Cramer est satisfaite, alors l'asymptotique grossière des probabilités de grands écarts est déterminée par l'asymptotique grossière des probabilités de tomber dans une séquence de points avec des coordonnées rationnelles convergeant dans le sens ci-dessus vers le point auquel l'extremum du correspondant la distance d’information est atteinte.

Le cas sept exponentiel de non-satisfaction de la condition de Cramer pour les variables aléatoires f(i),..., f(x) a été considéré, où b, x sont des variables aléatoires indépendantes générant le schéma de partitionnement généralisé (0,2), f(k) est une fonction dans la définition d'une statistique symétrique additivement séparable dans (0.3). Autrement dit, il a été supposé que les fonctions p(k) = - lnP(i = k) et f(k) peuvent être étendues à des fonctions régulièrement variables d'un argument continu de l'ordre p 0 et q 0, respectivement, et p q . Il s'est avéré que la principale contribution à l'asymptotique grossière des probabilités d'écarts importants des statistiques séparables dans les schémas d'attribution généralisés est également apportée par l'asymptotique grossière de la probabilité d'attribution à la séquence de points correspondante. Il est intéressant de noter qu’auparavant, le théorème sur les probabilités de grands écarts pour les statistiques séparables avait été prouvé en utilisant la méthode du point selle, la principale contribution à l’asymptotique étant apportée par un seul point selle. Le cas est resté inexploré où, si la condition de Cramer n'est pas satisfaite, la condition des 2 kN ne l'est pas.

Si la condition de Cramer n'est pas satisfaite, alors la condition indiquée peut ne pas être satisfaite uniquement dans le cas de p 1. Comme cela découle directement du logarithme de la distribution de probabilité correspondante, pour la distribution de Poisson et la distribution géométrique p=1. Du résultat sur l'asymptotique des probabilités de grands écarts lorsque la condition de Cramer n'est pas satisfaite, on peut conclure que les critères dont les statistiques ne satisfont pas à la condition de Cramer ont un taux de convergence vers zéro significativement plus faible des probabilités d'erreurs de la seconde genre pour une probabilité fixe d'erreur de première espèce et des alternatives non convergentes par rapport aux critères dont les statistiques satisfont à la condition de Cramer. Qu'une urne contenant N - 1 1 boules blanches non-JV 1 noires soit choisie sans remplacement jusqu'à ce qu'elle soit épuisée. Relions les positions des boules blanches dans le choix 1 i\ ... r -i n - 1 avec la séquence de distances entre boules blanches adjacentes hi,...,h comme suit : Alors hv l,v =1,. .. ,N,M EjLi i/ - n- Définissons une distribution de probabilité sur l'ensemble des vecteurs h = (hi,..., λg) en posant V(hv = rv,v = l,..., N) où i,... ,lg - variables aléatoires entières non négatives indépendantes (r.v.), c'est-à-dire considérons le schéma d'allocation généralisé (0.2). La distribution du vecteur h dépend de n,N, mais les indices correspondants, lorsque cela est possible, seront omis pour faciliter la notation. Remarque 14. Si chacune des (]) manières de choisir des boules dans une urne se voit attribuer la même probabilité (\) mn pour tout r i,..., rg tel que rn 1,u = l,...,N , T,v=\ru = n, la probabilité que les distances entre boules blanches adjacentes dans le choix prennent ces valeurs

Critères basés sur le nombre de cellules dans les mises en page généralisées

Le but du travail de thèse était de construire des critères d'adéquation pour tester des hypothèses dans un schéma de sélection sans revenir d'une urne contenant des boules de 2 couleurs. L'auteur a décidé d'étudier des statistiques basées sur la fréquence des distances entre balles de même couleur. Dans cette formulation, le problème a été réduit au problème de tester des hypothèses dans une disposition généralisée appropriée.

Dans le cadre des travaux de thèse, nous avons - étudié les propriétés de l'entropie et de la distance d'information de distributions discrètes avec un nombre illimité de résultats avec une espérance mathématique limitée ; - une asymptotique grossière (jusqu'à l'équivalence logarithmique) des probabilités de grands écarts d'une large classe de statistiques dans un schéma d'allocation généralisé a été obtenue ; - sur la base des résultats obtenus, une fonction critère avec le taux logarithmique de convergence vers zéro le plus élevé de la probabilité d'une erreur du premier type est construite pour une probabilité fixe d'une erreur du deuxième type et des alternatives non approchantes ; - Il a été prouvé que les statistiques qui ne satisfont pas à la condition de Cramer ont un taux de tendance vers zéro des probabilités de grands écarts plus faible par rapport aux statistiques qui satisfont à une telle condition. La nouveauté scientifique des travaux est la suivante. - le concept de métrique généralisée est donné - une fonction qui admet des valeurs infinies et satisfait les axiomes d'identité, de symétrie et d'inégalité triangulaire. Une métrique généralisée est trouvée et des ensembles sont indiqués sur lesquels les fonctions d'entropie et de distance d'information, données sur une famille de distributions discrètes avec un nombre dénombrable de résultats, sont continues dans cette métrique ; - dans le schéma d'allocation généralisé, une asymptotique grossière (jusqu'à l'équivalence logarithmique) est trouvée pour les probabilités de grands écarts statistiques de la forme (0,4) satisfaisant la forme correspondante de la condition de Cramer ; - dans le schéma d'allocation généralisé, une asymptotique grossière (jusqu'à l'équivalence logarithmique) est trouvée pour les probabilités de grands écarts de statistiques séparables symétriques qui ne satisfont pas à la condition de Cramer ; - dans la classe de critères de la forme (0.7), un critère avec la plus grande valeur de l'indice de critère est construit. Dans cet article, un certain nombre de questions sur le comportement des probabilités de déviation importante dans les schémas d'allocation généralisés sont résolues. Les résultats obtenus peuvent être utilisés dans le processus pédagogique dans les spécialités de statistiques mathématiques et de théorie de l'information, dans l'étude des procédures statistiques pour l'analyse de séquences discrètes et ont été utilisés dans /3/, /21/ pour justifier la sécurité d'une classe des systèmes d’information. Cependant, un certain nombre de questions restent ouvertes. L'auteur s'est limité à considérer la zone centrale de variation des paramètres n, N des schémas généralisés de rangement de n particules dans des cellules /V. Si le porteur de la distribution de variables aléatoires générant le schéma d'allocation généralisé (0.2) n'est pas un ensemble de la forme r, r 4-1, r + 2,..., alors en prouvant la continuité de la fonction de distance d'information et en étudiant les probabilités de grands écarts, il est nécessaire de prendre en compte la structure arithmétique d'un tel porteur, qui n'a pas été prise en compte dans le travail de l'auteur. Pour l'application pratique des critères construits sur la base de la fonction proposée avec la valeur maximale de l'indice, il est nécessaire d'étudier sa distribution à la fois sous l'hypothèse nulle et sous des alternatives, y compris convergentes. Il est également intéressant de transférer les méthodes développées et de généraliser les résultats obtenus à d'autres schémas probabilistes autres que les schémas d'allocation généralisés. Si //1,/ 2,-.. sont les fréquences des distances entre les nombres de résultat 0 dans le schéma binomial avec les probabilités de résultats рї 1 -POj, alors on peut montrer que dans ce cas prouvé dans /26 /, il s'ensuit que la distribution (3.3), d'une manière générale, ne peut être représentée dans le cas général comme une distribution conjointe des valeurs de z dans aucun schéma généralisé de placement de particules dans des cellules. Cette distribution est un cas particulier des distributions sur l'ensemble des objets combinatoires introduits dans /12/. Il semble urgent de transférer les résultats du travail de thèse sur les mises en page généralisées à ce cas, qui a été discuté dans /52/.

asymptotiquement optimal

  • - un concept qui affirme l'impartialité de l'estimation dans la limite. Soit une suite de variables aléatoires sur un espace de probabilité, où Pm est une des mesures de la famille...

    Encyclopédie mathématique

  • - un concept qui affirme l'impartialité du critère dans la limite...

    Encyclopédie mathématique

  • - une solution d'un système différentiel stable au sens de Lyapunov et qui attire toutes les autres solutions avec des valeurs initiales suffisamment proches...

    Encyclopédie mathématique

  • - un concept qui étend l'idée d'estimation efficace au cas de grands échantillons. Définition sans ambiguïté de A. e. O. n'a pas. Par exemple, dans le classique variante dont on parle asymptotique...

    Encyclopédie mathématique

  • - souhaitable, opportun...

    Dictionnaire commercial de référence

  • - 1. le meilleur, le plus favorable, le plus approprié à certaines conditions et tâches 2...

    Grand dictionnaire économique

  • - le plus favorable, le meilleur possible...

    Grande Encyclopédie Soviétique

  • - le meilleur, le plus approprié à certaines conditions et tâches...

    Encyclopédie moderne

  • - le meilleur, le plus approprié à certaines conditions et tâches...

    Grand dictionnaire encyclopédique

  • - ...
  • - ...

    Dictionnaire orthographique

  • - ...

    Dictionnaire orthographique

  • - ...

    Dictionnaire orthographique

  • - ...

    Dictionnaire orthographique

  • - ...

    Dictionnaire orthographique

  • - ...

    Dictionnaire orthographique

"asymptotiquement optimal" dans les livres

Contraste visuel optimal (OVC)

Extrait du livre Couleur et contraste. Technologie et choix créatif auteur Jelezniakov Valentin Nikolaïevitch

Contraste visuel optimal (OVC) Imaginez un costume noir au soleil et une chemise blanche à la lune. Si l'on mesure leur luminosité avec un instrument, il s'avère que dans ces conditions un costume noir est plusieurs fois plus brillant qu'une chemise blanche, et pourtant on sait que

Quelle est l’échelle optimale ?

Extrait du livre Twitonomics. Tout ce que vous devez savoir sur l’économie, brièvement et précisément auteur Compton Nick

Quelle est l’échelle optimale ? L'auteur du concept d'échelle optimale est le philosophe germano-britannique Fritz Schumacher, auteur du livre « Moins c'est mieux : l'économie en tant qu'être humain ». Il a parlé du fait que la tendance capitaliste au « gigantisme » n'est pas seulement

8.4.2. Chemin de croissance optimal

Extrait du livre Théorie économique : manuel auteur Makhovikova Galina Afanasievna

8.4.2. Chemin de croissance optimal Supposons que les prix des ressources restent constants alors que le budget de l'entreprise augmente constamment. En reliant les points de contact des isoquants avec les isocosts, nous obtenons la ligne 0G - la « voie du développement » (la voie de la croissance). Cette ligne montre le taux de croissance du ratio

La meilleure option

Extrait du livre de l'URSS : de la dévastation à la puissance mondiale. Percée soviétique auteur Boff Giuseppe

Option optimale Dans le feu des batailles de 1928, le premier plan quinquennal est né. À partir de 1926, divers projets de plans furent élaborés successivement au sein de deux institutions, la Commission nationale de planification et le Conseil économique suprême. Leur développement s'est accompagné de discussions continues. Comme un seul schéma

MEILLEURE OPTION

Extrait du livre Rock russe. Petite encyclopédie auteur Bouchoueva Svetlana

Optimal

Extrait du livre Grande Encyclopédie Soviétique (OP) de l'auteur BST

Ordre optimal

Extrait du livre CSS3 pour les concepteurs Web par Siderholm Dan

Ordre optimal Lorsque vous utilisez les préfixes du navigateur, il est important de se rappeler l'ordre dans lequel les propriétés sont répertoriées. Vous remarquerez peut-être que dans l'exemple précédent, les propriétés de préfixe sont écrites en premier, suivies de la propriété sans préfixe.

La personne est optimale

Extrait du livre Computerra Magazine n°40 du 31 octobre 2006 auteur Magazine informatique

Optimal Man Auteur : Vladimir GurievCertains sujets qui étaient populaires il y a une quarantaine d'années semblent aujourd'hui si marginaux qu'ils sont à peine abordés sérieusement. En même temps - à en juger par le ton des articles des magazines populaires - ils semblaient pertinents et même

La meilleure option

Extrait du livre La première frappe de Staline 1941 [Collection] l'auteur Kremlev Sergueï

Variante optimale L'analyse des scénarios possibles d'évolution des événements oblige inévitablement à réfléchir au choix de la variante optimale. On ne peut pas dire que diverses options « d'été », c'est-à-dire des alternatives liées à mai-juin - juillet 1941, inspirent l'optimisme. Non, ils

La meilleure option

Extrait du livre Grande alternative patriotique auteur Isaev Alexeï Valerievitch

Variante optimale L'analyse des scénarios possibles d'évolution des événements oblige inévitablement à réfléchir au choix de la variante optimale. On ne peut pas dire que les différentes options « d’été », c’est-à-dire les alternatives liées à mai-juin-juillet 1941, inspirent l’optimisme. Non, ils

Contrôle optimal

Extrait du livre L'estime de soi chez les enfants et les adolescents. Livre pour les parents l'auteur Eyestad Guru

Contrôle optimal Que signifie tenir modérément serré ? Vous devez le déterminer vous-même, en fonction des connaissances de votre propre enfant et des conditions de l'environnement dans lequel vous vivez. Dans la plupart des cas, les parents d'adolescents tentent de protéger leurs enfants du tabac, de la consommation d'alcool,

Voie optimale

Extrait du livre Le paradoxe perfectionniste auteur Ben-Shahar Tal

La Perfection du Chemin Optimal nous attaque constamment. La couverture de Men's Health est ornée d'Adonis, la couverture de Vogue d'Elena Prekrasnaya ; des femmes et des hommes sur le grand écran règlent en une heure ou deux leurs conflits, jouent l'intrigue idéale, s'abandonnent à l'amour idéal. Nous avons tous entendu

Approche optimale

Extrait du livre Expert n°07 (2013) auteur Expert Magazine

Approche optimale Sergey Kostyaev, Ph.D.

La meilleure option

Extrait du livre Deux saisons auteur Arseniev L.

La meilleure option - Dites-moi, est-il raisonnable de jouer sur plusieurs fronts à la fois ? - ont demandé les journalistes à Bazilevich et Lobanovsky au tout début de la saison 75. - Déraisonnable, bien sûr, - ont-ils répondu. - Mais c'est nécessaire. Nous pensons qu'il est nécessaire de différencier la signification

Contrôle optimal

Extrait du livre Gestion des finances personnelles (familiales). Approche systémique auteur Michael Steinbock

Contrôle optimal >> Avec un contrôle optimal, nous divisons toutes les dépenses en deux grands groupes : - "normales" - les dépenses régulières, - les dépenses ponctuelles ou non standards. Le contrôle optimal ne peut être utilisé qu'après plusieurs mois de contrôle détaillé.