Norme matricielle. Apprendre à programmer Norme matricielle inverse

YouTube encyclopédique

    1 / 1

    ✪ Norme vectorielle. Partie 4.

Les sous-titres

Définition

Soit K le corps principal (généralement K = R. ou K = C ) et est l'espace linéaire de toutes les matrices à m lignes et n colonnes constituées d'éléments K. Une norme est donnée sur l'espace des matrices si chaque matrice est associée à un nombre réel non négatif ‖ UNE ‖ (\displaystyle \|A\|), appelé sa norme, de sorte que

Dans le cas de matrices carrées (c'est-à-dire m = n), les matrices peuvent être multipliées sans quitter l'espace, et donc les normes dans ces espaces satisfont généralement également à la propriété sous-multiplicativité :

La sous-multiplicativité peut également être remplie pour les normes des matrices non carrées, mais définie pour plusieurs tailles requises à la fois. A savoir, si A est une matrice  ×  m, et B est la matrice m ×  n, Que UN B- matrice  ×  n .

Normes des opérateurs

Une classe importante de normes matricielles est normes des opérateurs, aussi appelé subordonnés ou induit . La norme de l'opérateur est construite de manière unique à l'aide de deux normes définies dans et , basée sur le fait que toute matrice m ×  n représenté par un opérateur linéaire de K n (\style d'affichage K^(n)) V K m (\style d'affichage K^(m)). Spécifiquement,

‖ UNE ‖ = sup ( ‖ UNE x ‖ : x ∈ K n , ‖ x ‖ = 1 ) = sup ( ‖ UNE x ‖ ‖ x ‖ : x ∈ K n , x ≠ 0 ) . (\displaystyle (\begin(aligned)\|A\|&=\sup\(\|Ax\|:x\in K^(n),\ \|x\|=1\)\\&=\ sup \left\((\frac (\|Ax\|)(\|x\|)):x\in K^(n),\ x\neq 0\right\).\end(aligned)))

À condition que les normes soient spécifiées de manière cohérente sur les espaces vectoriels, une telle norme est sous-multiplicative (voir).

Exemples de normes d'opérateur

Propriétés de la norme spectrale :

  1. La norme spectrale d'un opérateur est égale à la valeur singulière maximale de cet opérateur.
  2. La norme spectrale d'un opérateur normal est égale à la valeur absolue de la valeur propre modulo maximale de cet opérateur.
  3. La norme spectrale ne change pas lorsque la matrice est multipliée par une matrice orthogonale (unitaire).

Normes non-opérateurs des matrices

Il existe des normes matricielles qui ne sont pas des normes d’opérateur. Le concept de normes matricielles non-opérateurs a été introduit par Yu. I. Lyubich et étudié par G. R. Belitsky.

Exemple de norme non-opérateur

Par exemple, considérons deux normes d'opérateur différentes ‖ UNE ‖ 1 (\displaystyle \|A\|_(1)) Et ‖ UNE ‖ 2 (\displaystyle \|A\|_(2)), par exemple les normes de lignes et de colonnes. Créons une nouvelle norme ‖ UNE ‖ = m une x (‖ UNE ‖ 1 , ‖ UNE ‖ 2) (\displaystyle \|A\|=max(\|A\|_(1),\|A\|_(2))). La nouvelle norme a une propriété circulaire ‖ A B ‖ ≤ ‖ A ‖ ‖ B ‖ (\displaystyle \|AB\|\leq \|A\|\|B\|), préserve l'unité ‖ Je ‖ = 1 (\displaystyle \|I\|=1) et n'est pas opérateur.

Exemples de normes

Vecteur p (style d'affichage p)-norme

Peut être considéré m × n (\ displaystyle m \ times n) matrice comme vecteur de taille m n (\style d'affichage mn) et utilisez les normes vectorielles standard :

‖ UNE ‖ p = ‖ v e c (UNE) ‖ p = (∑ je = 1 m ∑ j = 1 n | une je j | p) 1 / p (\displaystyle \|A\|_(p)=\|\mathrm ( vec) (A)\|_(p)=\left(\sum _(i=1)^(m)\sum _(j=1)^(n)|a_(ij)|^(p)\ à droite) ^ (1/p))

Norme de Frobenius

Norme de Frobenius, ou norme euclidienne représente un cas particulier de la norme p pour p = 2 : ‖ UNE ‖ F = ∑ je = 1 m ∑ j = 1 n a je j 2 (\displaystyle \|A\|_(F)=(\sqrt (\sum _(i=1)^(m)\sum _(j =1)^(n)a_(ij)^(2)))).

La norme de Frobenius est facile à calculer (comparée par exemple à la norme spectrale). Possède les propriétés suivantes :

‖ UNE X ‖ 2 2 = ∑ je = 1 m | ∑ j = 1 n une je j X j | 2 ≤ ∑ je = 1 m (∑ j = 1 n | une je j | 2 ∑ j = 1 n | x j | 2) = ∑ j = 1 n | xj | 2 ‖ UNE ‖ F 2 = ‖ UNE ‖ F 2 ‖ x ‖ 2 2 . (\displaystyle \|Ax\|_(2)^(2)=\sum _(i=1)^(m)\left|\sum _(j=1)^(n)a_(ij)x_( j)\right|^(2)\leq \sum _(i=1)^(m)\left(\sum _(j=1)^(n)|a_(ij)|^(2)\sum _(j=1)^(n)|x_(j)|^(2)\right)=\somme _(j=1)^(n)|x_(j)|^(2)\|A\ |_(F)^(2)=\|A\|_(F)^(2)\|x\|_(2)^(2).)
  • Sous-multiplicativité: ‖ A B ‖ F ≤ ‖ A ‖ F ‖ B ‖ F (\displaystyle \|AB\|_(F)\leq \|A\|_(F)\|B\|_(F)), parce que ‖ UN B ‖ F 2 = ∑ je , j | ∑ k une je k b k j | 2 ≤ ∑ je , j (∑ k | une je k | | b k j |) 2 ≤ ∑ je , j (∑ k | une je k | 2 ∑ k | b k j | 2) = ∑ je , k | un je k | 2 ∑ k , j | b k j | 2 = ‖ A ‖ F 2 ‖ B ‖ F 2 (\displaystyle \|AB\|_(F)^(2)=\sum _(i,j)\left|\sum _(k)a_(ik) b_(kj)\right|^(2)\leq \sum _(i,j)\left(\sum _(k)|a_(ik)||b_(kj)|\right)^(2)\ leq \sum _(i,j)\left(\sum _(k)|a_(ik)|^(2)\sum _(k)|b_(kj)|^(2)\right)=\sum _(i,k)|a_(ik)|^(2)\sum _(k,j)|b_(kj)|^(2)=\|A\|_(F)^(2)\| B\|_(F)^(2)).
  • ‖ UNE ‖ F 2 = t r ⁡ UNE ∗ UNE = t r ⁡ UNE UNE ∗ (\displaystyle \|A\|_(F)^(2)=\mathop (\rm (tr)) A^(*)A=\ mathop (\rm (tr)) AA^(*)), Où t r ⁡ UNE (\displaystyle \mathop (\rm (tr)) A)- trace matricielle UNE (style d'affichage A), UNE ∗ (\displaystyle A^(*))- Matrice hermitienne conjuguée.
  • ‖ UNE ‖ F 2 = ρ 1 2 + ρ 2 2 + ⋯ + ρ n 2 (\displaystyle \|A\|_(F)^(2)=\rho _(1)^(2)+\rho _ (2)^(2)+\points +\rho _(n)^(2)), Où ρ 1 , ρ 2 , … , ρ n (\displaystyle \rho _(1),\rho _(2),\dots,\rho _(n))- nombres singuliers de la matrice UNE (style d'affichage A).
  • ‖ UNE ‖ F (\displaystyle \|A\|_(F)) ne change pas lorsque la matrice est multipliée UNE (style d'affichage A) gauche ou droite dans des matrices orthogonales (unitaires).

Module maximal

La norme de module maximum est un autre cas particulier de la norme p pour p = ∞ .

‖ UNE ‖ max = max ( | a i j | ) . (\displaystyle \|A\|_(\text(max))=\max\(|a_(ij)|\).)

Norma Schatten

Cohérence des normes matricielles et vectorielles

Norme matricielle ‖ ⋅ ‖ a b (\displaystyle \|\cdot \|_(ab)) sur K m × n (\displaystyle K^(m\times n)) appelé convenu avec des normes ‖ ⋅ ‖ une (\displaystyle \|\cdot \|_(a)) sur K n (\style d'affichage K^(n)) Et ‖ ⋅ ‖ b (\displaystyle \|\cdot \|_(b)) sur K m (\style d'affichage K^(m)), Si:

‖ UNE X ‖ b ≤ ‖ UNE ‖ une b ‖ x ‖ une (\displaystyle \|Ax\|_(b)\leq \|A\|_(ab)\|x\|_(a))

pour toute A ∈ K m × n , x ∈ K n (\displaystyle A\in K^(m\times n),x\in K^(n)). La norme de l'opérateur, par construction, est cohérente avec la norme vectorielle d'origine.

Exemples de normes matricielles coordonnées mais non subordonnées :

Equivalence des normes

Toutes les normes dans l'espace K m × n (\displaystyle K^(m\times n))équivalent, c'est-à-dire pour deux normes quelconques » . ‖ α (\displaystyle \|.\|_(\alpha )) Et » . ‖ β (\displaystyle \|.\|_(\beta )) et pour toute matrice A ∈ K m × n (\displaystyle A\in K^(m\times n)) la double inégalité est vraie.

Norme matricielle Appelons le nombre réel attribué à cette matrice ||A|| tel celui qui, en tant que nombre réel, est associé à chaque matrice de l'espace à n dimensions et satisfait 4 axiomes :

1. ||A||³0 et ||A||=0, seulement si A est une matrice nulle ;

2. ||αA||=|α|·||A||, où un R ;

3. ||A+B||£||A||+||B||;

4. ||A·B||£||A||·||B||. (propriété de multiplicativité)

La norme des matrices peut être introduite de différentes manières. La matrice A peut être considérée comme n 2 - vecteur dimensionnel.

Cette norme est appelée norme euclidienne de la matrice.

Si pour toute matrice carrée A et tout vecteur x dont la dimension est égale à l'ordre de la matrice, l'inégalité ||Ax||£||A||·||x|| est satisfaite,

alors on dit que la norme de la matrice A est cohérente avec la norme du vecteur. Notez qu'à gauche dans la dernière condition se trouve la norme du vecteur (Ax est un vecteur).

Diverses normes matricielles sont cohérentes avec une norme vectorielle donnée. Choisissons le plus petit d'entre eux. Ce sera le cas

Cette norme matricielle est subordonnée à une norme vectorielle donnée. L'existence d'un maximum dans cette expression découle de la continuité de la norme, puisqu'il existe toujours un vecteur x -> ||x||=1 et ||Ax||=||A||.

Montrons que la norme N(A) n’est soumise à aucune norme vectorielle. Les normes matricielles, subordonnées aux normes vectorielles introduites précédemment, s'expriment comme suit :

1. ||UNE|| ¥ = |a ij | (norme-maximum)

2. ||UNE|| 1 = |a je | (norme-somme)

3. ||UNE|| 2 = , (norme spectrale)

où s 1 est la plus grande valeur propre de la matrice symétrique A¢A, qui est le produit des matrices transposées et originales. Puisque la matrice A¢A est symétrique, alors toutes ses valeurs propres sont réelles et positives. Le nombre l est une valeur propre, et un vecteur x non nul est un vecteur propre de la matrice A (s'ils sont liés entre eux par la relation Ax=lx). Si la matrice A elle-même est symétrique, A¢ = A, alors A¢A = A 2 et alors s 1 = , où est la plus grande valeur propre absolue de la matrice A. Par conséquent, dans ce cas nous avons = .

Les valeurs propres d'une matrice ne dépassent aucune de ses normes cohérentes. En normalisant la relation qui détermine les valeurs propres, on obtient ||λx||=||Ax||, |λ|·||x||=||Ax||£||A||·||x||, |λ| £||A||

Depuis ||A|| 2 £||A|| e, où la norme euclidienne est calculée simplement, dans les estimations, au lieu de la norme spectrale, vous pouvez utiliser la norme euclidienne de la matrice.

30. Conditionnalité des systèmes d'équations. Coefficient de conditionnalité .

Degré de conditionnement- influence de la décision sur les données initiales. Hache = b: vecteur b correspond à la solution X. Laisser b changera en valeur. Alors le vecteur b+ la nouvelle solution correspondra x+ : A(x+ ) = b+. Puisque le système est linéaire, alors Hache+A =b+, Alors UN = ; = ; = ; b = Hache; = alors ; * , où est l'erreur relative de la perturbation de la solution, – facteur de conditionnementcond(A) (combien de fois l'erreur de solution peut augmenter), – perturbation relative du vecteur b. cond(A) = ; cond(A)* Propriétés du coefficient : dépend du choix de la norme matricielle ; cond( = cond(A); multiplier une matrice par un nombre n'affecte pas le coefficient de conditionnement. Plus le coefficient est grand, plus l'erreur dans les données sources affecte fortement la solution du SLAE. Le numéro de condition ne peut pas être inférieur à 1.

31. La méthode de balayage pour résoudre des systèmes d'équations algébriques linéaires.

Il est souvent nécessaire de résoudre des systèmes dont les matrices, étant faiblement remplies, c'est-à-dire contenant de nombreux éléments non nuls. Les matrices de tels systèmes ont généralement une certaine structure, parmi laquelle on distingue les systèmes avec des matrices à structure en ruban, c'est-à-dire en eux, les éléments non nuls sont situés sur la diagonale principale et sur plusieurs diagonales secondaires. Pour résoudre des systèmes avec des matrices bandes, la méthode gaussienne peut être transformée en méthodes plus efficaces. Considérons le cas le plus simple des systèmes à bandes, auquel, comme nous le verrons plus loin, se réduit la solution des problèmes de discrétisation des problèmes aux limites pour les équations différentielles par les méthodes des différences finies, des éléments finis, etc. la matrice est une matrice dans laquelle les éléments non nuls sont situés uniquement sur la diagonale principale et à côté de celle-ci :

Les trois matrices diagonales ont un total de (3n-2) éléments non nuls.

Redésignons les coefficients matriciels :

Ensuite, en notation par composants, le système peut être représenté comme suit :

UNE je * x je-1 + b je * x je + c je * x je+1 = ré je , je = 1, 2,…, n ; (7)

une 1 =0, c n =0. (8)

La structure du système suppose une relation uniquement entre inconnues voisines :

x je =x je * x je +1 +h je (9)

x i -1 =x i -1* x i + h i -1 et remplacer dans (7) :

UNE je (x je-1* x je + h je-1)+ b je * x je + c je * x je+1 = ré je

(a i * x i-1 + b i)x i = –c i * x i+1 +d i –a i * h i-1

En comparant l'expression résultante avec la représentation (7), nous obtenons :

Les formules (10) représentent des relations de récurrence pour calculer des coefficients de balayage. Ils nécessitent de définir des valeurs initiales. Conformément à la première condition (8) pour i =1 nous avons un 1 =0, ce qui signifie

Ensuite, les coefficients courants restants sont calculés et enregistrés selon les formules (10) pour i=2,3,..., n, et pour i=n, ​​​​en tenant compte de la deuxième condition (8), nous obtenons x n =0. Par conséquent, conformément à la formule (9) x n = h n.

Après cela, selon la formule (9), les inconnues x n -1, x n -2, ..., x 1 sont successivement trouvées. Cette étape de calcul est appelée course arrière, tandis que le calcul des coefficients de balayage est appelé course avant.

Pour une application réussie de la méthode de balayage, il est nécessaire que lors des calculs, il n'y ait pas de situations de division par zéro et qu'avec de grandes dimensions de systèmes, il n'y ait pas d'augmentation rapide des erreurs d'arrondi. Appelons ça une course correct, si le dénominateur des coefficients courants (10) ne disparaît pas, et durable, si ½x je ½<1 при всех i=1,2,…, n. Достаточные условия корректности и устойчивости прогонки, которые во многих приложениях выполняются, определяются теоремой.

Théorème. Soient les coefficients a i et c i de l'équation (7) pour i=2,3,..., n-1 différents de zéro et soit

½b je ½>½a je ½+½c je ½ pour i=1, 2,..., n. (onze)

Alors le balayage défini par les formules (10), (9) est correct et stable.

» Leçon 12. Rang matriciel. Calculer le rang d'une matrice. Norme des matrices

Leçon n°12. Rang matriciel. Calculer le rang d'une matrice. Norme des matrices.

Si tous les mineurs de la matriceUNcommandeksont égaux à zéro, alors tous les mineurs d'ordre k+1, s'ils existent, sont également égaux à zéro.
Rang matriciel UN est appelé le plus grand des ordres mineurs de la matrice UN , différent de zéro.
Le rang maximum peut être égal au nombre minimum de lignes ou de colonnes de la matrice, c'est-à-dire si la matrice a une taille de 4x5, alors le rang maximum sera 4.
Le rang minimum d'une matrice est de 1, sauf si vous avez affaire à une matrice nulle, où le rang est toujours nul.

Le rang d'une matrice carrée non singulière d'ordre n est égal à n, puisque son déterminant est mineur d'ordre n et est non nul pour une matrice non singulière.
Lorsqu’une matrice est transposée, son rang ne change pas.

Soit le rang de la matrice . Alors tout mineur d’ordre différent de zéro est appelé mineur de base.
Exemple. La matrice A est donnée.

Le déterminant de la matrice est nul.
Mineur du second ordre . Donc r(A)=2 et le mineur est basique.
La mineure de base est aussi la mineure .
Mineure , parce que =0, donc ce ne sera pas basique.
Exercice: vérifiez indépendamment quels autres mineurs du second ordre seront fondamentaux et lesquels ne le seront pas.

Trouver le rang d'une matrice en calculant tous ses mineurs nécessite trop de travail de calcul. (Le lecteur peut vérifier qu'il y a 36 mineurs du deuxième ordre dans une matrice carrée du quatrième ordre.) Par conséquent, un algorithme différent est utilisé pour trouver le rang. Pour le décrire, un certain nombre d'informations supplémentaires seront nécessaires.

Appelons sur eux les actions suivantes transformations élémentaires de matrices :
1) réarrangement des lignes ou des colonnes ;
2) multiplier une ligne ou une colonne par un nombre autre que zéro ;
3) ajouter à l'une des lignes une autre ligne multipliée par un nombre ou ajouter à l'une des colonnes une autre colonne multipliée par un nombre.

Lors des transformations élémentaires, le rang de la matrice ne change pas.
Algorithme de calcul du rang d'une matrice est similaire à l'algorithme de calcul du déterminant et consiste dans le fait qu'à l'aide de transformations élémentaires, la matrice est réduite à une forme simple dont il n'est pas difficile de trouver le rang. Comme le rang n'a pas changé lors de chaque transformation, en calculant le rang de la matrice transformée, on retrouve ainsi le rang de la matrice d'origine.

Supposons que nous devions calculer le rang d'une matrice de taille mXn.


À la suite des calculs, la matrice A1 a la forme


Si toutes les lignes à partir de la troisième sont nulles, alors , puisque mineur . Sinon, en réorganisant les lignes et les colonnes avec des nombres supérieurs à deux, on s'assure que le troisième élément de la troisième ligne est différent de zéro. Ensuite, en ajoutant la troisième ligne, multipliée par les nombres correspondants, aux lignes avec des nombres plus élevés, nous obtenons des zéros dans la troisième colonne, à partir du quatrième élément, etc.
À un moment donné, nous arriverons à une matrice dans laquelle toutes les lignes, à partir du (r+1)ème, sont égales à zéro (ou absentes pour ), et le mineur dans les premières lignes et les premières colonnes est le déterminant d'une relation triangulaire. matrice avec des éléments non nuls sur la diagonale. Le rang d'une telle matrice est égal à . Par conséquent, Rang(A)=r.

Dans l'algorithme proposé pour trouver le rang d'une matrice, tous les calculs doivent être effectués sans arrondi. Un changement arbitrairement petit dans au moins un des éléments des matrices intermédiaires peut conduire au fait que la réponse résultante différera du rang de la matrice d'origine de plusieurs unités.
Si les éléments de la matrice d'origine étaient des nombres entiers, il est alors pratique d'effectuer des calculs sans utiliser de fractions. Par conséquent, à chaque étape, il est conseillé de multiplier les lignes par de tels nombres afin qu'aucune fraction n'apparaisse lors des calculs.

En laboratoire et en travaux pratiques, nous considérerons un exemple de recherche du rang d'une matrice.

TROUVER UN ALGORITHME NORMES MATRICIELLES .
Il n'y a que trois normes de la matrice.
Première norme d'une matrice= le maximum des nombres obtenus en additionnant tous les éléments de chaque colonne, pris modulo.
Exemple : donnons une matrice A de taille 3x2 (Fig. 10). La première colonne contient les éléments : 8, 3, 8. Tous les éléments sont positifs. Trouvons leur somme : 8+3+8=19. La deuxième colonne contient les éléments : 8, -2, -8. Deux éléments sont négatifs, donc lors de l'addition de ces nombres, il est nécessaire de substituer le module de ces nombres (c'est-à-dire sans signe moins). Trouvons leur somme : 8+2+8=18. Le maximum de ces deux nombres est 19. Cela signifie que la première norme de la matrice est 19.


Graphique 10.

Deuxième norme de la matrice est la racine carrée de la somme des carrés de tous les éléments de la matrice. Cela signifie que nous mettons au carré tous les éléments de la matrice, puis ajoutons les valeurs résultantes et extrayons la racine carrée du résultat.
Dans notre cas, la norme 2 de la matrice s'est avérée être égale à la racine carrée de 269. Dans le diagramme, j'ai pris approximativement la racine carrée de 269 et le résultat était d'environ 16,401. Bien qu'il soit plus correct de ne pas extraire la racine.

Troisième norme de la matrice représente le maximum des nombres obtenus en additionnant tous les éléments de chaque ligne, pris modulo.
Dans notre exemple : la première ligne contient les éléments : 8, 8. Tous les éléments sont positifs. Trouvons leur somme : 8+8=16. La deuxième ligne contient les éléments : 3, -2. L'un des éléments est négatif, donc lors de l'addition de ces nombres, il faut substituer le module de ce nombre. Trouvons leur somme : 3+2=5. La troisième ligne contient les éléments 8 et -8. L'un des éléments est négatif, donc lors de l'addition de ces nombres, il faut substituer le module de ce nombre. Trouvons leur somme : 8+8=16. Le maximum de ces trois nombres est 16. Cela signifie que la troisième norme de la matrice est 16.

Compilé par : Saliy N.A.