Nous verrons dans cet article le théorème de Cayley-Hamilton, il tient une place très importante en algèbre linéaire.
Prérequis
Énoncé du théorème
Soit u \in L(V) un endomorphisme, de polynôme caractéristique \chi_u \in \mathbb K[X], on a :
\chi_u(u) = 0 \in L(V)
Plus généralement, soit U \in M_n(A) une matrice à coefficients dans un anneau commutatif unitaire A, on a :
\chi_U(U) = 0 \in M_n(A)
Mauvaise démonstration :
Notons U la matrice de l’endomorphisme u pour une base quelconque fixée, ou de la même manière une matrice à coefficients dans un anneau. Par définition du polynôme caractéristique,
\chi_u(X) = \det(XI_n - U)
Alors,
\chi_u(U) = \det(UI_n - U) = \det(U-U) = \det(0) = 0.
Et voilà fin ! On peut passer à la partie exerc… Non attendez, ça ne va absolument pas, il y a une erreur dans cette démonstration en effet le passage suivant est incorrect.
\chi_u(U) = \det(\boxed{UI_n } - U)
L’inconnue X des polynômes ne peut pas être remplacée à cet endroit par une matrice. L’inconnue X prend le rôle d’un scalaire et la multiplication permise ici est un produit entre scalaire et matrice I_n, on obtient l’élément suivant :
XI_n = \begin{pmatrix} X&&&\\ &X&&\\&&\ddots&\\&&&X \end{pmatrix} \in M_n(K[X]).
On voit bien que l’on ne peut pas remplacer directement l’inconnue par la matrice. Sans que nous le précisions, le déterminant utilisé ici est celui de M_n[ \mathbb K[X]] \to \mathbb K[X] ou encore à inconnu fixé M_n(\mathbb K) \to \mathbb K. Pour démontrer le théorème de Cayley-Hamilton, il va falloir travailler.
Vraie démonstration du théorème
Nous utilisons d’abord une petite remarque sur le polynôme caractéristique d’une matrice, celui-ci est toujours unitaire et de degré n = \dim(V) . On peut retrouver ceci à partir de la formule du déterminant, et de l’allure de la matrice.
\det(M) = \sum_{\sigma \in S_n} \varepsilon(\sigma)\prod_{i=1}^n m_{i,\sigma(i)} \\ \\ XI_n - U = \begin{pmatrix} X - u_{1,1} & -u_{1,2} & \dots& -u_{1,n} \\ - u_{2,1} & X-u_{2,2}&&\\ \vdots &&\ddots\\ -u_{n,1} &&& X-u_{n,n} \end{pmatrix}.
Le terme de plus haut degré dans la somme du calcul du déterminant correspond au produit de la permutation parcourant le plus de coefficients du plus grand degré possible. C’est-à-dire la diagonale désignée par la permutation neutre. Elle est unique de plus haut degré.
\prod_{i=1}^n m_{i,i} = \prod_{i=1}^n(X - u_{i,i}) = X^n + ...
Le polynôme caractéristique est unitaire de degré n = \dim(V). On va l’exprimer sous la forme d’une somme.
\chi_u(X) = X^n + \sum_{i=0}^{n-1} a_iX^i
Nous aurons besoin de la formule portant sur la comatrice,
M^t comat(M) = \det(M)I_n \text{ , } \\ \text{pour } M = XI_n - U \\ \begin{align} (XI_n - U)^t comat(XI_n - U) = \det(XI_n - U)I_n \ \ \end{align} \\ = \chi_u(X)I_n.
Rappelons les formules de Laplace dans notre cas particulier, nous devons détailler un peu la forme de la comatrice.
comat(M)_{i,j} =(-1)^{i+j}\det(M_{\widehat{i},\widehat{j}}) \\
où M_{\widehat{i},\widehat{j}} désigne la matrice carrée issue de M diminuer de la ligne i et colonne j.
Dans notre cas, que se passe-t-il si l’on supprime une ligne et colonne de la matrice XI_n - U
\begin{pmatrix} X - u_{1,1} & -u_{1,2} & \dots& -u_{1,n} \\ - u_{2,1} & X-u_{2,2}&&\\ \vdots &&\ddots\\ -u_{n,1} &&& X-u_{n,n} \end{pmatrix}
Situation n°1, i = j, le coefficient comat(XI_n-U)_{i,i} est exactement le polynôme caractéristique de la sous-matrice M_{\widehat{i},\widehat{i}} multiplié par un coefficient (-1)^{i+j} = (-1)^{i+i} = 1. C’est-à-dire juste un polynôme unitaire de degré n-1.
Situation n°2, i \ne j, alors la ligne i et la colonne j n’intersecte pas la diagonale au même endroit, deux inconnus X sont retirées de la matrice M_{\widehat{i},\widehat{j}} . Le déterminant de celle-ci étant donné la formule du déterminant n’est pas plus grand que n-2 .
En résumé, comat(XI_n - U), possède sur la diagonale des polynômes unitaires de degré n-1, et en dehors de la diagonale des polynômes de degré au plus n-2. Il en va de même pour sa transposée. Si bien que l’on peut lui trouver une écriture:
^t comat(XI_n - U) = X^{n-1}I_n + \sum_{i=0}^{n-2}X^iA_i .
Pour certaines matrices A_i \in M_n[\mathbb K], comme dans l’exemple suivant.
\begin{pmatrix} X^2 + a_{1,1}X + b_{1,1} & a_{1,2}X + b_{1,2} & a_{1,3}X + b_{1,3} \\ a_{2,1}X + b_{2,1} & X^2 + a_{2,2}X + b_{2,2} & a_{2,3}X + b_{2,3} \\ a_{3,1}X + b_{3,1} & a_{3,2}X + b_{3,2} & X^2 + a_{3,3}X + b_{3,3} \\ \end{pmatrix} \\ = X^2\begin{pmatrix} 1&0&0\\ 0&1&0\\ 0&0&1\end{pmatrix} + X\begin{pmatrix} a_{1,1}& a_{1,2} & a_{1,3} \\ a_{2,1} & a_{2,2} & a_{2,3} \\ a_{3,1} & a_{3,2} & a_{3,3}\end{pmatrix} + \begin{pmatrix} b_{1,1}& b_{1,2} & b_{1,3} \\ b_{2,1} & b_{2,2} & b_{2,3} \\ b_{3,1} & b_{3,2} & b_{3,3}\end{pmatrix} \\ = X^2I_3 + XA + B
Et c’est bien le fait que l’on puisse trouver cette écriture qui nous fait avancer dans la démonstration. Réintroduisons cette écriture dans la formule (1)
\begin{align*} \chi_u(X)I_n & = (XI_n - U)^t comat(XI_n - U) \\ & = (XI_n - U)(X^{n-1}I_n + \sum_{i=0}^{n-2}X^iA_i) \\ & = X(X^{n-1}I_n + \sum_{i=0}^{n-2}X^iA_i) - U(X^{n-1}I_n + \sum_{i=0}^{n-2}X^iA_i) \\ & = X^{n}I_n + \sum_{i=0}^{n-2}X^{i+1}A_i - X^{n-1}U - \sum_{i=0}^{n-2}X^iUA_i \\ & = X^nI_n + X^{n-1}(A_{n-2} - U) + \sum_{i=1}^{n-2} X^i(A_{i-1}-UA_i) - UA_0 \\ & \text{Pour garder une écriture compacte, on pose } A_{-1} = 0 \text{ et } A_{n-1} = I_n \\ & = X^nI_n + X^{n-1}(A_{n-2} - UA_{n-1}) + \sum_{i=1}^{n-2} X^i(A_{i-1}-UA_i) + (A_{-1}- UA_0) \\ & = X^nI_n + \sum_{i=0}^{n-1} X^i(A_{i-1}-UA_i).\\ \end{align*}
Nous avons donné une écriture au polynôme caractéristique \chi_u(X) = X^n + \displaystyle \sum_{i=0}^{n-1} a_i X^i. On peut avancer et utiliser l’unicité de l’écriture.
\chi_u(X)I_n = X^nI_n + \sum_{i=0}^{n-1}a_iX^iI_n \\ = X^nI_n + \sum_{i=0}^{n-1} X^i(A_{i-1}-UA_i)\\ \Rightarrow \forall i \in \llbracket0,n-1 \rrbracket , (A_{i-1} - UA_i) = a_iI_n \\
Finalement,
\begin{align*} \chi_u(U) & = U^n + \sum_{i=0}^{n-1} a_iU^i \\ & = U^n+ \sum_{i=0}^{n-1} U^i(a_iI_n) \\ & = U^n+ \sum_{i=0}^{n-1} U^i (A_{i-1} - UA_i)\\ & = U^n+ \sum_{i=0}^{n-1} U^i A_{i-1} - \sum_{i=0}^{n-1} U^{i+1}A_i\text{ ( somme téléscopique) }\\ & = U^n- U^nA_{n-1} + U^0A_{-1} \\ & = U^n - U^nI_n + U^00 = 0. \end{align*}
Ce qui conclut la démonstration du théorème de Cayley-Hamilton