Перейти к содержимому
Матричное исчисление

Матричное исчисление

Программирование, как и прикладная математика, достаточно часто сталкивается с потребностью хранить и обрабатывать большие наборы чисел.  Какие существуют способы хранения упорядоченных данных? Один из ответов на этот вопрос — матрицы

Матрицей размера ‌m×n‌​ называют прямоугольную таблицу чисел, в которой m строк и n  столбцов:

‌$$A=(a_{ij})=\begin{bmatrix}a_{11}&a_{12} & ... & a_{1n}\cr a_{21}&a_{22}&...&a_{21}\cr ... & ... & ... & ...\cr a_{m1} & a_{m2} & ... & a_{mn} \end{bmatrix}$$

Каждый элемент матрицы имеет свой адрес — индексы, посредством которых происходит обращение к ним. Например, чтобы получить элемент, находящийся на пересечении  i-й строки и  j-го столбца из матрицы A мы записываем ‌\(a_{ij}\) .

Мы уже имели дело с подобными конструкциями, которые в программировании называют двумерными массивами или списками. По способу доступа к элементам они действительно схожи, но между ними есть существенное отличие. Массивы и списки — это структуры данных, которые используются для хранения информации. Матрица — это математический объект, с которым можно выполнять математические операции. Однако, как мы увидим далее, для хранения матриц в языках программирования используются и массивы и списки.

Сейчас мы сконцентрируемся на матрицах как на математических объектах и вспомним основные операции, которые можно с ними выполнять, и для чего они используются в математике.

Виды матриц

В первую очередь все матрицы мы можем разделить на несколько видов, опираясь на их форму и размер — количество строк и столбцов. Можно выделить следующие виды:

     1. Прямоугольная матрица — это наиболее общий вид матриц, который не предполагает каких-либо условий на размеры матрицы. Пример:

\begin{bmatrix}1&2&3\cr4&5&6\end{bmatrix} 

     2. Матричная строка — это матрица, у которой m = 1. Иными словами, она представлена единственной строкой. Иногда такие матрицы называют вектор-строкой. Пример:
\begin{bmatrix}4&2&6\end{bmatrix} 

     3. Матричный столбец — это матрица, у которой n = 1. Иными словами, это такая матрица, у которой в каждой строке ровно по одному элементу. Другое название таких матриц — вектор-столбец. Пример:
\begin{bmatrix}3\cr7\cr1\end{bmatrix} 

     4. Квадратная матрица — это матрица, у которой количество строк равно количеству столбцов m = n. Это число называют порядком матрицы. Пример:
\begin{bmatrix}1&2&3\cr4&5&6\cr3&1&7\end{bmatrix} 

Последний вид матриц, квадратные, примечателен тем, что среди них можно выделить ещё несколько типов. Чтобы их описать, введём ещё одно определение.

Главной диагональю, или просто диагональю, квадратной матрицы называется множество элементов, индексы строки и столбца которых совпадают.

$$A=(a_{ij})=\begin{bmatrix}a_{11}&...& ... &...\cr ...&a_{22}&...&...\cr ...&...&a_{33}&...\cr ...&...&...&a_{44}\end{bmatrix}$$

Аналогично можно ввести понятие побочной диагонали — в этом случае диагональ представлена множеством элементов, которые взяты начиная с верхнего право го угла матрицы и заканчивая в левом нижнем углу.

$$A=(a_{ij})=\begin{bmatrix} ... & ... & ... & a_{14} \cr ...&...&a_{23}&...\cr ...&a_{32}&...&...\cr a_{41}&...&...&...\end{bmatrix}$$

Именно относительно главной диагонали можно рассмотреть ещё несколько видов матриц:

     1. Верхнетреугольные матрицы — это матрицы, в которых элементы ниже главной диагонали равны нулю.
‌‌\begin{bmatrix}a_{11}&a_{12}& a_{13} &a_{14}\cr 0&a_{22}&a_{23}&a_{24}\cr 0 &0&a_{33}&a_{34}\cr 0&0&0&a_{44}\end{bmatrix} 

     2. Нижнетреугольные матрицы — это матрицы, в которых элементы выше главной диагонали равны нулю.
​\begin{bmatrix}a_{11}&0& 0 &0\cr a_{21}&a_{22}& 0 & 0 \cr a_{31} &a_{32}&a_{33}&0\cr a_{41}&a_{42}&a_{43}&a_{44}\end{bmatrix} 

     3. Диагональные матрицы — это матрицы, которые одновременно являются нижнетреугольными и верхнетреугольными. Иными словами, это матрицы, в которых элементы вне главной диагонали равны нулю.
​\begin{bmatrix}a_{11}&0& 0&0\cr 0&a_{22}&0&0\cr0&0&a_{33}&0\cr 0&0&0&a_{44}\end{bmatrix} 

     4. Также существует несколько специальных видов матриц — это нулевая и единичная матрица.

Нулевая матрица — это матрица произвольной размерности, в том числе и прямоугольная, все элементы которой равны нулю.
​\begin{bmatrix}0&0&0\cr0&0&0\cr0&0&0\end{bmatrix}
Единичная матрица — это квадратная диагональная матрица, на главной диагонали которой стоят единицы.
​\begin{bmatrix}1&2&3\cr4&1&6\cr3&9&1\end{bmatrix} 

Операции с матрицами

Для матриц, как и для множества других математических объектов, можно определить различные операции, аналогичные стандартным арифметическим действиям. Однако эти операции должны быть адаптированы с учётом специфических характеристик матриц.

Сложение матриц

Пусть у нас есть две матрицы ‌A‌ и ‌B‌ одинаковой размерности. Для этих матриц мы можем определить операцию сложения.

Суммой двух матриц A‌ и ‌B‌ одинаковой размерности называется матрица ‌C  того же размера, элементы которой получаются покомпонентным сложением соответствующих элементов матриц ‌A‌ и ‌B‌.

Для сложения матриц необходимо выполнить операцию поэлементного сложения, при которой каждый элемент результирующей матрицы равен сумме соответствующих элементов исходных матриц, расположенных на одинаковых позициях.

$$A + B = \begin{bmatrix}
a_{11} & a_{12} & ... &  a_{1n}\\
a_{21} & a_{22} & ... &  a_{2n}\\
... & ... & ... &  ...\\
a_{p1} & a_{p2} & ... &  a_{pn}\\
\end{bmatrix}+\begin{bmatrix}
b_{11} & b_{12} & ... &  b_{1n}\\
b_{21} & b_{22} & ... &  b_{2n}\\
... & ... & ... &  ...\\
b_{p1} & b_{p2} & ... &  b_{pn}\\
\end{bmatrix} = \begin{bmatrix}
a_{11} + b_{11} & a_{12} + b_{12}& ... &  a_{1n} + b_{1n} \\
a_{21} + b_{21} & a_{22} + b_{22}& ... &  a_{2n} + b_{2n} \\
... & ... & ... &  ...\\
a_{p1} + b_{p1} & a_{p2} + b_{p2}& ... &  a_{pn} + b_{pn} \\
\end{bmatrix}$$

Умножение на число

Помимо сложения, матрицы можно умножать на число. Принцип этой операции такой же — покомпонентный.

Матрица, полученная путём умножения матрицы A‌ на число ‌λ‌, составлена из элементов, которые получены умножением компонент матрицы ‌A‌ на число ‌λ‌.

$$λ‌ * A = \begin{bmatrix}
λ‌ * a_{11} & λ‌ * a_{12} & ... & λ‌ * a_{1n} \\
λ‌ * a_{21} & λ‌ * a_{22} & ... & λ‌ * a_{2n} \\
... & ... & ... &  ...\\
λ‌ * a_{p1} & λ‌ * a_{p2} & ... & λ‌ * a_{pn} \\
\end{bmatrix}$$

Благодаря умножению на число мы можем определить операцию вычитания матриц. Действительно, вычитание матриц ‌A‌ и ‌B‌ равносильно сложению матрицы ‌A‌ и матрицы ‌B‌, умноженной на −1.

$$A−B=A+(−1)⋅B‌$$

Произведение матриц

К сожалению, операция покомпонентного умножения матриц не является допустимой. Ниже представлено формальное определение произведения матриц.

Произведение матрицы A размерности m×n на матрицу B размерности n×k определяется как матрица C размерности m×k, элементы которой вычисляются следующим образом:

$$c_{ij} = \sum_{n}^{k=1}a_{ik}b_{kj}$$

Для упрощения понимания и запоминания данной формулы целесообразно воспользоваться правилом «строка на столбец». В соответствии с данным правилом, для определения элемента \(c_{ij}\) результирующей матрицы ( C ), необходимо зафиксировать ( i )-ю строку матрицы ( A ) и ( j )-й столбец матрицы ( B ). Затем следует выполнить попарное умножение соответствующих элементов этих строк и столбцов и произвести суммирование полученных произведений.

$$\begin{bmatrix} 1 & 2 \cr 3 & 4 \end{bmatrix} \times  \begin{bmatrix} 5 & 6 \cr 7 & 8 \end{bmatrix} = \begin{bmatrix} 1*5+2*7 & 1*6+2*8 \cr 3 * 5+4*7 & 3*6+4*8\end{bmatrix} =  \begin{bmatrix} 19 & 22 \cr 43 & 50 \end{bmatrix}$$

Произведение матриц обладает рядом особенностей:

  1. Не каждая пара матриц допускает операцию умножения. Для выполнения данной операции необходимо соблюдение следующего условия: количество столбцов матрицы, расположенной слева, должно быть равно количеству строк матрицы, расположенной справа. Это условие непосредственно вытекает из определения операции умножения матриц по правилу «строка на столбец».
  2. Одной из ключевых особенностей операции умножения матриц является её некоммутативность. В контексте арифметики чисел известно, что перестановка множителей не изменяет результат произведения. Однако данное свойство не применимо к матрицам. Если перемножить матрицы A и B в обратном порядке, результатом будет матрица, отличающаяся от первоначального произведения.

Транспонирование

Рассмотрим ещё одну операцию, которая является уже более специфической и определённой именно для матриц. Как и ранее, сначала приведём формальное определение этой операции.

Матрица ‌\(B=AT‌\) ‌ размерности ‌n×m‌ называется транспонированной матрицей к матрице ‌A‌, если их элементы связаны равенством

$$b_{ij}=a_{ji‌}$$

Операцию транспонирования можно представлять как зеркальное отражение матрицы от главной диагонали. При этом элементы, находившиеся в i-м столбце, теперь будут находиться в i-й строке, и наоборот. Рассмотрим пример:

$$A = \begin{bmatrix}
-1 & 2 & 4 &  0 & 7\\
3 & -5 & 24 & 9 & -3\\
-10 & -8 & -2 &  -4 & 11\\
\end{bmatrix}$$

$$A^T = \begin{bmatrix}
-1 & 3 & -10 \\
2 & -5 & 8 \\
4 & 24 & -2\\
0 & 9 & -4\\
7& -3 & 11\\
\end{bmatrix}$$​

Приведение к ступенчатому виду

Приведение матрицы к ступенчатому виду — это процесс преобразования матрицы в такую форму, где все элементы ниже главной диагонали и все элементы слева от первого ненулевого элемента в каждой строке равны нулю.

Для достижения ступенчатого вида матрицы применяются элементарные преобразования строк. Элементарные преобразования строк включают в себя:

  1. Перестановку двух строк.
  2. Умножение строки на ненулевое число.
  3. Прибавление к одной строке другой строки, умноженной на число.

Процесс приведения матрицы к ступенчатому виду состоит из последовательного выполнения элементарных преобразований строк до тех пор, пока не будет достигнут требуемый результат.
Вот как это можно сделать:

$$\begin{bmatrix}
1 & 2 & 3 &  -2\\
0 &-1  & 2 &  -7\\
0 & 0 & 9 &  -18\\
0 & 0 & \textbf{18} &  -54\\
\end{bmatrix} \rightarrow \begin{bmatrix}
1 & 2 & 3 &  -2\\
0 &-1  & 2 &  -7\\
0 & 0 & 1 &  -2\\
0 & 0 & 1 &  -3\\
\end{bmatrix} \rightarrow \begin{bmatrix}
1 & 2 & 3 &  -2\\
0 &-1  & 2 &  -7\\
0 & 0 & 1 &  -2\\
0 & 0 & 0 &  -1\\
\end{bmatrix}$$

Первая матрица не обладает свойством ступенчатости, так как элемент, расположенный ниже главной диагонали, не равен нулю. Для приведения матрицы к ступенчатому виду необходимо выполнить последовательность элементарных преобразований строк.

В качестве первого шага рекомендуется разделить третью строку на 9, а четвертую строку на 18, что является вторым элементарным преобразованием. После этого из последней строки следует вычесть третью строку, что приведет к обнулению элемента, ранее равного 18, и достижению требуемой ступенчатой структуры.

Приведение матрицы к ступенчатому виду имеет широкий спектр приложений в различных областях математики и наук, связанных с линейной алгеброй. Этот процесс является ключевым при решении систем линейных уравнений, вычислении определителя матрицы, а также при нахождении обратной матрицы.

Численные параметры матриц

Матрицы являются сложными структурами, которые в ряде задач оцениваются не по их содержанию, а по числовым характеристикам. Одной из таких характеристик является след матрицы, который определяется как сумма элементов главной диагонали. Следует отметить, что данная характеристика применима исключительно к квадратным матрицам. След матрицы играет важную роль в различных областях знаний, таких как теория графов, криптография, квантовая физика, экономика, машинное обучение и другие.

Еще одной ключевой характеристикой квадратных матриц является определитель (determinant, det). Этот параметр находит применение в геометрических вычислениях для определения площадей и объемов, в решении систем линейных уравнений, а также для оценки обратимости матрицы. Расчет определителя представляет собой сложную задачу, которая упрощается для матриц треугольного типа (верхнетреугольные, нижнетреугольные и диагональные матрицы). В этих случаях определитель вычисляется как произведение элементов главной диагонали.

$$detA = \begin{bmatrix}
2 & 7 & 4 &  9\\
0 & 1  & 6 & 3\\
0 & 0 & 8 & 5\\
0 & 0 & 0 &  10\\
\end{bmatrix} = 2*1*8*10 = 160$$

Если матрица устроена более сложным образом, то применяются другие формулы и подходы, разработанные для этой задачи.

Обратная матрица

В заключение рассмотрим важный аспект, связанный с матрицами, — обратимость. В математике обратимость определяется следующим образом. Рассмотрим простой пример на числах. Пусть дано число \( x = 2 \). Обратным к нему называется число \( x^{-1} \), которое при умножении на ( x ) дает единицу. В данном случае обратным числом к \( x = 2 \) является \( \frac{1}{2} \). Обратные числа существуют для всех ненулевых чисел, что является фундаментальным свойством действительных чисел.

Для матриц также определено произведение и существует аналог единицы — единичная матрица. Возникает вопрос: всегда ли существует матрица \( A^{-1} \), такая, что при умножении на матрицу \( A \) получается единичная матрица? Ответ: не всегда.

Матрица \( A \) считается обратимой, если её определитель отличен от нуля. В этом случае для матрицы \( A \) можно определить обратную матрицу \( A^{-1} \), такую, что их произведение равно единичной матрице.

$$A = \begin{pmatrix}
 3 & 4 \\
 5 & 7\\
\end{pmatrix}$$

$$A^{-1} = \begin{pmatrix}
7 & -4 \\
-5 & 3 \\
\end{pmatrix}$$

$$A*A^{-1} =  \begin{pmatrix}
1 & 0 \\
0 & 1 \\
\end{pmatrix}$$

Можно заметить, что, перечисляя операции с матрицами, мы не затронули деление. Действительно, матрицы нельзя делить друг на друга, но обратная матрица в некоторых случаях позволяет обойти это ограничение.

Обратная матрица применяется при решении систем линейных уравнений или даже матричных уравнений. Рассмотрим матричное уравнение следующего вида, в котором ‌\(A‌\) и ‌\(B‌\) — известные матрицы:

$$A*X = B$$

В этом уравнении неизвестная переменная ‌\(X‌\) — это не число, а целый набор чисел, то есть матрица. Чтобы её найти, мы можем всё уравнение умножить на обратную матрицу к матрице ‌\(A‌\).

$$A^{-1}*A*X = E*X = X$$

Тогда решение этого матричного уравнения можно найти по формуле

$$X = A^{-1}*B$$

Попробуем найти решение уравнения при конкретно заданных матрицах ‌A‌ и ‌B‌:

$$\begin{pmatrix}
1 & 3 & -5 \\
0 & 1 & 2 \\
0 & 0 & 1 \\
\end{pmatrix}\cdot X = \begin{pmatrix}
1 & 2 \\
3 & 4 \\
5 & 6 \\
\end{pmatrix}$$

Сначала найдём обратную матрицу к матрице ‌\(A‌\):

$$A^{-1} = \begin{pmatrix}
1 & -3 & 11 \\
0 & 1 & -2 \\
0 & 0 & 1 \\
\end{pmatrix}$$

Затем найдём само решение, умножив обратную матрицу ‌\(A^{-1‌}\) на матрицу ‌\(B‌\):

$$X = A^{-1}B = \begin{pmatrix}
1 & -3 & 11 \\
0 & 1 & -2 \\
0 & 0 & 1 \\
\end{pmatrix}\begin{pmatrix}
1 & 2 \\
3 & 4 \\
5 & 6 \\
\end{pmatrix}= \begin{pmatrix}
47 & 56 \\
-7 & -8 \\
5 & 6 \\
\end{pmatrix} $$

Заключение

Матрицы, представляющие собой сложные и порой противоречивые математические объекты, находят широкое применение в различных разделах математики. Они активно используются для решения прикладных задач, что подчеркивает их значимость в современной науке и технике.

Похожее инфо:

Понедельник, 21 апреля 2025 . Математика, Прикладная линейная алгебра 90
Матричное исчисление