В геометрии изучаются различные отображения как на множествах точек, так и на множествах векторов: повороты, симметрии, переносы, проектирования и другие. Многие отображения могут быть заданы линейными формулами. Рассмотрим такие формулы.
Пусть одно векторное пространство отображается на другое. Если в каждом задан какой-то базис и этим определены координаты для каждого вектора, то линейные формулы будут выглядеть так: \[f\colon\left\{\begin{aligned} x' &= a_{11} x + a_{12} y\\ y' &= a_{21} x + a_{22} y \end{aligned}\right.\] Мы здесь предполагаем, что вектору \(\vec v\) с координатами \((x,y)\) устанавливается в соответствие вектор \(\vec v'\) с координатами \((x',y')\). Координаты \(\vec v'\) выражаются линейными формулами через координаты \(\vec v\). Координат могло быть и три, и четыре, и сколько угодно1 (в зависимости от числа векторов в базисах пространств).
Такие формулы записываются через умножение матриц: \[\begin{pmatrix} x'\\y' \end{pmatrix} =A \cdot \begin{pmatrix} x\\y \end{pmatrix}\] где матрица \(A = (a_{ij})\) составлена из коэффициентов формул, в точности как они записаны в них.
Или даже короче \[\vec v' = A \cdot \vec v\] где под \(\vec v\), \(\vec v'\) понимаются столбцы их координат.
Матрица \(A\) называется матрицей отображения \(f\).
Теперь вспомним про композицию отображений - один из способов умножать отображения: применение одного отображения вслед за другим, \((f \circ g) (x) = f(g(x))\). (мы предполагаем, что область прибытия \(g\) и область отправления \(f\) совпадают)
Если \(A=(a_{ij})\) - матрица отображения \(f\), \(B=(b_{ij})\) - матрица отображения \(g\), то:
\(f\colon \left\{\begin{aligned} x_1'' &= a_{11} x_1' + a_{12} x_2'\\ x_2'' &= a_{21} x_1' + a_{22} x_2' \end{aligned}\right.\) и \(g\colon \left\{\begin{aligned} x_1' &= b_{11} x_1 + b_{12} x_2\\ x_2' &= b_{21} x_1 + b_{22} x_2 \end{aligned}\right.\)
подставляем одно в другое,
\(f \circ g\colon \left\{\begin{aligned} x_1'' &= a_{11} (b_{11} x_1 + b_{12} x_2) + a_{12} (b_{21} x_1 + b_{22} x_2)\\ x_2'' &= a_{21} (b_{11} x_1 + b_{12} x_2) + a_{22} (b_{21} x_1 + b_{22} x_2) \end{aligned}\right.\)
\(f \circ g\colon \left\{\begin{aligned} x_1'' &= (a_{11}b_{11} + a_{12}b_{21}) x_1 + (a_{11}b_{12} + a_{12}b_{22}) x_2\\ x_2'' &= (a_{21}b_{11} + a_{22}b_{21}) x_1 + (a_{21}b_{12} + a_{22}b_{22}) x_2 \end{aligned}\right.\)
Матрица \(C\) отображения \(f \circ g\) записывается как \(C = (c_{ij})\), \(c_{ij} = \sum_{k} a_{ik}b_{ki}\).
Эта матрица \(C\) называется произведением матриц \(A\) и \(B\): \[C = A \cdot B\]
Теорема. Матрицей композиции двух линейных отображений является произведение матриц этих отображений.
Отображения, которые задаются линейными формулами, обладают свойствами: \(f(\vec u + \vec v) = f(\vec u) + f(\vec v)\) и \(f(\lambda \vec u) = \lambda f(\vec u)\)
Всякое отображение \(f\), которое обладает этими свойствами, называется линейным отображением пространства.
По причине связи с матрицами линейное отображение и его матрица будут использоваться как синонимы.
Кроме этого, линейное отображение некоторого векторного пространства само в себя называется линейным оператором. Оно всегда обладает квадратной матрицей (область отправления = область прибытия и координат поровну).
Какой геометрический смысл у матрицы такого отображения?
Чтобы говорить о координатах векторов должен быть выбран базис. Обозначим базисные векторы через \(\vec e_i\) и посмотрим как на них действует линейное отображение \(f\) с матрицей \(A = (a_{ij})\): \(f(\vec e_i) = A \cdot \vec e_i\), где \(\vec e_i\) - столбец координат \(\vec e_i\). Но вектор \(\vec e_i = 1 \cdot \vec e_i\) имеет координаты с нулями везде, кроме \(i\)-ой позиции (где 1). Поэтому \(f(\vec e_i) = A \cdot \vec e_i = \begin{pmatrix} a_{1i}\\a_{2i}\\\vdots\\a_{ni} \end{pmatrix}\).
Теорема. В столбцах матрицы линейного отображения записаны координаты образов базисных векторов.
Теорема. Линейный оператор является сюръективным, если его матрица имеет отличный от нуля определитель.
Ненулевой вектор \(\vec v\) называется собственным вектором линейного оператора \(f\) с матрицей \(A\), если \(f(\vec v) = A \cdot \vec v = \lambda \vec v\) для некоторого числа \(\lambda\). Число \(\lambda\) при этом называется собственным числом и говорят, что вектор \(\vec v\) принадлежит собственному числу \(\lambda\).
Для того, чтобы найти собственный вектор сначала ищут собственное число. Определение \(A \cdot \vec v = \lambda \vec v\) переписывается к виду системы: \(A \vec v - \lambda \vec v = A \vec v - \lambda E \vec v = (A - \lambda E) \vec v = \vec 0\). Это система однородных линейных уравнений относительно \(\vec v\) с матрицей системы \(A - \lambda E\). Она имеет ненулевое решение \(\vec v\) при условии: \[|A - \lambda E| = 0\] После расписывания определителя получаем алгебраическое уравнение от \(\lambda\). Это уравнение называется характеристическим уравнением и позволяет (или не позволяет, если степень уравнения большая) найти числа \(\lambda\). С использованием их ищутся затем векторы \(\vec v\).
Собственные векторы, которые принадлежат разным собственным числам, являются линейно независимыми.
Пусть, к примеру, оператор с матрицей \(A\) имеет максимальное количество собственных чисел: для матрицы \(n \times n\) это \(n\) штук \(\lambda_1, \ldots, \lambda_n\) и их векторы \(\vec v_1, \ldots, \vec v_n\).
Предположим, от противного, что \(\vec v_1, \ldots, \vec v_n\) линейно зависимы. Составим линейную комбинацию \(\alpha_1 \vec v_1 + \ldots + \alpha_{n-1} \vec v_{n-1} + \alpha_n \vec v_n = \vec 0\), где \(\alpha_1 \neq 0\). После умножения на \(A\) получим \(\alpha_1 \lambda_1 \vec v_1 + \ldots + \alpha_{n-1} \lambda_{n-1} \vec v_{n-1} + \alpha_n \lambda_n \vec v_n = \vec 0\). Умножим первое равенство на \(-\lambda_n\) и сложим со вторым: \(\alpha_1 (\lambda_1 - \lambda_n) \vec v_1 + \ldots + \alpha_{n-1} (\lambda_{n-1} - \lambda_{n}) \vec v_{n-1} = \vec 0\). Получается \(\vec v_1, \ldots, \vec v_{n-1}\) линейно зависимы. Продолжая так далее мы придем к выводу, что линейно зависим и набор лишь из двух векторов \(\vec v_1, \vec v_2\), что очевидно является противоречием2.
Мы посмотрим двухмерный случай, с двумя координатам, для краткости, но трехмерный или \(n\)-мерный вариант во всем аналогичен.↩︎
Они не могут быть пропорциональны: \(\vec v_1 = \alpha \vec v_2\) влечет \(\lambda_1 \vec v_1 = \lambda_1 (\alpha \vec v_2)\) с одной стороны и \(\lambda_1 \vec v_1 = \alpha (\lambda_2 \vec v_2)\) с другой.↩︎