Линейные отображения и операторы

Произведение матриц отображений

В геометрии изучаются различные отображения как на множествах точек, так и на множествах векторов: повороты, симметрии, переносы, проектирования и другие. Многие отображения могут быть заданы линейными формулами. Рассмотрим такие формулы.

Пусть одно векторное пространство отображается на другое. Если в каждом задан какой-то базис и этим определены координаты для каждого вектора, то линейные формулы будут выглядеть так: \[f\colon\left\{\begin{aligned} x' &= a_{11} x + a_{12} y\\ y' &= a_{21} x + a_{22} y \end{aligned}\right.\] Мы здесь предполагаем, что вектору \(\vec v\) с координатами \((x,y)\) устанавливается в соответствие вектор \(\vec v'\) с координатами \((x',y')\). Координаты \(\vec v'\) выражаются линейными формулами через координаты \(\vec v\). Координат могло быть и три, и четыре, и сколько угодно1 (в зависимости от числа векторов в базисах пространств).

Такие формулы записываются через умножение матриц: \[\begin{pmatrix} x'\\y' \end{pmatrix} =A \cdot \begin{pmatrix} x\\y \end{pmatrix}\] где матрица \(A = (a_{ij})\) составлена из коэффициентов формул, в точности как они записаны в них.

Или даже короче \[\vec v' = A \cdot \vec v\] где под \(\vec v\), \(\vec v'\) понимаются столбцы их координат.

Матрица \(A\) называется матрицей отображения \(f\).

Теперь вспомним про композицию отображений - один из способов умножать отображения: применение одного отображения вслед за другим, \((f \circ g) (x) = f(g(x))\). (мы предполагаем, что область прибытия \(g\) и область отправления \(f\) совпадают)

Если \(A=(a_{ij})\) - матрица отображения \(f\), \(B=(b_{ij})\) - матрица отображения \(g\), то:

\(f\colon \left\{\begin{aligned} x_1'' &= a_{11} x_1' + a_{12} x_2'\\ x_2'' &= a_{21} x_1' + a_{22} x_2' \end{aligned}\right.\) и \(g\colon \left\{\begin{aligned} x_1' &= b_{11} x_1 + b_{12} x_2\\ x_2' &= b_{21} x_1 + b_{22} x_2 \end{aligned}\right.\)

подставляем одно в другое,

\(f \circ g\colon \left\{\begin{aligned} x_1'' &= a_{11} (b_{11} x_1 + b_{12} x_2) + a_{12} (b_{21} x_1 + b_{22} x_2)\\ x_2'' &= a_{21} (b_{11} x_1 + b_{12} x_2) + a_{22} (b_{21} x_1 + b_{22} x_2) \end{aligned}\right.\)

\(f \circ g\colon \left\{\begin{aligned} x_1'' &= (a_{11}b_{11} + a_{12}b_{21}) x_1 + (a_{11}b_{12} + a_{12}b_{22}) x_2\\ x_2'' &= (a_{21}b_{11} + a_{22}b_{21}) x_1 + (a_{21}b_{12} + a_{22}b_{22}) x_2 \end{aligned}\right.\)

Матрица \(C\) отображения \(f \circ g\) записывается как \(C = (c_{ij})\), \(c_{ij} = \sum_{k} a_{ik}b_{ki}\).

Эта матрица \(C\) называется произведением матриц \(A\) и \(B\): \[C = A \cdot B\]

Теорема. Матрицей композиции двух линейных отображений является произведение матриц этих отображений.

Матрица линейного отображения

Отображения, которые задаются линейными формулами, обладают свойствами: \(f(\vec u + \vec v) = f(\vec u) + f(\vec v)\) и \(f(\lambda \vec u) = \lambda f(\vec u)\)

Всякое отображение \(f\), которое обладает этими свойствами, называется линейным отображением пространства.

По причине связи с матрицами линейное отображение и его матрица будут использоваться как синонимы.

Кроме этого, линейное отображение некоторого векторного пространства само в себя называется линейным оператором. Оно всегда обладает квадратной матрицей (область отправления = область прибытия и координат поровну).

Какой геометрический смысл у матрицы такого отображения?

Чтобы говорить о координатах векторов должен быть выбран базис. Обозначим базисные векторы через \(\vec e_i\) и посмотрим как на них действует линейное отображение \(f\) с матрицей \(A = (a_{ij})\): \(f(\vec e_i) = A \cdot \vec e_i\), где \(\vec e_i\) - столбец координат \(\vec e_i\). Но вектор \(\vec e_i = 1 \cdot \vec e_i\) имеет координаты с нулями везде, кроме \(i\)-ой позиции (где 1). Поэтому \(f(\vec e_i) = A \cdot \vec e_i = \begin{pmatrix} a_{1i}\\a_{2i}\\\vdots\\a_{ni} \end{pmatrix}\).

Теорема. В столбцах матрицы линейного отображения записаны координаты образов базисных векторов.

Теорема. Линейный оператор является сюръективным, если его матрица имеет отличный от нуля определитель.

Собственные числа и векторы

Ненулевой вектор \(\vec v\) называется собственным вектором линейного оператора \(f\) с матрицей \(A\), если \(f(\vec v) = A \cdot \vec v = \lambda \vec v\) для некоторого числа \(\lambda\). Число \(\lambda\) при этом называется собственным числом и говорят, что вектор \(\vec v\) принадлежит собственному числу \(\lambda\).

Для того, чтобы найти собственный вектор сначала ищут собственное число. Определение \(A \cdot \vec v = \lambda \vec v\) переписывается к виду системы: \(A \vec v - \lambda \vec v = A \vec v - \lambda E \vec v = (A - \lambda E) \vec v = \vec 0\). Это система однородных линейных уравнений относительно \(\vec v\) с матрицей системы \(A - \lambda E\). Она имеет ненулевое решение \(\vec v\) при условии: \[|A - \lambda E| = 0\] После расписывания определителя получаем алгебраическое уравнение от \(\lambda\). Это уравнение называется характеристическим уравнением и позволяет (или не позволяет, если степень уравнения большая) найти числа \(\lambda\). С использованием их ищутся затем векторы \(\vec v\).

Собственные векторы, которые принадлежат разным собственным числам, являются линейно независимыми.

Пусть, к примеру, оператор с матрицей \(A\) имеет максимальное количество собственных чисел: для матрицы \(n \times n\) это \(n\) штук \(\lambda_1, \ldots, \lambda_n\) и их векторы \(\vec v_1, \ldots, \vec v_n\).

Предположим, от противного, что \(\vec v_1, \ldots, \vec v_n\) линейно зависимы. Составим линейную комбинацию \(\alpha_1 \vec v_1 + \ldots + \alpha_{n-1} \vec v_{n-1} + \alpha_n \vec v_n = \vec 0\), где \(\alpha_1 \neq 0\). После умножения на \(A\) получим \(\alpha_1 \lambda_1 \vec v_1 + \ldots + \alpha_{n-1} \lambda_{n-1} \vec v_{n-1} + \alpha_n \lambda_n \vec v_n = \vec 0\). Умножим первое равенство на \(-\lambda_n\) и сложим со вторым: \(\alpha_1 (\lambda_1 - \lambda_n) \vec v_1 + \ldots + \alpha_{n-1} (\lambda_{n-1} - \lambda_{n}) \vec v_{n-1} = \vec 0\). Получается \(\vec v_1, \ldots, \vec v_{n-1}\) линейно зависимы. Продолжая так далее мы придем к выводу, что линейно зависим и набор лишь из двух векторов \(\vec v_1, \vec v_2\), что очевидно является противоречием2.

Ортогональные линейные операторы и их матрица


  1. Мы посмотрим двухмерный случай, с двумя координатам, для краткости, но трехмерный или \(n\)-мерный вариант во всем аналогичен.↩︎

  2. Они не могут быть пропорциональны: \(\vec v_1 = \alpha \vec v_2\) влечет \(\lambda_1 \vec v_1 = \lambda_1 (\alpha \vec v_2)\) с одной стороны и \(\lambda_1 \vec v_1 = \alpha (\lambda_2 \vec v_2)\) с другой.↩︎