En matemática, una matriz es un conjunto bidimensional de números. Dado que puede definirse tanto la suma como el producto de matrices, en mayor generalidad se dice que son elementos de un anillo. Una matriz se representa por medio de una letra mayúscula y sus elementos con la misma letra en minúscula con un doble subíndice donde el primero indica la fila y el segundo la columna a la que pertenece:
Los elementos individuales de una matriz x , se denotan a menudo por , donde el máximo valor de es , y el máximo valor de es . Siempre que la matriz tenga el mismo número de filas y de columnas que otra matriz, estas se pueden sumar o restar elemento por elemento.
Pueden sumarse, multiplicarse y descomponerse de varias formas, lo que también las hace un concepto clave en el campo del álgebra lineal.
Historia
Año | Acontecimiento |
---|---|
200 a. C. | En China los matemáticos usan series de números. |
1848 | J. J. Sylvester introduce el término «matriz». |
1858 | Cayley publica Memorias sobre la teoría de matrices. |
1878 | Frobenius demuestra resultados fundamentales en álgebra matricial. |
1925 | Heisenberg utiliza la teoría matricial en la mecánica cuántica |
El origen de las matrices es muy antiguo. Los cuadrados latinos y los cuadrados mágicos se estudiaron desde hace mucho tiempo. Un cuadrado mágico, 3 por 3, se registra en la literatura china hacia el 650 a. C.[2]
Es larga la historia del uso de las matrices para resolver ecuaciones lineales. Un importante texto matemático chino que proviene del año 300 a. C. a 200 a. C., Nueve capítulos sobre el Arte de las matemáticas (Jiu Zhang Suan Shu), es el primer ejemplo conocido de uso del método de matrices para resolver un sistema de ecuaciones simultáneas.[3] En el capítulo séptimo, "Ni mucho ni poco", el concepto de determinante apareció por primera vez, dos mil años antes de su publicación por el matemático japonés Seki Kōwa en 1683 y el matemático alemán Gottfried Leibniz en 1693.
Los «cuadrados mágicos» eran conocidos por los matemáticos árabes, posiblemente desde comienzos del s. VII d. C., quienes a su vez pudieron tomarlos de los matemáticos y astrónomos de la India, junto con otros aspectos de la matemática combinatoria. Todo esto sugiere que la idea provino de China. Los primeros «cuadrados mágicos» de orden 5 y 6 aparecieron en Bagdad en el año 983, en la Enciclopedia de la Hermandad de Pureza (Rasa'il Ihkwan al-Safa).[2]
Después del desarrollo de la teoría de determinantes por Seki Kowa y Leibniz para facilitar la resolución de ecuaciones lineales, a finales del siglo XVII, Gabriel Cramer presentó en 1750 la ahora denominada regla de Cramer. Carl Friedrich Gauss y Wilhelm Jordan desarrollaron la eliminación de Gauss-Jordan en el siglo XIX
Fue James Joseph Sylvester quien utilizó por primera vez el término «matriz» en 1848/1850.
En 1853, William Rowan Hamilton hizo algunos aportes a la teoría de matrices. Cayley introdujo en 1858 la notación matricial, como forma abreviada de escribir un sistema de m ecuaciones lineales con n incógnitas.
Cayley, Hamilton, Hermann Grassmann, Ferdinand Georg Frobenius, Olga Taussky-Todd y John von Neumann cuentan entre los matemáticos famosos que trabajaron sobre la teoría de las matrices. En 1925, Werner Heisenberg redescubre el cálculo matricial fundando una primera formulación de lo que iba a pasar a ser la mecánica cuántica. Se le considera a este respecto como uno de los padres de la mecánica cuántica.
Olga Taussky-Todd (1906-1995), durante la II Guerra Mundial, usó la teoría de matrices para investigar el fenómeno de inestabilidad aeroelastica llamado flameo.
Definición
Una matriz es un conjunto bidimensional de números (elementos de la matriz) ordenados en filas y columnas. A una matriz con filas y columnas se le denomina «matriz por » (escrito ) donde . El conjunto de las matrices de tamaño se representa como , donde es el cuerpo al cual pertenecen los elementos de la matriz.
Se dice que dos matrices son iguales si tienen el mismo tamaño (dimensión u orden) y los mismos elementos en las mismas posiciones. El elemento de una matriz que se encuentra en la fila ésima y la columna ésima se le llama elemento o elemento -ésimo de la matriz.
Dos matrices son iguales si los elementos correspondientes son iguales:
.
Para definir el concepto de matriz, el término "conjunto bidimensional" es útil, aunque poco formal, pero puede formalizarse usando el concepto de función. De este modo, una matriz de filas y columnas con entradas en un cuerpo es una función cuyo dominio es el conjunto de los pares ordenados , donde y , y cuyo codominio es . Con esta definición, la entrada es el valor de la función en el par ordenado .
Se denota a las matrices con letra mayúscula, mientras que se utiliza la correspondiente letra en minúsculas para denotar a las entradas de las mismas, con subíndices que refieren al número de fila y columna del elemento.[4] Por ejemplo, al elemento de una matriz de tamaño que se encuentra en la fila ésima y la columna ésima se le denota como , donde y .
Cuando se va a representar explícitamente una entrada la cual está indexada con un o un con dos cifras se introduce una coma entre el índice de filas y de columnas. Así por ejemplo, la entrada que está en la primera fila y la segunda columna de la matriz de tamaño se representa como mientras que la entrada que está en la fila número 23 y la columna 100 se representa como .
Además de utilizar letras mayúsculas para representar matrices, numerosos autores representan a las matrices con fuentes en negrita para distinguirlas de otros objetos matemáticos.[cita requerida] Así es una matriz, mientras que es un escalar en esa notación. Sin embargo esta notación generalmente se deja para libros y publicaciones, donde es posible hacer esta distinción tipográfica con facilidad. En otras notaciones se considera que el contexto es lo suficientemente claro como para no usar negritas.
Otra notación, en sí un abuso de notación, representa a la matriz por sus entradas, i.e. o incluso .
Como caso particular de matriz, se definen los vectores fila y los vectores columna. Un vector fila o vector renglón es cualquier matriz de tamaño mientras que un vector columna es cualquier matriz de tamaño .
A las matrices que tienen el mismo número de filas que de columnas, se les llama matrices cuadradas y el conjunto se denota
Ejemplo
Dada la matriz
es una matriz de tamaño . La entrada es 7.
La matriz
es una matriz de tamaño : un vector fila con 9 entradas.
Operaciones básicas entre matrices
Las operaciones que se pueden hacer con matrices provienen de sus aplicaciones, sobre todo de las aplicaciones en álgebra lineal. De ese modo las operaciones, o su forma muy particular de ser implementadas, no son únicas.
Suma o adición
Sean
. Se define la operación de suma o adición de matrices como una operación binaria tal que y donde en el que la operación de suma en la última expresión es la operación binaria correspondiente pero en el cuerpo . Por ejemplo, la entrada es igual a la suma de los elementos y lo cual es .
Veamos un ejemplo más explícito. Sea
No es necesario que las matrices sean cuadradas:
A la luz de estos ejemplos es inmediato ver que dos matrices se pueden sumar solamente si ambas tienen el mismo tamaño. La suma de matrices, en el caso de que las entradas estén en un cuerpo, poseen las propiedades de asociatividad, conmutatividad, existencia de elemento neutro aditivo y existencia de inverso aditivo. Esto es así ya que estas son propiedades de los cuerpos en los que están las entradas de la matriz.
- Propiedades de la suma de matrices
Sean , donde es un cuerpo entonces se cumplen las siguientes propiedades para la operación binaria . Todas las demostraciones que siguen se basan en la siguiente observación: dos matrices son iguales si y sólo si tienen los mismos elementos en las mismas posiciones, es decir, si y sólo si para cada par , la entrada de la primera matriz es igual a la entrada de la segunda. Por ello en las demostraciones se fija un par arbitrario y se comprueba que las correspondientes entradas de las matrices izquierda y derecha de la igualdad son iguales. Esto permite concluir, por lo anterior, que las matrices son iguales.
- Asociatividad
Demostración |
Dada la definición de la operación binaria se sigue el resultado ya que debido a que para todo (pues es un cuerpo). |
- Conmutatividad
Demostración |
Dada la definición de la operación binaria se sigue el resultado ya que debido a que para todo (pues es un cuerpo). |
- Existencia del elemento neutro aditivo
Existe tal que
Demostración |
Tómese tal que para cualquier (donde este último es el elemento neutro aditivo en el cuerpo, el cual existe necesariamente por definición de cuerpo). Entonces para cualquier se sigue que ya que para cualquier , dado que las entradas están en un cuerpo. |
- Existencia del inverso aditivo
Existe tal que
a esta matriz se le denota por .
Demostración |
Dada , vamos a construir tal que . Queremos pues que ; luego, por las propiedades de cuerpo, necesariamente donde es el inverso aditivo de en el cuerpo para cualquier . Es decir, podemos construir la inversa aditiva de como la matriz con entradas . |
En efecto, estas propiedades dependen del conjunto en el que estén las entradas, como se ha dicho antes, aunque en las aplicaciones generalmente los cuerpos usados son (los números reales) y (los números complejos).
Por como se definió la operación binaria adición se dice que esta operación es una operación interna por lo que se cumple intrínsecamente la propiedad de que es cerrado bajo adición. Con éstas propiedades se tiene que es un grupo abeliano.
En el caso en que el conjunto al que pertenecen las entradas de la matriz sea un anillo , la operación de adición de matrices continúa dotando de estructura de grupo abeliano a , ya que bajo un anillo se tiene que es un grupo abeliano. En el caso de que las entradas estén en un grupo , este necesita ser un grupo abeliano para que la adición de matrices siga dotando de estructura de grupo abeliano a .
Producto por un escalar
Sean y . Se define la operación de producto por un escalar como una función tal que y donde en donde el producto es la operación binaria correspondiente pero en el cuerpo . Por ejemplo, la entrada es igual al producto .
Veamos un ejemplo más explícito. Sea y
También es inmediato observar que el producto por un escalar da como resultado una matriz del mismo tamaño que la original. También el producto por un escalar dependerá de la estructura algebraica en la que las entradas están. En el caso de que estén en un cuerpo serán dos distributividades (una respecto de suma de matrices y otra respecto de suma en el cuerpo), asociatividad y una propiedad concerniente al producto por el elemento neutro multiplicativo del cuerpo. A continuación se presentan las propiedades.
- Propiedades del producto por un escalar
Sean y , donde es un cuerpo, entonces se cumplen las siguientes propiedades para la operación producto por un escalar. Como antes, las demostraciones se basan en que dos matrices son iguales si y sólo si tienen los mismos elementos en las mismas posiciones.
- Asociatividad
Demostración |
Dada la definición de la operación se sigue el resultado ya que debido a que y para todo y es un cuerpo. |
- Distributividad respecto de la suma de matrices
Demostración |
Dada la definición de la operación se sigue el resultado ya que debido a que y para todo (pues es un cuerpo). |
- Distributividad respecto de la suma en el cuerpo
Demostración |
Dada la definición de la operación se sigue el resultado ya que debido a que y para todo (pues es un cuerpo). |
- Producto por el neutro multiplicativo del cuerpo
Demostración |
Dada la definición de la operación se sigue el resultado ya que debido a que para todo y es un cuerpo. |
Como el producto de una matriz de por un escalar cualquiera en vuelve a ser una matriz de (por la definición que se ha dado y porque es cerrado para el producto al ser un cuerpo), se dice que es cerrado bajo producto por escalares. Por estas propiedades y las de la adición se tiene que es por definición un espacio vectorial con las operaciones de suma y producto por escalares definidas antes.
En el caso de que las entradas y los escalares no estén en un cuerpo sino en un anillo entonces no necesariamente existe el neutro multiplicativo. En caso de que exista, con lo cual el anillo es un anillo con uno, se dice que es un módulo sobre .
Ahora, a partir de las propiedades básicas se puede demostrar inmediatamente que:
Demostración |
Dada la definición de la operación se sigue el resultado ya que para todo |
Demostración |
Dada la definición de la operación se sigue el resultado ya que para todo debido a que para todo . |
Demostración |
Dada la definición de la operación se sigue el resultado ya que como en un cuerpo no hay divisores de cero entonces para todo implica que o para todo , i.e. . No es posible un caso en el que sólo algunas entradas de la matriz sean cero y el escalar sea no nulo ya que en esos casos estaríamos diciendo que hay divisores de cero y llegaríamos a una contradicción, ya que la suposición es que las entradas y los escalares están en un cuerpo. |
Demostración |
Dada la definición de la operación se sigue el resultado ya que debido a que para todo . |
Este último resultado permite usar la notación sin riesgo de ambigüedad.
Producto de matrices
El producto de matrices se define de una manera muy peculiar y hasta caprichosa cuando no se conoce su origen. El origen proviene del papel de las matrices como representaciones de aplicaciones lineales. Así, la definición del producto de matrices proviene de la composición de aplicaciones lineales. En este contexto, el tamaño de la matriz se corresponde con las dimensiones de los espacios vectoriales entre los cuales se establece la aplicación lineal. De ese modo, el producto de matrices representa la composición de aplicaciones lineales.
Producto de matrices por vectores
Conviene primero estudiar el caso del producto de una matriz y un vector. Para ello, sean dos espacios vectoriales y fijemos bases y para cada uno de ellos. Tomemos ahora una aplicación lineal y calculemos las imágenes de los vectores de la primera base: . Podemos ahora expresar estas imágenes en base , y obtener que para cada . Si ahora tomamos un vector cualquiera, con lo anterior ya podemos calcular su imagen (usando la linealidad). En efecto, calculamos sus coordenadas en base , , y tenemos por linealidad que
.
Nótese que si denotamos por el vector de coordenadas de en base , el vector de coordenadas de su imagen en base es lo que se suele definir como el producto de una matriz y un vector , con . Es decir, la definición de producto de matriz por vector viene de cómo se transforman las coordenadas de vectores por aplicaciones lineales: dada una aplicación lineal y bases de los espacios de salida y llegada, podemos construir una matriz (los coeficientes ) de forma que podemos calcular las coordenadas de la imagen de un vector a partir de las del original como . Se dice en este caso que la matriz representa la aplicación lineal .
Por todo esto es por lo que se define el producto de una matriz y un vector de componentes como el vector de componentes . Al calcular este producto, de hecho, estamos calculando la imagen de un vector por una aplicación lineal.
Producto de matrices por matrices
Veamos cómo se justifica entonces la definición de producto de matrices por matrices. Si tenemos dos aplicaciones lineales y y fijamos bases de , entonces existen unas matrices tales que podemos calcular las componentes de las imágenes de vectores como y . Si consideramos la composición (que vuelve a ser lineal), podremos calcular . Querríamos escribir ahora (definiendo convenientemente el producto de matrices) que esto es igual a , y esto es lo que vamos a hacer. Calculemos primero los dos productos matriz por vector y . Es decir, si escribimos y , tenemos que
Por tanto (por definición de producto de matriz por vector), tenemos que para una matriz con entradas . Pero por lo que si queremos escribir tendremos que definir , y esta es la definición usual de producto de matrices. Intuitivamente, lo que hemos hecho ha sido definir la matriz producto como aquella que, al multiplicarla por vectores, tiene el mismo efecto que multiplicar primero y después (nótese que y tienen en esta definición papeles distintos, por lo que ya se puede intuir que puede fallar la conmutatividad).
Obsérvese también que para definir el producto de matrices hemos usado la composición de dos funciones, y esta no se puede dar entre cualquier par de aplicaciones sino entre aplicaciones que vayan de (en general, que la segunda salga del espacio a donde llegó la primera); en particular, debe haber una relación entre las dimensiones de los espacios vectoriales: el espacio de llegada de la primera aplicación debe tener la misma dimensión que el de salida de la segunda. Esto se traduce en las matrices en que sólo se pueden multiplicar aquellas tales que el número de columnas de la primera sea igual al número de filas de la segunda. Una vez dicho esto podemos definir el producto de la siguiente manera.
Sean y . Se define el producto de matrices como una función tal que y donde para toda , es decir . Por ejemplo, podemos calcular.
Veamos un ejemplo más explícito. Sean y
donde la matriz producto es como habíamos establecido en la definición: una matriz .
Sin tomar en cuenta la motivación que viene desde las aplicaciones lineales, es evidente ver que si ignoramos la definición de la función de producto de matrices y sólo se toma en cuenta la definición de las entradas, el producto no estará bien definido, ya que si no tiene el mismo número de columnas que de filas entonces no podremos establecer en donde acaba la suma: si la acabamos en el mayor de éstos números habrá sumandos que no están definidos ya que una de las matrices no tendrá más entradas, mientras que si tomamos el menor habrá entradas de alguna de las matrices que no se tomen en cuenta. Así es necesario que tenga el mismo número de columnas que de filas para que esté definida.
Como se puede suponer también, las propiedades de esta operación serán más limitadas en la generalidad ya que además de las limitaciones impuestas por la naturaleza de las entradas está esta limitación respecto a tamaño. Es claro, además, que el producto de matrices no siempre es una operación interna.
El producto de las matrices A x B también puede realizarse sumando el producto de cada columna de A por la correspondiente fila de B y expresarse utilizando el convenio de suma de Einstein. La enésima columna del producto de las matrices A x B es combinación lineal de las columnas de A siendo cada escalar en dicha combinación el elemento correspondiente de la enésima columna de B. La enésima fila del producto de las matrices A x B es combinación lineal de las filas de B siendo cada escalar en dicha combinación el elemento correspondiente de la enésima fila de A.
- Propiedades del producto de matrices
Sean matrices con entradas en , donde es un cuerpo, entonces se cumplen las siguientes propiedades para el producto de matrices (considerando que los productos existan)
- Asociatividad
Demostración |
Dada la definición de la operación se sigue el resultado ya que, si , y por lo que donde debido a que para todo . Aquí estamos considerando que es , es y es . |
- Distributividad respecto de la suma de matrices por la derecha
Demostración |
Dada la definición de la operación se sigue el resultado ya que debido a que para todo . Aquí estamos considerando que es , es y es . |
- Distributividad respecto de la suma de matrices por la izquierda
Demostración |
Dada la definición de la operación se sigue el resultado ya que debido a que para todo . Aquí estamos considerando que es , es y es . |
El producto de matrices no es conmutativo, si lo fuera la composición de funciones lineales sería conmutativa y eso en general no sucede. De hecho, aun existiendo , el producto puede no estar ni bien definido (pueden cuadrar las dimensiones para hacer un producto y no el otro; por ejemplo, en matrices y , ). Pero ni siquiera cuando existan ambas expresiones tienen por qué valer lo mismo. Por ejemplo, el producto del siguiente par de matrices no conmuta:
pero .
Obviamente, existen casos particulares de algunos tipos de matrices en los que sí hay conmutatividad, pero con un solo contraejemplo, como el anterior, no podemos asegurar la propiedad en general.
En el caso particular del espacio (matrices cuadradas ) tendremos que el producto entre matrices en también está en . En ese caso además de espacio vectorial es un álgebra sobre un cuerpo. En el caso de que el conjunto al que pertenecen las entradas sea un anillo conmutativo con unidad entonces además de módulo es un álgebra sobre un anillo. Más aún, con el producto de matrices es un anillo.
Otros conceptos relacionados con matrices
Rango de una matriz
El rango de una matriz es la dimensión de la imagen de la aplicación lineal representada por , que coincide con la dimensión de los espacios vectoriales generados por las filas o columnas de .
Matriz traspuesta
La traspuesta de una matriz , donde no es necesariamente un cuerpo, es una matriz tal que . Por ejemplo la entrada .
Veamos un ejemplo más explícito. Sea
wikipedia, wiki, leyendo, leer, libro, biblioteca, español, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos, móvil, teléfono, android, ios, apple, teléfono móvil, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, ordenador