Elon Lages Lima.
IMPA, RJ

Os sistemas de equações lineares constituem um tópico de grande interesse prático. Seu estudo é acessível aos estudantes, pois não requer o emprego de conceitos sutis ou complicados. Além disso, pode servir como ponto de partida para diversas teorias matemáticas relevantes e atuais. Por estes três motivos, é mais do que justa sua inclusão nos currículos escolares. Entretanto, sua abordagem nos compêndios adotados em nossas escolas é, na maioria das vezes, obsoleta, árida e desmotivada. Em certos casos, até mesmo contém erros matemáticos de fato.

Esta nota visa dar aos professores que ensinam sistemas lineares algumas sugestões para ilustrar suas aulas e ajudá-los a situar adequadamente a matéria dentro do contexto dos seus conhecimentos. A limitação de espaço obriga a uma brevidade maior do que a desejada. Para maiores detalhes, ver o livro Coordenadas no Espaço, publicado na Coleção do Professor de Matemática da SBM.

 

     1. Um problema

O curso de Matemática no semestre passado teve três provas. As questões valiam um ponto cada uma, mas os pesos das provas eram diferentes. Jorge, que acertou 6 questões na primeira prova, 5 na segunda e 4 na terceira, obteve no final um total de 47pontos. Fernando acertou 3, 6 e 6, totalizando 54 pontos. Por sua vez, Marcos acertou 2, 7 e 5 questões, atingindo a soma de 50 pontos no final. Já Renato fez 5 questões certas na primeira prova, 8 na segunda e 3 na terceira. Qual foi o total de pontos de Renato?

Chamando de x, y e z respectivamente os pesos da primeira, segunda e terceira provas, as pontuações de Jorge, Fernando e Marcos nos fornecem as equações:

6x + 5y + 4z    =  47

3x + 6y + 6   =  54

2x + 7y + 5z    =  50.

Com isso, determinamos  x, y z e, a partir daí, a nota final de Renato.

Não é difícil imaginar muitas outras situações que conduzem a sistemas de equações lineares como o acima. Os próprios alunos podem ser instados a fornecer tais exemplos, sendo então levados a concluir que os sistemas lineares não foram inventados apenas por capricho dos professores.

 

     2. Observações gerais

No que se segue, faremos referências ao sistema (5)  abaixo:

                     a1x + b1y + c1z = d1 .

(S)                a2x + b2y + c2z = d2 .

                     a3x + b3y + c3z = d3 .

Uma solução de (S) é um terno ordenado (x,y,z) de números reais que, substituídos no primeiro membro de cada uma das equações acima, torna-o igual ao segundo membro. Por exemplo, (2,3,5) é uma solução do sistema do §1: escreve-se x = 2,  y = 3,  z = 5.

O sistema (S) pode ter uma única solução, uma infinidade de soluções ou nenhuma solução. No primeiro caso, diz-se que o sistema é determinado, no segundo, indeterminado e, no terceiro, impossível.

Os sistemas lineares obedecem ao princípio geral (e um tanto vago) de que para determinar 3 números são necessárias 3 informações distintas sobre esses números. O sistema é indeterminado quando uma (ou duas) dessas informações é (ou são) conseqüência(s) das demais. Por exemplo, se nos propusermos a determinar x, y, z sabendo que 2x 4y + 6z = 8, x 2y + 3z = 4  e  3x 6y + 9z = 12, teremos aí um sistema indeterminado, pois na realidade é-nos dada apenas uma informação sobre esses números, a saber, que x 2y + 3z = 4. As outras duas afirmações resultam desta. Em cursos elementares, os sistemas indeterminados são deixados de lado sem maior atenção, mas essa atitude não é correta. A indeterminação significa que o problema expresso pelo sistema (S) possui infinitas soluções, cabendo-nos em cada caso escolher a que melhor se adapta as nossas conveniências.

Já o sistema impossível ocorre quando as informações que nos são fornecidas para calcular x, y e z são incompatíveis. Por exemplo, se uma das equações do sistema é x 2y + 3z = 4, outra equação não pode ter a forma 2x 4y + 6z = 7. (Multiplicando a primeira por 2 e subtraindo a segunda, chegaríamos ao absurdo 0 = 1.)

 

     3. Diferentes interpretações

O sistema (S) pode ser encarado sob diversos pontos de vista. Essa variedade de interpretações enriquece a gama de aplicações que tem seu estudo e, por outro lado, permite a utilização de diferentes instrumentos para resolvê-lo. As três interpretações que apresentamos a seguir têm nível elementar e estão ao alcance do aluno da escola média.

A) INTERPRETAÇÃO GEOMÉTRICA

Cada solução (x,y,z) do sistema (S) pode ser olhada como um ponto P do espaço tridimensional, dado por suas coordenadas cartesianas: P = (x,y,z). Sob este ponto de vista, cada uma das equações do sistema é a equação de um plano nesse espaço e as soluções do sistema são os pontos comuns a esses planos. Mais precisamente, se  1, 2 e 3 são os planos definidos pelas três equações de (S), então as soluções de (S) são os pontos P = (x,y,z) que pertencem à interseção 1 2 3 desses planos.

Assim, por exemplo, se pelo menos dois desses planos são paralelos, ou se dois deles intersectam o terceiro segundo retas paralelas, a interseção 1 2 3  é vazia e o sistema é impossível. Noutro exemplo, podemos ter uma reta r formando uma espécie de eixo, contido simultaneamente nos três planos. Então 1 2 3 = r e o sistema é indeterminado: suas soluções são os pontos de r. O sistema é determinado quando os três planos se encontram num só ponto, como duas paredes adjacentes e o teto.

Há ao todo 8 posições relativas possíveis para os planos 1, 2 e 3. Quatro dessas posições correspondem aos sistemas impossíveis; nas outras quatro, o sistema tem solução. É importante observar que se pode concluir em qual das 8 posições se encontram os planos de (S) examinando os coeficientes ai, bi, ci e di que nele comparecem. (Ver o livro Coordenadas no Espaço, já citado.)
 

B) INTERPRETAÇÃO MATRICIAL

0 sistema  (S)  põe em destaque as matrizes

Fazendo uso da multiplicação de matrizes, esse sistema pode ser escrito sob a forma

A . X = D.

A multiplicação de matrizes, que já foi tratada na RPM 21, funciona assim: o produto de uma linha, digamos [a1, b1, c1], por uma coluna como   é, por definição, igual a  a1x + b1y + c1z. 0 produto de uma matriz A, de m linhas e n colunas, por uma matriz B, de n linhas e p colunas, é a matriz AB, de m linhas e p colunas, cujo elemento da i-ésima linha e j-ésima coluna é o produto da  i-ésima linha de  pela j-ésima coluna de  B.
 

C) INTERPRETAÇÃO VETORIAL

Na interpretação geométrica foram levadas em conta as linhas do sistema (S), as quais representam planos. Agora, olharemos para as   colunas de  (S),  que são os vetores  a=(a1,a2,a3)  b = (b1,b2,b3), c = (c1,c2,c3), e d = (d1,d2,d3), do espaço numérico IR 3.

Como se  sabe,  a soma de dois vetores  u = (,,) e v = (',',') em  IR 3 é definida como u+v = ( + 1 , + ' , + ') e o produto do vetor  u  pelo número real  x  é o vetor x.u = (x,x,x).    Dado um terceiro vetor   w = (",",")   e os números reais   y, z, a combinação linear  x.u + y.v + z.w  é portanto o vetor

x.u + y.v + z.w = (x + 'y + "z, x + 'y + "z, x + y + z).

Assim, afirmar que (x,y,z) é uma solução do sistema (5) significa dizer que vale a igualdade vetorial

x.a + y.b + z.c = d.                                                   (*)

Noutras palavras, dar o sistema (S) significa dar os vetores a,b,c e d em IR3 e resolver o sistema significa exprimir d como combinação linear dos vetores a, b e c, na forma (*). As incógnitas x,y,z  são os coeficientes numéricos dessa combinação.

Se os vetores-coluna a,b,c forem não-coplanares, todo vetor d em  IR 3 se exprime, de modo único, como combinação linear de a,b e c. Neste caso, o sistema (S) possui uma única solução, não importa qual seja o segundo membro d.

Se, entretanto, os vetores a, b, c estiverem no mesmo plano, o sistema não terá solução, a menos que d esteja nesse mesmo plano. E se a, b, c forem colineares, d lhes deve ser colinear também para que  (S)  possua solução.

 

     4. Métodos de solução

A) ESCALONAMENTO

0 método de escalonamento consiste em substituir o sistema (S) por outro (S') que lhe seja equivalente (isto é, que possua as mesmas soluções), no qual a matriz A' seja escalonada. Uma matriz diz-se escalonada quando o primeiro elemento não nulo de cada linha situa-se à direita do primeiro elemento não nulo da linha  anterior. Diz-se então que (S') é um sistema escalonado. 0 sistema seguinte é escalonado:

2x 3y + 5 = 1

2y + 3 = 2

4 = 8.

Um sistema escalonado resolve-se facilmente de baixo para cima: a última equação dá o valor de z. Substituindo esse valor na segunda equação, encontra-se  y, etc.

Para passar do sistema (S) para um sistema escalonado equivalente, substitui-se a segunda equação por a2 vezes a primeira equação menos ai vezes a segunda. Isso elimina o termo em x na segunda equação. De modo análogo, elimina-se o termo em x da terceira equação. Deixando em paz a primeira equação, usa-se o mesmo processo nas duas últimas (nas quais x já foi eliminado) para eliminar y na terceira equação e obter um sistema escalonado.

Por exemplo, se aplicarmos escalonamento ao sistema do §1, obteremos o sistema escalonado

6x + 5y + 4z    =    47

21y + 24z    =  183

153v    =  765,

o qual, resolvido de baixo para cima, dá  z = 5, y = 3, x = 2.
 

B) RESOLUÇÃO MATRICIAL

A interpretação matricial, que consiste em escrever o sistema (5) sob a forma A . X = D, praticamente impõe a solução X = A-1D. Esta solução exige que exista a inversa A-1 da matriz A. Por definição, A-1 é a matriz que multiplicada por A dá como resultado a "matriz identidade" I, cujas linhas são (1 0 0), (0 1 0) e (0 0 1). Para que A-1 exista, é necessário e suficiente que o determinante da matriz A seja diferente de zero. Se isto ocorre, então

onde o "determinante menor"  Aij   é o determinante da matriz obtida de A pela supressão da  i-ésima linha e da j-ésima coluna.

Com esta fórmula para A-1, pode-se efetuar imediatamente a multiplicação A-1 . Z), obtendo assim expressões explícitas para as incógnitas x,y,z. Tais expressões coincidem com as dadas pela Regra de Cramer, a qual será deduzida a seguir por meio de um raciocínio elementar, que não depende da teoria das matrizes.

C) REGRA DE CRAMER

Usaremos a notação det [u,v,w] para indicar o determinante da matriz cujas colunas são os vetores u = (,,), v = (',',') e w = (",","). Se (x,y,z) é solução do sistema (S), isto é, se d = x.a + y .b + z.c, de acordo com a interpretação vetorial, então as propriedades elementares do determinante nos permitem escrever

det [d, b, c] = det [x . a + y . b + z . c, 6, c] =

= x det [a,b,c] + y det [b,b,c] + z det [c,b, c] =

= x det [a,b,c] + y . 0 + z . 0 = x det [a,b,c].

Analogamente se tem

det [a, d, c] = y det [a,b,c]    e    det [a, b, d] = z det [a,b,c].

Se supusermos  det [a,b,c] 0,  obteremos

O conjunto dessas fórmulas é conhecido como a Regra de Cramer.

 

     5. Custo operacional

Tradicionalmente, a Regra de Cramer é o método consagrado para a resolução dos sistemas lineares. Vejamos se essa tradição se justifica.

Examinaremos inicialmente os três métodos acima sob o ponto de vista do que chamaremos custo operacional. Admitindo que as operações de adição e subtração tenham custo insignificante, vejamos quantas multiplicações e divisões são necessárias para aplicar cada um desses métodos.

A)  CUSTO DO ESCALONAMENTO

São necessárias (4 + 4) + (4 + 4) = 16 multiplicações para eliminar x, 3 + 3 = 6 multiplicações para eliminar y, uma divisão pára obter z, uma multiplicação e uma divisão para achar y e duas multiplicações mais uma divisão para encontrar x. Ao todo, usam-se 28 operações de multiplicação ou divisão para resolver um sistema linear 3 por 3 pelo método de escalonamento.

B)   CUSTO MATRICIAL

Tem-se primeiro que determinar a inversa da matriz A. Isto começa com o determinante de A. Desenvolvendo segundo uma linha ou coluna, tem-se 9 multiplicações para achar = det A. Em seguida vêm os 9 determinantes menores Aij. Três deles já foram calculados na expansão de . Sobram 6, cada um dos quais requer 2 multiplicações. Até agora são 9 + 12 = 21 multiplicações. Depois divide-se cada menor Aij por : são 9 divisões. Assim, o cálculo de A-1 tem custo 21 + 9 = 30. Finalmente, o produto A-1 . requer mais 9 multiplicações. Custo total:   30 + 9 = 39.

Como veremos a seguir, esse é o mesmo custo da Regra de Cramer, o que é natural pois, como já observamos, a expressão X = A-1 . coincide com a Regra de Cramer.

C) CUSTO DA REGRA DE CRAMER

Para resolver um sistema 3 por 3 pela Regra de Cramer, devem-se calcular 4 determinantes. Usando a expansão segundo linhas ou colunas, cada um desses determinantes requer 9 multiplicações. Custo parcial: 4 x 9 = 36. Em seguida, vêm 3 divisões. Custo total da Regra de Cramer:   36 + 3 = 39.

 

     Conclusão:

Para sistemas 3 por 3, o método do escalonamento tem custo 28, enquanto o método matricial e a Regra de Cramer têm ambos custo  39.

Convém observar que o caso 3 por 3, que estamos analisando, não é típico. Em muitas aplicações da Matemática encontram-se sistemas de equações lineares com dezenas, centenas, ou mesmo milhares de incógnitas. Quando o número de incógnitas cresce, a diferença de custo entre a Regra de Cramer (ou o método matricial) e o método de escalonamento cresce muito rapidamente, atingindo cifras quase inacreditáveis.

Não é difícil constatar que o cálculo de um determinante n x n pelo desenvolvimento segundo uma linha ou uma coluna custa aproximadamente n!(e 1) multiplicações (e = 2,71828). Logo, o custo da Regra de Cramer num sistema de n equações a   incógnitas é  (n + 1)! (e 1) + n,  aproximadamente.

Por outro lado, o custo do mesmo sistema n x n no processo de escalonamento, da maneira como o apresentamos, é de 2n3/3 + 3n2/2 = 7n/6. (Nesta nota, usamos o dobro das multiplicações que seriam necessárias. Isso foi feito para os alunos não lidarem com frações.)

Essas fórmulas mostram que a resolução de um sistema de n equações lineares com n incógnitas pode tornar-se, para valores grandes de n, extremamente mais laboriosa pela Regra de Cramer do que pelo método do escalonamento.

Para estabelecer um confronto entre os dois métodos, imaginemos um computador capaz de efetuar um milhão de multiplicações ou divisões por segundo.

Usando o método do escalonamento, esse computador resolveria um sistema 10 x 10 em 0,8 milésimo de segundo; pela Regra de Cramer ele levaria 1 minuto e 8 segundos.

Vejamos um sistema 15 x 15. Por escalonamento, o computador o resolveria em 2,5 milésimos de segundo. Pela Regra de Cramer, ele levaria 1 ano, 1 mês e 16 dias.

Consideremos agora um sistema de 20 equações com 20 in­cógnitas. Nosso computador o resolveria por escalonamento em 6 milésimos de segundo. Pela Regra de Cramer, ele levaria 2 milhões, 754 mil e 140 anos para resolvê-lo!

Isso mostra claramente como a Regra de Cramer é inadequada para sistemas de grande porte. Para encerrar as comparações, observemos que, no computador que estamos considerando, um sis­tema de mil equações com mil incógnitas seria resolvido em 11 minutos pelo método do escalonamento. O tempo necessário para resolvê-lo pela Regra de Cramer é simplesmente inimaginável.
 

      6. Considerações finais

O baixo custo operacional já seria razão suficiente para a superioridade do método do escalonamento sobre os outros dois. Mas tem mais. A solução X = A-1 . D ea Regra de Cramer só se aplicam no caso em que det A 0, ou seja, no caso em que o sistema possui uma única solução. Já vimos que são oito as posições relativas de três planos no espaço. A posição em que esses planos se intersectam num único ponto é apenas uma das oito. O método do escalonamento não depende de nenhuma hipótese sobre o determinante de A. Se o sistema for impossível, chega-se a uma terceira equação da forma 0.z = m, com m 0, e, se for indeterminado, à equação 0.z = 0.

Infelizmente, vários livros adotados em nossas escolas come­tem o grave erro de aplicar a Regra de Cramer em casos nos quais det [a,b,c] = 0. Dizem esses livros que se det [d,b,c] = det [a,d,c] = det [a, b, d] = det [a, b, c] = 0 então, como a Regra de Cramer (mal aplicada) fornece  x = 0/0,  y = 0/0  e  z = 0/0, o sistema é indeterminado. Isto é falso. Se os vetores a,b,c forem múltiplos um do outro mas o vetor d não for múltiplo deles, os 4 determinantes acima são nulos mas o sistema é impossível. Para os autores desses livros, o sistema

x + 2y + 3z     = 1

2x + 4y + 6z   = 2

3x + 6y + 9z   = 4

é indeterminado, isto é, possui infinitas soluções. Seria o caso de pedir a tais autores que dessem exemplos de uma sequer dessas soluções.

Não se deve porém imaginar que o método matricial e a Regra de Cramer são desprovidos de qualquer interesse. Para terminar, direi algumas palavras em defesa deles.

Em primeiro lugar, quando o número de equações e incógnitas é 3, como supusemos aqui, a economia operacional com o uso do escalonamento não é tão assustadora assim.

Em segundo lugar, quanto ao método matricial, a expressão X = A-1.D sugere um tratamento algébrico das quantidades que ocorrem num sistema linear. Essa Álgebra Matricial tem grande interesse matemático, sua utilidade indo bem mais além do que foi esboçado aqui. E, quanto à Regra de Cramer, as fórmulas que dão explicitamente x, y e z em termos dos coeficientes ai, bi, ci e di têm importância teórica pois permitem, entre outras coisas, avaliar o grau de mudança dessas respostas x,y,z quando se perturbam, ou se cometem erros nas medidas que fornecem, os coeficientes  ai, bi, ci, di.

Para concluir, cabe ressaltar que o advento dos computadores veio abrir caminho para novas técnicas de resolução dos sistemas lineares, além das mencionadas aqui. Entre elas destacam-se os métodos iterativos, cuja aplicação abrange também os sistemas não-lineares.

 

     Observação

Segundo me informou Eduardo Wagner, o seguinte processo misto é freqüentemente empregado para resolver sistemas 3x3: usa-se a Regra de Cramer para determinar uma das incógnitas, digamos x. Em seguida, substitui-se em duas equações o valor encontrado, obtendo um sistema em y e z, o qual pode ser resolvido facilmente por um dos métodos conhecidos.

Este processo é mais rápido do que a Regra de Cramer pois nele se calculam apenas dois determinantes 3x3, em vez de quatro. Na realidade, como se constata facilmente, sua aplicação requer 28 multiplicações ou divisões, número igual ao que necessita o processo de escalonamento. Deve-se contudo observar duas desvantagens deste processo misto em relação ao escalonamento. Em primeiro lugar, como a Regra de Cramer, ele requer que o determinante do sistema seja diferente de zero. Em segundo lugar, para sistemas com um número n de incógnitas maior do que 3, seu custo operacional, que tem a mesma ordem de grandeza de   n!,   torna-se tão proibitivo quanto o da Regra de Cramer.

Nota
A idéia de escrever sobre o ensino de sistemas lineares remonta a uma carta enviada à RPM, em 1989, pelo Professor Paulo Argolo, do Rio de Janeiro, alertando para o emprego errôneo da Regra de Cramer em alguns textos de uso corrente.