Command Palette

Search for a command to run...

Metode Linear AI

Solusi Sistem Persamaan Normal

Sifat Fundamental

Sistem persamaan normal ATAx=ATbA^T A x = A^T b memiliki karakteristik khusus yang membedakannya dari sistem linear biasa. Bayangkan seperti mencari titik terbaik pada sebuah garis untuk mewakili kumpulan data yang tersebar, sistem ini memberikan cara matematis untuk menemukan solusi optimal tersebut.

Untuk matriks ARm×nA \in \mathbb{R}^{m \times n} dengan mnm \geq n, sistem persamaan normal ATAx=ATbA^T A x = A^T b selalu memiliki solusi. Lebih spesifik lagi, sistem ini memiliki solusi unik tepat ketika matriks AA memiliki peringkat penuh, yaitu ketika Peringkat(A)=n\text{Peringkat}(A) = n. Dalam kondisi ini, solusi dapat dinyatakan sebagai x^=(ATA)1ATb\hat{x} = (A^T A)^{-1} A^T b.

Ketika matriks AA tidak memiliki peringkat penuh, himpunan solusi sistem persamaan normal berbentuk x^+Kernel(A)\hat{x} + \text{Kernel}(A), dimana x^\hat{x} adalah sembarang solusi khusus dari sistem tersebut.

Mengapa Sistem Selalu Dapat Diselesaikan

Alasan mendasar mengapa sistem persamaan normal selalu memiliki solusi terletak pada konsep proyeksi ortogonal. Proyeksi ortogonal dari vektor bb ke ruang kolom {Ax:xRn}\{Ax : x \in \mathbb{R}^n\} selalu ada dan merupakan solusi dari masalah kuadrat terkecil linear, yang secara otomatis juga merupakan solusi sistem persamaan normal.

Untuk memahami mengapa solusi lain berbentuk x^+Kernel(A)\hat{x} + \text{Kernel}(A), misalkan x~\tilde{x} adalah solusi lain dari sistem ATAx~=ATbA^T A \tilde{x} = A^T b. Maka x~\tilde{x} adalah solusi sistem persamaan normal jika dan hanya jika ATA(x~x^)=0A^T A(\tilde{x} - \hat{x}) = 0, yang ekuivalen dengan (x~x^)TATA(x~x^)=0(\tilde{x} - \hat{x})^T A^T A(\tilde{x} - \hat{x}) = 0, yang selanjutnya ekuivalen dengan A(x~x^)=0A(\tilde{x} - \hat{x}) = 0, atau dengan kata lain x~x^Kernel(A)\tilde{x} - \hat{x} \in \text{Kernel}(A).

Moore-Penrose Pseudoinverse

Untuk matriks ARm×nA \in \mathbb{R}^{m \times n} dengan mnm \geq n dan Peringkat(A)=n\text{Peringkat}(A) = n, kita dapat mendefinisikan Moore-Penrose pseudoinverse sebagai

A=(ATA)1ATA^{\dagger} = (A^T A)^{-1} A^T

Moore-Penrose pseudoinverse berfungsi seperti "kebalikan terbaik" dari matriks yang tidak persegi. Ia memberikan cara optimal untuk "membatalkan" transformasi linear dalam konteks kuadrat terkecil.

Moore-Penrose pseudoinverse memenuhi empat aksioma Penrose yang menentukan karakteristiknya secara unik

AAA=AAA^{\dagger}A = A
AAA=AA^{\dagger}AA^{\dagger} = A^{\dagger}
(AA)T=AA(AA^{\dagger})^T = AA^{\dagger}
(AA)T=AA(A^{\dagger}A)^T = A^{\dagger}A

Keempat sifat ini bersifat unik, artinya jika matriks BB memenuhi keempat aksioma tersebut, maka secara otomatis B=AB = A^{\dagger}. Moore-Penrose pseudoinverse dengan demikian berfungsi sebagai operator solusi tunggal untuk masalah kuadrat terkecil linear.

Penyelesaian Menggunakan Dekomposisi QR

Pendekatan yang lebih stabil secara numerik untuk menyelesaikan sistem persamaan normal menggunakan dekomposisi QR. Untuk matriks ARm×nA \in \mathbb{R}^{m \times n} dengan peringkat penuh dan mnm \geq n, kita dapat menggunakan dekomposisi QR (tipis) A=Q1R1A = Q_1 R_1.

Dengan dekomposisi ini, sistem persamaan normal ATAx=ATbA^T A x = A^T b dapat diselesaikan melalui

ATAx=R1TQ1TQ1R1x=R1TR1x=R1TQ1Tb=ATbA^T A x = R_1^T Q_1^T Q_1 R_1 x = R_1^T R_1 x = R_1^T Q_1^T b = A^T b

Karena R1R_1 adalah matriks segitiga atas yang dapat dibalik, persamaan ini ekuivalen dengan

R1x=Q1TbR_1 x = Q_1^T b

Sistem segitiga atas ini dapat diselesaikan dengan substitusi mundur, memberikan solusi xx secara langsung dan efisien.

Contoh Numerik

Mari kita terapkan metode ini pada contoh konkret. Misalkan kita memiliki data eksperimen yang ingin kita cocokkan dengan polynomial kuadrat. Kita akan menggunakan data berikut

A=(931421111001111421931)A = \begin{pmatrix} 9 & -3 & 1 \\ 4 & -2 & 1 \\ 1 & -1 & 1 \\ 0 & 0 & 1 \\ 1 & 1 & 1 \\ 4 & 2 & 1 \\ 9 & 3 & 1 \end{pmatrix}
b=(2.24.24.21.81.88.215.8)b = \begin{pmatrix} -2.2 \\ -4.2 \\ -4.2 \\ -1.8 \\ 1.8 \\ 8.2 \\ 15.8 \end{pmatrix}

Setiap baris dalam matriks AA berformat [ti2,ti,1][t_i^2, t_i, 1] untuk mencari koefisien polynomial y=at2+bt+cy = at^2 + bt + c, sedangkan vektor bb berisi nilai pengamatan yang bersesuaian.

Proses Dekomposisi QR

Dekomposisi QR dari matriks AA menghasilkan

Q1=(0.642860.566950.164960.285710.377960.247440.071430.188980.494870.000000.000000.577350.071430.188980.494870.285710.377960.247440.642860.566950.16496)Q_1 = \begin{pmatrix} -0.64286 & -0.56695 & 0.16496 \\ -0.28571 & -0.37796 & -0.24744 \\ -0.07143 & -0.18898 & -0.49487 \\ -0.00000 & 0.00000 & -0.57735 \\ -0.07143 & 0.18898 & -0.49487 \\ -0.28571 & 0.37796 & -0.24744 \\ -0.64286 & 0.56695 & 0.16496 \end{pmatrix}
R1=(14.000000.000002.000000.000005.291500.000000.000000.000001.73205)R_1 = \begin{pmatrix} -14.00000 & -0.00000 & -2.00000 \\ 0.00000 & 5.29150 & 0.00000 \\ 0.00000 & 0.00000 & -1.73205 \end{pmatrix}

Tahap Penyelesaian

Pertama, kita menghitung Q1TbQ_1^T b untuk memperoleh

Q1Tb=(9.714316.02573.4806)Q_1^T b = \begin{pmatrix} -9.7143 \\ 16.0257 \\ 3.4806 \end{pmatrix}

Selanjutnya, kita menyelesaikan sistem segitiga atas R1x=Q1TbR_1 x = Q_1^T b menggunakan substitusi mundur. Karena R1R_1 berbentuk segitiga atas, kita mulai dari persamaan paling bawah.

Dari persamaan ketiga, 1.73205x3=3.4806-1.73205 x_3 = 3.4806, sehingga x3=2.00952x_3 = -2.00952.

Dari persamaan kedua, 5.29150x2=16.02575.29150 x_2 = 16.0257, sehingga x2=3.02857x_2 = 3.02857.

Dari persamaan pertama, 14.00000x12.00000(2.00952)=9.7143-14.00000 x_1 - 2.00000(-2.00952) = -9.7143, sehingga x1=0.98095x_1 = 0.98095.

Dengan demikian, solusi lengkap adalah

x^=(0.980953.028572.00952)\hat{x} = \begin{pmatrix} 0.98095 \\ 3.02857 \\ -2.00952 \end{pmatrix}

Hasil Fitting

Berdasarkan solusi yang diperoleh, polynomial kuadrat yang paling sesuai dengan data adalah

y=0.98095t2+3.02857t2.00952y = 0.98095 \cdot t^2 + 3.02857 \cdot t - 2.00952

Visualisasi berikut menunjukkan seberapa baik polynomial ini mewakili data asli

Fitting Polynomial Kuadrat
Kurva polynomial yang dihasilkan dari solusi sistem persamaan normal.

Perbandingan Metode

Untuk menyelesaikan sistem persamaan normal, terdapat dua pendekatan utama yang dapat dibandingkan dari segi komputasi dan stabilitas numerik.

Pendekatan Cholesky melibatkan pembentukan eksplisit matriks ATAA^T A terlebih dahulu, kemudian menerapkan dekomposisi Cholesky karena matriks ini bersifat positif definit. Metode ini memerlukan sekitar n2m+16n3+O(n2)+O(mn)n^2 \cdot m + \frac{1}{6}n^3 + O(n^2) + O(m \cdot n) operasi aritmatika. Namun, perkalian dan dekomposisi dapat menjadi sumber propagasi kesalahan yang besar, terutama ketika m=nm = n dimana cond(ATA)cond(A)2\text{cond}(A^T A) \approx \text{cond}(A)^2.

Pendekatan QR, sebaliknya, dapat menyelesaikan masalah ini dengan stabilitas numerik yang lebih baik dan kompleksitas komputasi yang sebanding. Kompleksitas utama ditentukan oleh n2mn^2 \cdot m operasi untuk dekomposisi QR, sehingga sebanding dengan pendekatan Cholesky. Namun, keunggulan signifikan QR terletak pada fakta bahwa transformasi ortogonal tidak memperburuk kondisi masalah, berbeda dengan pembentukan ATAA^T A dalam metode Cholesky.

Pemilihan metode yang tepat bergantung pada karakteristik data dan tingkat akurasi yang dibutuhkan dalam aplikasi spesifik.