# Nakafa Learning Content

> For AI agents: use [llms.txt](https://nakafa.com/llms.txt) for the site index. Markdown versions are available by appending `.md` to content URLs or sending `Accept: text/markdown`.

URL: https://nakafa.com/id/materi/ai-ds/metode-linear-ai/analisis-komponen-utama
Source: https://raw.githubusercontent.com/nakafaai/nakafa.com/refs/heads/main/packages/contents/material/lesson/ai-ds/linear-methods/principal-component-analysis/id.mdx

Pelajari PCA melalui diagonalisasi matriks kovarians, analisis nilai eigen, transformasi koordinat, dan visualisasi geometris untuk sains data.

---

## Contoh Analisis Komponen Utama

Bayangkan kamu memiliki sebuah vektor acak $$x \in \mathbb{R}^n$$ yang terdistribusi normal. Vektor ini memiliki nilai harapan nol $$0 \in \mathbb{R}^n$$ dan matriks kovarians positif definit $$C \in \mathbb{R}^{n \times n}$$. Kita dapat menuliskannya sebagai distribusi normal seperti ini:

Visible text: Bayangkan kamu memiliki sebuah vektor acak yang terdistribusi normal. Vektor ini memiliki nilai harapan nol dan matriks kovarians positif definit . Kita dapat menuliskannya sebagai distribusi normal seperti ini:

Component: MathContainer
Children:

```math
x \sim N(0, C)
```

Setiap parameter individual $$x_i$$ merepresentasikan karakteristik dari proses yang sedang kita amati. Dalam praktiknya, hampir semua entri dari matriks kovarians $$C$$ bisa bernilai tidak nol. Ini artinya parameter-parameter tersebut saling berkorelasi kuat karena adanya kovarians pada elemen diagonal samping.

Visible text: Setiap parameter individual merepresentasikan karakteristik dari proses yang sedang kita amati. Dalam praktiknya, hampir semua entri dari matriks kovarians bisa bernilai tidak nol. Ini artinya parameter-parameter tersebut saling berkorelasi kuat karena adanya kovarians pada elemen diagonal samping.

Melalui analisis komponen utama, kita bisa menentukan faktor-faktor pengaruh utama yang mempengaruhi proses tersebut.

## Diagonalisasi Matriks Kovarians

Untuk mengidentifikasi faktor pengaruh utama, kita perlu melakukan diagonalisasi pada matriks kovarians $$C$$. Misalkan $$\lambda_1 \geq \ldots \geq \lambda_n > 0$$ adalah nilai eigen dari $$C$$ dengan vektor eigen ortonormal yang bersesuaian $$v_1, \ldots, v_n$$.

Visible text: Untuk mengidentifikasi faktor pengaruh utama, kita perlu melakukan diagonalisasi pada matriks kovarians . Misalkan adalah nilai eigen dari dengan vektor eigen ortonormal yang bersesuaian .

Berdasarkan teorema spektral, kita dapat membentuk matriks diagonal dan matriks vektor eigen:

Component: MathContainer
Children:

```math
\Lambda = \begin{pmatrix} \lambda_1 & & 0 \\ & \ddots & \\ 0 & & \lambda_n \end{pmatrix}
```

```math
S = (v_1 \quad \ldots \quad v_n)
```

Kemudian berlaku hubungan fundamental:

Component: MathContainer
Children:

```math
\Lambda = S^T \cdot C \cdot S
```

## Transformasi ke Koordinat Baru

Berkaitan dengan basis $$v_1, \ldots, v_n$$, koordinat baru didefinisikan sebagai $$y = S^T x$$. Yang menarik adalah variabel $$y_i$$ menjadi independen dan terdistribusi normal dengan varians $$\lambda_i$$:

Visible text: Berkaitan dengan basis , koordinat baru didefinisikan sebagai . Yang menarik adalah variabel menjadi independen dan terdistribusi normal dengan varians :

Component: MathContainer
Children:

```math
y_i \sim N(0, \lambda_i), \quad i = 1, \ldots, n
```

Variabel $$y_i$$ inilah yang disebut **komponen utama** dari $$x$$. Komponen utama dengan varians $$\lambda_i$$ yang paling besar menggambarkan faktor pengaruh utama dari proses yang diamati.

Visible text: Variabel inilah yang disebut **komponen utama** dari . Komponen utama dengan varians yang paling besar menggambarkan faktor pengaruh utama dari proses yang diamati.

Analoginya seperti ketika kamu mengamati gerak awan di langit. Ada banyak faktor yang mempengaruhi pergerakan awan, tapi angin barat mungkin memberikan pengaruh paling besar. Komponen utama pertama seperti arah angin utama yang memberikan kontribusi terbesar terhadap pola pergerakan awan.

## Visualisasi Geometris

Secara geometris, analisis komponen utama dapat dipahami sebagai cara mencari arah yang paling optimal untuk merepresentasikan data. Bayangkan data tersebar seperti awan titik-titik dalam ruang dua dimensi. Komponen utama menunjukkan arah dimana data memiliki variabilitas maksimum.

Component: LineEquation
Props:
- title: Visualisasi Analisis Komponen Utama dalam $$\mathbb{R}^2$$
  Visible text: Visualisasi Analisis Komponen Utama dalam
- description: Transformasi dari koordinat asli ke arah faktor utama yang menangkap variabilitas maksimum data.
- data: [
{
points: Array.from({ length: 100 }, (_, i) => {
const angle = (i / 99) * 2 * Math.PI;
const a = 3;
const b = 1.5;
const rotation = Math.PI / 6;
const x_local = a * Math.cos(angle);
const y_local = b * Math.sin(angle);
const x = x_local * Math.cos(rotation) - y_local * Math.sin(rotation);
const y = x_local * Math.sin(rotation) + y_local * Math.cos(rotation);
return { x, y, z: 0 };
}),
color: getColor("CYAN"),
smooth: true,
showPoints: false
},
{
points: [
{ x: -4, y: 0, z: 0 },
{ x: 4, y: 0, z: 0 }
],
color: getColor("VIOLET"),
smooth: false,
showPoints: false,
labels: [
{
text: "Variable 1",
at: 1,
offset: [0.3, -0.5, 0]
}
]
},
{
points: [
{ x: 0, y: -3, z: 0 },
{ x: 0, y: 3, z: 0 }
],
color: getColor("VIOLET"),
smooth: false,
showPoints: false,
labels: [
{
text: "Variable 2",
at: 1,
offset: [0.8, 0.3, 0]
}
]
},
{
points: [
{ x: -3.5, y: -2, z: 0 },
{ x: 3.5, y: 2, z: 0 }
],
color: getColor("ORANGE"),
smooth: false,
showPoints: false,
labels: [
{
text: "Faktor 1",
at: 1,
offset: [0.3, 0.3, 0]
}
]
},
{
points: [
{ x: -1.5, y: 2.6, z: 0 },
{ x: 1.5, y: -2.6, z: 0 }
],
color: getColor("ORANGE"),
smooth: false,
showPoints: false,
labels: [
{
text: "Faktor 2",
at: 0,
offset: [-0.8, ... [truncated; 1215 chars]
- cameraPosition: [0, 0, 15]
- showZAxis: false

Dalam visualisasi di atas, Variable $$1$$ dan Variable $$2$$ merepresentasikan koordinat asli data kamu. Sementara Faktor $$1$$ dan Faktor $$2$$ menunjukkan arah komponen utama yang baru. Perhatikan bagaimana arah faktor tidak sejajar dengan sumbu asli, melainkan mengikuti pola sebaran data yang sebenarnya.

Visible text: Dalam visualisasi di atas, Variable dan Variable merepresentasikan koordinat asli data kamu. Sementara Faktor dan Faktor menunjukkan arah komponen utama yang baru. Perhatikan bagaimana arah faktor tidak sejajar dengan sumbu asli, melainkan mengikuti pola sebaran data yang sebenarnya.

Faktor $$1$$ menunjukkan arah dengan variabilitas terbesar dari data, sedangkan Faktor $$2$$ menunjukkan arah variabilitas terbesar kedua yang tegak lurus terhadap Faktor $$1$$. Transformasi ini memungkinkan kita memahami struktur data dengan lebih baik karena komponen utama menangkap pola variabilitas yang sesungguhnya ada dalam data.

Visible text: Faktor menunjukkan arah dengan variabilitas terbesar dari data, sedangkan Faktor menunjukkan arah variabilitas terbesar kedua yang tegak lurus terhadap Faktor . Transformasi ini memungkinkan kita memahami struktur data dengan lebih baik karena komponen utama menangkap pola variabilitas yang sesungguhnya ada dalam data.