# Nakafa Learning Content

> For AI agents: use [llms.txt](https://nakafa.com/llms.txt) for the site index. Markdown versions are available by appending `.md` to content URLs or sending `Accept: text/markdown`.

URL: https://nakafa.com/id/materi/matematika/regresi-statistik/koefisien-determinasi
Source: https://raw.githubusercontent.com/nakafaai/nakafa.com/refs/heads/main/packages/contents/material/lesson/mathematics/statistics-regression/coefficient-of-determination/id.mdx

Pelajari bagaimana r² mengukur seberapa baik garis regresi menjelaskan variasi data. Pahami koefisien determinasi dengan contoh visual dan perhitungan.

---

## Apa Itu Koefisien Determinasi?

Setelah kita menemukan garis regresi linear yang paling pas (_best-fit_) untuk data kita, pertanyaan selanjutnya adalah: **seberapa baik garis tersebut benar-benar mewakili atau menjelaskan data kita?**

Ukuran yang menjawab pertanyaan ini adalah **Koefisien Determinasi**, yang dilambangkan dengan **$$r^2$$** (dibaca: r-kuadrat).

Visible text: Ukuran yang menjawab pertanyaan ini adalah **Koefisien Determinasi**, yang dilambangkan dengan **** (dibaca: r-kuadrat).

Sederhananya, $$r^2$$ memberitahu kita **proporsi atau persentase** dari variasi (naik-turunnya nilai) pada variabel dependen (Y) yang **dapat dijelaskan** oleh variasi pada variabel independen (X) menggunakan model regresi linear kita.

Visible text: Sederhananya, memberitahu kita **proporsi atau persentase** dari variasi (naik-turunnya nilai) pada variabel dependen (Y) yang **dapat dijelaskan** oleh variasi pada variabel independen (X) menggunakan model regresi linear kita.

## Koefisien Determinasi dari Diagram Pencar

Nilai $$r^2$$ sangat berkaitan dengan seberapa dekat titik-titik data mengumpul di sekitar garis regresi:

Visible text: Nilai sangat berkaitan dengan seberapa dekat titik-titik data mengumpul di sekitar garis regresi:

1. **$$r^2$$ Tinggi (mendekati $$1$$ atau $$100\%$$)**

   <ScatterDiagram
     title={
       <>
         $$r^2$$ Tinggi
       </>
     }
     description="Titik-titik data sangat dekat dengan garis regresi."
     xAxisLabel="Variabel X"
     yAxisLabel="Variabel Y"
     datasets={[
       {
         name: "Data",
         color: "var(--chart-1)",
         points: [
           { x: 1, y: 2 },
           { x: 2, y: 3.1 },
           { x: 3, y: 3.9 },
           { x: 4, y: 5.2 },
           { x: 5, y: 6.1 },
           { x: 6, y: 6.8 },
           { x: 7, y: 8.1 },
           { x: 8, y: 9.0 },
         ],
       },
     ]}
     calculateRegressionLine
     showResiduals
     regressionLineStyle={{ color: "var(--chart-4)" }}
   />

   Lihat bagaimana titik-titik data di atas sangat rapat dan dekat dengan garis regresi? Ini menunjukkan nilai $$r^2$$ yang tinggi (misalnya, mungkin sekitar $$0.95$$ atau $$95\%$$). Artinya, sebagian besar variasi nilai $$Y$$ _dapat dijelaskan_ dengan baik oleh garis regresi (atau oleh variabel $$X$$).

2. **$$r^2$$ Rendah (mendekati $$0$$ atau $$0\%$$)**

   <ScatterDiagram
     title={
       <>
         $$r^2$$ Rendah
       </>
     }
     description="Titik-titik data tersebar jauh dari garis regresi."
     xAxisLabel="Variabel X"
     yAxisLabel="Variabel Y"
     datasets={[
       {
         name: "Data",
         color: "var(--chart-2)",
         points: [
           { x: 1, y: 1 },
           { x: 2, y: 4 },
           { x: 3, y: 2 },
           { x: 4, y: 6 },
           { x: 5, y: 5 },
           { x: 6, y: 8 },
           { x: 7, y: 6 },
           { x: 8, y: 9 },
         ],
       },
     ]}
     calculateRegressionLine
     showResiduals
     regressionLineStyle={{ color: "var(--chart-4)" }}
   />

   Bandingkan dengan diagram ini. Titik-titiknya lebih tersebar jauh dari garis regresi (garis residunya lebih panjang-panjang). Ini menandakan nilai $$r^2$$ yang rendah (misalnya, mungkin sekitar $$0.40$$ atau $$40\%$$). Artinya, garis regresi ini _kurang baik_ dalam menjelaskan variasi nilai $$Y$$; hanya sebagian kecil variasi $$Y$$ yang bisa dijelaskan oleh $$X$$ melalui model ini.

Visible text: 1. ** Tinggi (mendekati atau )**

 <ScatterDiagram
 title={
 <>
 Tinggi
 </>
 }
 description="Titik-titik data sangat dekat dengan garis regresi."
 xAxisLabel="Variabel X"
 yAxisLabel="Variabel Y"
 datasets={[
 {
 name: "Data",
 color: "var(--chart-1)",
 points: [
 { x: 1, y: 2 },
 { x: 2, y: 3.1 },
 { x: 3, y: 3.9 },
 { x: 4, y: 5.2 },
 { x: 5, y: 6.1 },
 { x: 6, y: 6.8 },
 { x: 7, y: 8.1 },
 { x: 8, y: 9.0 },
 ],
 },
 ]}
 calculateRegressionLine
 showResiduals
 regressionLineStyle={{ color: "var(--chart-4)" }}
 />

 Lihat bagaimana titik-titik data di atas sangat rapat dan dekat dengan garis regresi? Ini menunjukkan nilai yang tinggi (misalnya, mungkin sekitar atau ). Artinya, sebagian besar variasi nilai _dapat dijelaskan_ dengan baik oleh garis regresi (atau oleh variabel ).

2. ** Rendah (mendekati atau )**

 <ScatterDiagram
 title={
 <>
 Rendah
 </>
 }
 description="Titik-titik data tersebar jauh dari garis regresi."
 xAxisLabel="Variabel X"
 yAxisLabel="Variabel Y"
 datasets={[
 {
 name: "Data",
 color: "var(--chart-2)",
 points: [
 { x: 1, y: 1 },
 { x: 2, y: 4 },
 { x: 3, y: 2 },
 { x: 4, y: 6 },
 { x: 5, y: 5 },
 { x: 6, y: 8 },
 { x: 7, y: 6 },
 { x: 8, y: 9 },
 ],
 },
 ]}
 calculateRegressionLine
 showResiduals
 regressionLineStyle={{ color: "var(--chart-4)" }}
 />

 Bandingkan dengan diagram ini. Titik-titiknya lebih tersebar jauh dari garis regresi (garis residunya lebih panjang-panjang). Ini menandakan nilai yang rendah (misalnya, mungkin sekitar atau ). Artinya, garis regresi ini _kurang baik_ dalam menjelaskan variasi nilai ; hanya sebagian kecil variasi yang bisa dijelaskan oleh melalui model ini.

## Menghitung Koefisien Determinasi

Cara paling mudah menghitung $$r^2$$ adalah dengan **mengkuadratkan Koefisien Korelasi ($$r$$)** yang sudah kita pelajari sebelumnya.

Visible text: Cara paling mudah menghitung adalah dengan **mengkuadratkan Koefisien Korelasi ()** yang sudah kita pelajari sebelumnya.

```math
r^2 = (r)^2
```

Jadi, jika kamu sudah menghitung nilai $$r$$, tinggal kuadratkan saja!

Visible text: Jadi, jika kamu sudah menghitung nilai , tinggal kuadratkan saja!

Karena nilai $$r$$ selalu antara $$-1$$ dan $$+1$$ ($$-1 \le r \le 1$$), maka nilai $$r^2$$ akan selalu berada di antara $$0$$ dan $$1$$.

Visible text: Karena nilai selalu antara dan (), maka nilai akan selalu berada di antara dan .

```math
0 \le r^2 \le 1
```

**Secara Matematis (menggunakan Sum of Squares):**

Nilai $$r^2$$ juga bisa dihitung langsung menggunakan nilai-nilai Jumlah Kuadrat (Sum of Squares) yang digunakan untuk menghitung $$r$$:

Visible text: Nilai juga bisa dihitung langsung menggunakan nilai-nilai Jumlah Kuadrat (Sum of Squares) yang digunakan untuk menghitung :

```math
r^2 = \frac{(SS_{xy})^2}{SS_{xx} SS_{yy}}
```

## Interpretasi sebagai Persentase

Nilai $$r^2$$ sering diubah menjadi persentase (dengan dikalikan $$100$$) untuk interpretasi yang lebih mudah.

Visible text: Nilai sering diubah menjadi persentase (dengan dikalikan ) untuk interpretasi yang lebih mudah.

- Jika $$r^2 = 0.81$$, artinya **$$81\%$$** dari total variasi variabel $$Y$$ dapat dijelaskan oleh variasi variabel $$X$$ melalui model regresi linear.
- Sisa variasinya ($$1 - r^2$$ atau $$19\%$$ dalam contoh ini) dijelaskan oleh faktor-faktor lain yang tidak ada dalam model (bisa jadi variabel lain, atau _random error_).

Visible text: - Jika , artinya **** dari total variasi variabel dapat dijelaskan oleh variasi variabel melalui model regresi linear.
- Sisa variasinya ( atau dalam contoh ini) dijelaskan oleh faktor-faktor lain yang tidak ada dalam model (bisa jadi variabel lain, atau _random error_).

Semakin tinggi persentase $$r^2$$, semakin baik model regresi linear kita dalam menjelaskan hubungan antara $$X$$ dan $$Y$$.

Visible text: Semakin tinggi persentase , semakin baik model regresi linear kita dalam menjelaskan hubungan antara dan .