# Nakafa Learning Content

> For AI agents: use [llms.txt](https://nakafa.com/llms.txt) for the site index. Markdown versions are available by appending `.md` to content URLs or sending `Accept: text/markdown`.

URL: https://nakafa.com/id/materi/matematika/regresi-statistik/konsep-regresi-linear
Source: https://raw.githubusercontent.com/nakafaai/nakafa.com/refs/heads/main/packages/contents/material/lesson/mathematics/statistics-regression/linear-regression-concept/id.mdx

Pelajari regresi linear untuk membuat garis best-fit melalui titik data. Pahami prediksi, perhitungan slope, dan cara memodelkan hubungan variabel.

---

## Apa Itu Regresi Linear?

Dengan [Diagram Pencar](/id/materi/matematika/regresi-statistik/diagram-pencar-atau-diagram-scatter), kita bisa melihat hubungan antara dua variabel, yaitu data $$X$$ dan data $$Y$$.

Visible text: Dengan [Diagram Pencar](/id/materi/matematika/regresi-statistik/diagram-pencar-atau-diagram-scatter), kita bisa melihat hubungan antara dua variabel, yaitu data dan data .

Nah, kalau titik-titik di diagram pencar itu kelihatannya membentuk pola lurus (ada korelasi linear, entah positif atau negatif), kita bisa coba gambar satu garis lurus yang paling pas melewati tengah-tengah kumpulan titik itu. Garis inilah yang disebut **Garis Regresi Linear**. Proses menemukan garis ini namanya **Regresi Linear**.

## Garis "Best-Fit"

Garis Regresi Linear sering juga disebut garis _best-fit_ (paling pas). Kenapa? Karena dari sekian banyak kemungkinan garis lurus yang bisa digambar, garis inilah yang posisinya paling "dekat" dengan semua titik data secara keseluruhan. Garis ini mencoba merangkum tren atau pola lurus yang ada pada data.

## Contoh Garis Regresi

Misalnya kita punya data lama belajar (jam) dan nilai ujian. Titik-titiknya kan cenderung naik (korelasi positif).

Component: ScatterDiagram
Props:
- title: Garis Regresi untuk Hubungan Lama Belajar dan Nilai Ujian
- description: Garis menunjukkan tren linear (garis regresi) dari data.
- xAxisLabel: Lama Belajar (Jam)
- yAxisLabel: Nilai Ujian
- datasets: [
{
name: "Siswa",
color: "var(--chart-1)",
points: [
{ x: 1, y: 60 },
{ x: 1.5, y: 68 },
{ x: 2, y: 65 },
{ x: 2.5, y: 75 },
{ x: 3, y: 72 },
{ x: 3.5, y: 80 },
{ x: 4, y: 85 },
{ x: 4, y: 82 },
{ x: 4.5, y: 90 },
{ x: 5, y: 88 },
{ x: 5.5, y: 95 },
{ x: 6, y: 92 },
],
},
]
- calculateRegressionLine: true
- regressionLineStyle: {
color: "var(--chart-3)",
}

Lihat garis di atas? Itu adalah garis regresi linearnya. Garis itu menunjukkan **tren umum**: semakin lama belajar (X naik), nilai ujian (Y) juga cenderung naik mengikuti arah garis tersebut.

## Apa gunanya garis regresi?

Salah satu kegunaan utamanya adalah untuk **prediksi**. Misalnya, kalau ada siswa baru yang belajar selama $$7 \text{ jam}$$, kita bisa gunakan garis regresi ini untuk memperkirakan berapa kira-kira nilai ujian yang akan dia dapat, meskipun kita tidak punya data pasti untuk $$7 \text{ jam}$$.

Visible text: Salah satu kegunaan utamanya adalah untuk **prediksi**. Misalnya, kalau ada siswa baru yang belajar selama , kita bisa gunakan garis regresi ini untuk memperkirakan berapa kira-kira nilai ujian yang akan dia dapat, meskipun kita tidak punya data pasti untuk .

## Konsep Matematis

Garis regresi linear (garis _best-fit_) dicari menggunakan metode yang disebut **Metode Kuadrat Terkecil (Least Squares Method)**. Idenya adalah mencari garis lurus yang **meminimalkan jumlah kuadrat jarak vertikal** dari setiap titik data ke garis tersebut.

Secara matematis, garis regresi linear memiliki bentuk:

```math
\hat{y} = a + bx
```

Keterangan:

- $$\hat{y}$$ (dibaca: $$y$$-topi) adalah **nilai $$y$$ yang diprediksi**
  oleh garis regresi.
- $$x$$ adalah nilai variabel independen.
- $$b$$ adalah **kemiringan (slope)** garis, menunjukkan seberapa
  besar perubahan $$\hat{y}$$ untuk setiap satu satuan perubahan $$x$$
  .
- $$a$$ adalah **perpotongan sumbu $$y$$ (intercept)**, yaitu nilai
  prediksi $$\hat{y}$$ ketika $$x = 0$$.

Visible text: - (dibaca: -topi) adalah **nilai yang diprediksi**
 oleh garis regresi.
- adalah nilai variabel independen.
- adalah **kemiringan (slope)** garis, menunjukkan seberapa
 besar perubahan untuk setiap satu satuan perubahan 
 .
- adalah **perpotongan sumbu (intercept)**, yaitu nilai
 prediksi ketika .

Nilai $$b$$ dan $$a$$ dihitung dari data $$(x, y)$$ yang kita punya menggunakan rumus berikut:

Visible text: Nilai dan dihitung dari data yang kita punya menggunakan rumus berikut:

Component: MathContainer
Children:

```math
b = \frac{n(\sum xy) - (\sum x)(\sum y)}{n(\sum x^2) - (\sum x)^2}
```

```math
a = \bar{y} - b\bar{x}
```

Keterangan rumus:

- $$n$$ adalah banyaknya pasangan data.
- $$\sum x$$ adalah jumlah semua nilai $$x$$.
- $$\sum y$$ adalah jumlah semua nilai $$y$$.
- $$\sum xy$$ adalah jumlah dari hasil perkalian setiap pasangan
  $$x$$ dan $$y$$.
- $$\sum x^2$$ adalah jumlah dari kuadrat setiap nilai $$x$$.
- $$\bar{x}$$ adalah rata-rata nilai $$x$$ ($$\frac{\sum x}{n}$$
  ).
- $$\bar{y}$$ adalah rata-rata nilai $$y$$ ($$\frac{\sum y}{n}$$
  ).

Visible text: - adalah banyaknya pasangan data.
- adalah jumlah semua nilai .
- adalah jumlah semua nilai .
- adalah jumlah dari hasil perkalian setiap pasangan
 dan .
- adalah jumlah dari kuadrat setiap nilai .
- adalah rata-rata nilai (
 ).
- adalah rata-rata nilai (
 ).

Dengan rumus ini, kita bisa mendapatkan satu garis lurus yang dianggap paling mewakili pola hubungan linear pada data kita.