# Nakafa Framework: LLM
URL: /id/subject/high-school/11/mathematics/statistics/correlation-analysis-concept
Source: https://raw.githubusercontent.com/nakafaai/nakafa.com/refs/heads/main/packages/contents/subject/high-school/11/mathematics/statistics/correlation-analysis-concept/id.mdx
Output docs content for large language models.
---
export const metadata = {
  title: "Konsep Analisis Korelasi",
  description: "Temukan cara analisis korelasi mengukur hubungan antar variabel. Pelajari koefisien r Pearson, korelasi positif/negatif, dan mengapa korelasi ≠ kausalitas.",
  authors: [{ name: "Nabil Akbarazzima Fatih" }],
  date: "04/30/2025",
  subject: "Statistika",
};
## Apa Itu Analisis Korelasi?
Kita sering ingin tahu apakah ada hubungan antara dua hal yang bisa diukur dengan angka (dua variabel kuantitatif). Misalnya:
- Apakah ada hubungan antara tinggi badan dan berat badan siswa?
- Apakah jam belajar mempengaruhi nilai ujian?
- Apakah usia mobil berkaitan dengan harganya?
**Analisis Korelasi** adalah cara dalam statistika untuk mengukur **seberapa kuat** dan **apa arah** hubungan linear (pola lurus) antara dua variabel tersebut.
## Koefisien Korelasi
Mengatakan "ada hubungan" saja tidak cukup. Kita butuh ukuran yang pasti agar semua orang punya pemahaman yang sama. Ukuran standar ini disebut **Koefisien Korelasi**, biasanya dilambangkan dengan huruf .
Koefisien korelasi () memberi kita dua informasi penting:
1.  **Arah Hubungan:**
    - **Positif ():** Jika satu variabel naik, variabel lainnya _cenderung_ ikut naik (dan sebaliknya). Contoh: Semakin tinggi badan, _biasanya_ semakin berat badannya.
    - **Negatif ():** Jika satu variabel naik, variabel lainnya _cenderung_ turun (dan sebaliknya). Contoh: Semakin tua usia mobil, _biasanya_ semakin rendah harganya.
2.  **Kekuatan Hubungan:**
    - Seberapa dekat nilai  ke **+1** atau **-1** menunjukkan seberapa kuat hubungan linearnya. Semakin dekat ke +1 atau -1, semakin kuat hubungannya (titik-titik data semakin mendekati pola garis lurus).
    - Jika nilai  dekat dengan **0**, artinya hubungan linearnya **lemah** atau bahkan **tidak ada** (titik-titik data menyebar acak).
**Rentang Nilai :**
Nilai koefisien korelasi selalu berada di antara -1 dan +1.
- : Korelasi linear positif sempurna.
- : Korelasi linear negatif sempurna.
- : Tidak ada korelasi linear.
## Koefisien Determinasi
Kadang, kita ingin tahu seberapa besar bagian dari variasi (naik-turunnya nilai) satu variabel bisa dijelaskan oleh variabel lainnya. Ukuran ini disebut **Koefisien Determinasi**, yang nilainya adalah kuadrat dari koefisien korelasi ().
Misalnya, jika  antara jam belajar dan nilai ujian, maka . Ini berarti sekitar 64% variasi nilai ujian siswa _bisa dijelaskan_ oleh perbedaan jam belajar mereka. Sisanya (36%) mungkin dipengaruhi faktor lain (kecerdasan, cara belajar, dll.).
Nilai  selalu antara 0 dan 1.
Semakin dekat  ke 1, semakin baik variabel X menjelaskan variasi pada variabel Y.
## Korelasi bukan berarti sebab-akibat
Hanya karena dua variabel berkorelasi kuat, bukan berarti satu variabel _menyebabkan_ perubahan pada variabel lainnya. Mungkin ada faktor lain yang tidak kita ukur yang mempengaruhi keduanya.
**Contoh:**
Penjualan es krim dan jumlah kasus tenggelam mungkin berkorelasi positif (keduanya naik di musim panas), tapi bukan berarti makan es krim menyebabkan tenggelam. Faktor penyebabnya adalah musim panas (cuaca panas).
Jadi, analisis korelasi membantu kita memahami _kekuatan_ dan _arah_ hubungan linear, tapi tidak menjelaskan _mengapa_ hubungan itu ada.