Materi 10

Bab 10: Regresi Linear

Modul pembelajaran Metode Numerik tentang regresi linear, metode kuadrat terkecil, slope, intercept, residual, SSE, dan aplikasi regresi pada data eksperimen teknik elektro.

10.1 Deskripsi Bab

Pada Bab 9, Anda telah mempelajari interpolasi, yaitu metode untuk membangun kurva yang melewati titik-titik data. Interpolasi cocok digunakan jika data relatif akurat dan tidak banyak mengandung noise.

Namun, data nyata sering tidak sempurna. Data hasil pengukuran sensor, eksperimen laboratorium, atau pengamatan sistem biasanya mengandung error. Jika semua titik data yang mengandung noise dipaksa dilewati oleh kurva, hasilnya dapat menjadi tidak stabil dan tidak mewakili tren sebenarnya.

Bab ini membahas regresi linear, yaitu metode untuk membangun garis lurus terbaik yang mewakili pola umum data. Garis regresi tidak harus melewati semua titik data. Tujuannya adalah mencari garis yang paling baik menggambarkan hubungan antara variabel xx dan yy.


10.2 Capaian Pembelajaran

Setelah mempelajari bab ini, mahasiswa diharapkan mampu:

  1. Menjelaskan pengertian regresi linear.
  2. Membedakan regresi dan interpolasi.
  3. Menjelaskan konsep garis terbaik.
  4. Menjelaskan prinsip metode kuadrat terkecil.
  5. Menghitung parameter regresi aa dan bb.
  6. Menginterpretasikan slope dan intercept.
  7. Menghitung residual dan Sum of Squared Errors.
  8. Menerapkan regresi linear pada data eksperimen teknik elektro.

10.3 Materi Inti

10.3.1 Apa Itu Regresi?

Regresi adalah teknik untuk membangun model yang mewakili hubungan antara sekumpulan data. Dalam regresi linear, model yang dibangun berupa garis lurus.

Bentuk umum regresi linear sederhana adalah:

y=a+bxy = a + bx

Keterangan:

SimbolMakna
yyVariabel yang diprediksi
xxVariabel bebas
aaIntercept atau nilai yy saat x=0x=0
bbSlope atau kemiringan garis

Tujuan regresi bukan membuat garis melewati semua titik data, melainkan membuat garis yang paling mewakili tren data secara keseluruhan.


10.3.2 Perbedaan Regresi dan Interpolasi

Regresi dan interpolasi sama-sama digunakan untuk memahami data, tetapi tujuan keduanya berbeda.

AspekInterpolasiRegresi
TujuanMemperkirakan nilai di antara titik dataMenangkap tren umum data
KurvaHarus melewati semua titik dataTidak harus melewati semua titik data
Cocok untukData akurat dan sedikit noiseData eksperimen yang mengandung noise
Hasil utamaNilai pendekatan pada titik tertentuPersamaan model
ContohTabel kalibrasi yang sangat presisiHubungan arus dan tegangan hasil eksperimen

Jika data mengandung noise, regresi biasanya lebih sesuai daripada interpolasi karena regresi tidak memaksa garis melewati setiap titik.


10.3.3 Konsep Garis Terbaik

Misalkan terdapat beberapa titik data:

(x1,y1),(x2,y2),,(xn,yn)(x_1,y_1), (x_2,y_2), \ldots, (x_n,y_n)

Kita ingin mencari garis:

y=a+bxy = a + bx

yang paling mewakili titik-titik tersebut.

Untuk setiap titik data, terdapat selisih antara nilai data sebenarnya dan nilai prediksi dari garis regresi. Selisih ini disebut residual.

Jika nilai prediksi pada titik xix_i adalah:

yi^=a+bxi\hat{y_i}=a+bx_i

maka residualnya adalah:

di=yiyi^d_i = y_i - \hat{y_i}

atau:

di=yi(a+bxi)d_i = y_i - (a+bx_i)

Garis terbaik adalah garis yang membuat total kuadrat residual sekecil mungkin.


10.3.4 Sum of Squared Errors

Sum of Squared Errors atau SSE adalah jumlah kuadrat residual.

SSE=di2SSE = \sum d_i^2

atau:

SSE=(yi(a+bxi))2SSE = \sum \left(y_i - (a+bx_i)\right)^2

Mengapa residual dikuadratkan?

Jika residual hanya dijumlahkan biasa, residual positif dan negatif dapat saling menghilangkan. Akibatnya, jumlah residual bisa kecil atau bahkan nol, padahal garis belum tentu baik. Dengan menguadratkan residual, semua error dihitung sebagai nilai positif.

ResidualJika DijumlahkanJika Dikuadratkan
PositifBisa menambah totalMenambah total error
NegatifBisa mengurangi totalTetap menambah total error
NolTidak berpengaruhTidak berpengaruh

Semakin kecil nilai SSE, semakin baik garis regresi mewakili data.


10.3.5 Metode Kuadrat Terkecil

Metode kuadrat terkecil atau least squares method adalah metode untuk mencari garis regresi yang meminimumkan SSE.

Bentuk garis regresi:

y=a+bxy = a + bx

Parameter aa dan bb dihitung dengan rumus:

b=nxiyi(xi)(yi)nxi2(xi)2b = \frac{n\sum x_i y_i - (\sum x_i)(\sum y_i)}{n\sum x_i^2 - (\sum x_i)^2} a=yibxina = \frac{\sum y_i - b\sum x_i}{n}

atau:

a=yˉbxˉa = \bar{y} - b\bar{x}

Keterangan:

SimbolMakna
nnJumlah data
xi\sum x_iJumlah seluruh nilai xx
yi\sum y_iJumlah seluruh nilai yy
xiyi\sum x_i y_iJumlah hasil kali xix_i dan yiy_i
xi2\sum x_i^2Jumlah kuadrat nilai xix_i
xˉ\bar{x}Rata-rata nilai xx
yˉ\bar{y}Rata-rata nilai yy

10.3.6 Langkah Praktis Menghitung Regresi Linear

Langkah-langkah menghitung regresi linear adalah:

  1. Susun data dalam bentuk pasangan (xi,yi)(x_i,y_i).

  2. Buat tabel bantu yang memuat xix_i, yiy_i, xiyix_i y_i, dan xi2x_i^2.

  3. Hitung xi\sum x_i, yi\sum y_i, xiyi\sum x_i y_i, dan xi2\sum x_i^2.

  4. Hitung nilai bb menggunakan rumus slope.

  5. Hitung nilai aa menggunakan rumus intercept.

  6. Bentuk persamaan regresi:

    y=a+bxy = a + bx
  7. Hitung residual dan SSE jika ingin menilai kualitas garis regresi.


10.3.7 Interpretasi Parameter aa dan bb

Parameter aa dan bb tidak hanya angka. Keduanya memiliki makna yang dapat ditafsirkan.

ParameterNamaMakna
aaInterceptNilai prediksi yy ketika x=0x=0
bbSlope atau gradienPerubahan yy untuk setiap kenaikan satu satuan xx

Jika b>0b>0, hubungan antara xx dan yy cenderung searah. Ketika xx naik, yy juga cenderung naik.

Jika b<0b<0, hubungan antara xx dan yy cenderung berlawanan arah. Ketika xx naik, yy cenderung turun.

Dalam teknik elektro, jika regresi dilakukan pada hubungan tegangan dan arus:

V=a+bIV = a + bI

maka slope bb dapat ditafsirkan sebagai resistansi.


10.3.8 Residual dan Kualitas Model

Setelah persamaan regresi diperoleh, residual setiap titik dapat dihitung dengan:

di=yi(a+bxi)d_i = y_i - (a+bx_i)

Residual menunjukkan jarak vertikal antara titik data dan garis regresi.

Kondisi ResidualInterpretasi
Residual kecilPrediksi dekat dengan data
Residual besarPrediksi jauh dari data
Residual positifData berada di atas garis regresi
Residual negatifData berada di bawah garis regresi

SSE digunakan sebagai ukuran sederhana untuk melihat kualitas model. SSE yang lebih kecil menunjukkan bahwa garis regresi lebih dekat terhadap titik-titik data.


10.3.9 Aplikasi Regresi Linear dalam Teknik Elektro

Regresi linear sering digunakan dalam data eksperimen teknik elektro. Beberapa contoh aplikasinya adalah:

AplikasiTujuan Regresi
Verifikasi Hukum OhmMenentukan resistansi dari data arus dan tegangan
Kalibrasi sensorMencari hubungan antara input fisik dan output tegangan
Karakterisasi komponenMengetahui hubungan antarvariabel hasil pengukuran
Prediksi respons sistemMembuat model sederhana dari data eksperimen
Analisis konsumsi energiMelihat tren penggunaan daya terhadap waktu atau beban

Contoh penting adalah Hukum Ohm:

V=IRV = IR

Jika VV menjadi variabel yy dan II menjadi variabel xx, maka bentuknya sesuai dengan regresi linear:

V=a+bIV = a + bI

Jika aa mendekati nol dan bb bernilai sekitar resistansi, maka data eksperimen konsisten dengan Hukum Ohm.


10.3.10 Pengantar Jenis Regresi Lain

Regresi linear sederhana hanya membahas hubungan satu variabel bebas dan satu variabel terikat dalam bentuk garis lurus. Pada data nyata, hubungan antarvariabel tidak selalu linear.

Beberapa jenis regresi lain adalah:

Jenis RegresiBentuk UmumCocok Untuk
Regresi polinomialy=a0+a1x+a2x2++anxny=a_0+a_1x+a_2x^2+\cdots+a_nx^nData melengkung
Regresi multivariabely=a+b1x1+b2x2++bkxky=a+b_1x_1+b_2x_2+\cdots+b_kx_kData dengan banyak variabel bebas
Regresi eksponensialy=aebxy=ae^{bx}Pertumbuhan atau peluruhan
Regresi logaritmiky=a+bln(x)y=a+b\ln(x)Perubahan cepat di awal lalu melambat
Regresi pangkaty=axby=ax^bHubungan empiris berbentuk pangkat

Beberapa model non-linear dapat diubah menjadi bentuk linear melalui transformasi. Misalnya:

y=aebxy=ae^{bx}

dapat diubah menjadi:

ln(y)=ln(a)+bx\ln(y)=\ln(a)+bx

Setelah ditransformasi, metode kuadrat terkecil dapat digunakan kembali.


10.4 Fitur Interaktif

Bagian ini dapat digunakan sebagai rancangan komponen interaktif pada halaman web.

10.4.1 Input Titik Data

Mahasiswa dapat memasukkan titik data dalam bentuk tabel.

Contoh:

xxyy
12
24
35
44
55

Sistem kemudian menghitung:

  1. Nilai slope bb.
  2. Nilai intercept aa.
  3. Persamaan regresi.
  4. Residual tiap titik.
  5. SSE.

10.4.2 Garis Regresi Otomatis

Setelah data dimasukkan, graph panel menampilkan:

  1. Titik-titik data.
  2. Garis regresi.
  3. Residual sebagai garis vertikal dari titik data ke garis regresi.
  4. Nilai aa, bb, dan SSE.

Visualisasi ini membantu mahasiswa memahami bahwa regresi tidak memaksa garis melewati semua titik.


10.4.3 Titik Data Bisa Digeser

Mahasiswa dapat menggeser titik data pada grafik. Sistem secara otomatis memperbarui:

  1. Garis regresi.
  2. Nilai slope.
  3. Nilai intercept.
  4. Residual per titik.
  5. Nilai SSE.

Fitur ini membantu mahasiswa melihat pengaruh satu titik data terhadap garis regresi.


10.4.4 Residual per Titik

Sistem dapat menampilkan residual dalam tabel.

xix_iyiy_iyi^\hat{y_i}did_idi2d_i^2
122,8-0,80,64
243,40,60,36
354,01,01,00

Mahasiswa dapat melihat titik mana yang paling jauh dari garis regresi.


10.4.5 Mini Quiz Interaktif

Contoh pertanyaan interaktif:

  1. Apa perbedaan regresi dan interpolasi?
  2. Apa makna slope pada garis regresi?
  3. Kapan regresi linear cocok digunakan?
  4. Apa arti residual positif?
  5. Mengapa residual dikuadratkan dalam SSE?

10.5 Contoh Soal

Contoh 10.1 Regresi Linear Sederhana

Diberikan data:

(1,2),(2,4),(3,5),(4,4),(5,5)(1,2), (2,4), (3,5), (4,4), (5,5)

Tentukan persamaan regresi linear:

y=a+bxy=a+bx

Penyelesaian

Buat tabel bantu:

iixix_iyiy_ixiyix_i y_ixi2x_i^2
11221
22484
335159
4441616
5552525
\sum15206655

Diketahui:

n=5n=5 xi=15\sum x_i=15 yi=20\sum y_i=20 xiyi=66\sum x_i y_i=66 xi2=55\sum x_i^2=55

Hitung slope:

b=nxiyi(xi)(yi)nxi2(xi)2b = \frac{n\sum x_i y_i - (\sum x_i)(\sum y_i)}{n\sum x_i^2 - (\sum x_i)^2} b=5(66)15(20)5(55)152b = \frac{5(66)-15(20)}{5(55)-15^2} b=330300275225b = \frac{330-300}{275-225} b=3050=0,6b = \frac{30}{50}=0{,}6

Hitung intercept:

a=yibxina = \frac{\sum y_i - b\sum x_i}{n} a=200,6(15)5a = \frac{20 - 0{,}6(15)}{5} a=2095a = \frac{20-9}{5} a=2,2a = 2{,}2

Jadi, persamaan regresinya adalah:

y=2,2+0,6xy = 2{,}2 + 0{,}6x

Contoh 10.2 Menghitung Residual dan SSE

Gunakan hasil dari Contoh 10.1:

y=2,2+0,6xy = 2{,}2 + 0{,}6x

Hitung residual dan SSE.

Penyelesaian

xix_iyiy_iyi^=2,2+0,6xi\hat{y_i}=2{,}2+0{,}6x_idi=yiyi^d_i=y_i-\hat{y_i}di2d_i^2
122,8-0,80,64
243,40,60,36
354,01,01,00
444,6-0,60,36
555,2-0,20,04

Maka:

SSE=0,64+0,36+1,00+0,36+0,04SSE = 0{,}64+0{,}36+1{,}00+0{,}36+0{,}04 SSE=2,40SSE = 2{,}40

Interpretasi: nilai SSE sebesar 2,402{,}40 menunjukkan bahwa garis regresi tidak melewati semua titik data secara sempurna, tetapi cukup mewakili tren data secara umum.


Contoh 10.3 Regresi pada Data Kalibrasi Sensor

Sebuah sensor suhu dikalibrasi dengan data berikut:

Suhu TT dalam °CTegangan VV dalam volt
201,02
402,05
603,07
804,11

Cari persamaan kalibrasi:

V=a+bTV = a + bT

lalu gunakan untuk memprediksi suhu saat:

V=2,5 VV = 2{,}5 \text{ V}

Penyelesaian

Tabel bantu:

TTVVTVT \cdot VT2T^2
201,0220,40400
402,0582,001600
603,07184,203600
804,11328,806400
\sum10,25615,4012000

Diketahui:

n=4n=4 T=200\sum T=200 V=10,25\sum V=10{,}25 TV=615,40\sum TV=615{,}40 T2=12000\sum T^2=12000

Hitung slope:

b=4(615,40)200(10,25)4(12000)2002b = \frac{4(615{,}40)-200(10{,}25)}{4(12000)-200^2} b=2461,620504800040000b = \frac{2461{,}6-2050}{48000-40000} b=411,68000b = \frac{411{,}6}{8000} b0,05145b \approx 0{,}05145

Hitung intercept:

a=10,250,05145(200)4a = \frac{10{,}25 - 0{,}05145(200)}{4} a0,01a \approx -0{,}01

Persamaan kalibrasi:

V0,01+0,05145TV \approx -0{,}01 + 0{,}05145T

Untuk V=2,5V=2{,}5:

2,5=0,01+0,05145T2{,}5 = -0{,}01 + 0{,}05145T T=2,5+0,010,05145T = \frac{2{,}5+0{,}01}{0{,}05145} T48,8CT \approx 48{,}8^\circ C

Jadi, jika sensor membaca 2,52{,}5 V, suhu diperkirakan sekitar:

48,8C48{,}8^\circ C

Contoh 10.4 Regresi untuk Estimasi Resistansi

Sebuah resistor diuji dengan data arus dan tegangan berikut.

Arus II dalam ATegangan VV dalam V
0,100,95
0,202,10
0,302,95
0,404,05
0,505,00

Jika digunakan model:

V=a+bIV = a + bI

maka bb dapat ditafsirkan sebagai resistansi.

Dari perhitungan regresi, diperoleh:

b10,05b \approx 10{,}05

dan:

a0,0050a \approx -0{,}005 \approx 0

Maka persamaan regresinya adalah:

V0+10,05IV \approx 0 + 10{,}05I

Jadi, resistansi resistor diperkirakan:

R10,05ΩR \approx 10{,}05 \Omega

Karena intercept hampir nol, hasil ini konsisten dengan Hukum Ohm.


10.6 Latihan

Kerjakan latihan berikut secara sistematis.

  1. Lima siswa memiliki data jam belajar dan nilai ujian sebagai berikut:

    (2,65),(4,72),(6,78),(8,85),(10,88)(2,65), (4,72), (6,78), (8,85), (10,88)

    Bangun persamaan regresi linear y=a+bxy=a+bx. Hitung nilai aa, bb, dan interpretasikan maknanya.

  2. Dari hasil latihan nomor 1, hitung residual setiap titik dan nilai SSE.

  3. Sebuah resistor diuji dengan data berikut:

    (0,2,1,01),(0,4,2,03),(0,6,3,02),(0,8,4,04)(0{,}2,1{,}01), (0{,}4,2{,}03), (0{,}6,3{,}02), (0{,}8,4{,}04)

    Gunakan regresi linear V=a+bIV=a+bI untuk mengestimasi resistansi resistor.

  4. Jelaskan mengapa regresi linear lebih cocok daripada interpolasi untuk data eksperimen yang mengandung noise.

  5. Pada percobaan pengisian kapasitor, diperoleh data:

    tt dalam sVV dalam V
    16,3
    28,7
    39,5
    49,8
    59,9

    Apakah regresi linear cocok untuk data ini? Jelaskan alasannya.

  6. Buat satu contoh kasus teknik elektro di mana regresi linear dapat digunakan untuk kalibrasi sensor.

  7. Jelaskan mengapa jumlah residual biasa tidak cukup untuk menilai kualitas garis regresi.


10.7 Rangkuman

  1. Regresi adalah metode untuk membangun model yang mewakili tren data.
  2. Regresi linear sederhana menggunakan model y=a+bxy=a+bx.
  3. Berbeda dengan interpolasi, regresi tidak harus melewati semua titik data.
  4. Regresi cocok untuk data eksperimen yang mengandung noise.
  5. Metode kuadrat terkecil mencari garis yang meminimumkan jumlah kuadrat residual.
  6. Rumus slope adalah b=nxiyi(xi)(yi)nxi2(xi)2b=\frac{n\sum x_i y_i-(\sum x_i)(\sum y_i)}{n\sum x_i^2-(\sum x_i)^2}.
  7. Rumus intercept adalah a=yibxina=\frac{\sum y_i-b\sum x_i}{n}.
  8. Parameter aa menunjukkan nilai prediksi yy saat x=0x=0.
  9. Parameter bb menunjukkan perubahan yy untuk setiap kenaikan satu satuan xx.
  10. Residual adalah selisih antara nilai data dan nilai prediksi regresi.
  11. SSE adalah jumlah kuadrat residual dan digunakan untuk menilai kualitas model.
  12. Regresi linear banyak digunakan dalam teknik elektro, seperti verifikasi Hukum Ohm, kalibrasi sensor, karakterisasi komponen, dan prediksi respons sistem.