Menentukan Model Statistik Regresi

Analisis regresi menganalisis hubungan antara pembolehubah

Regresi adalah teknik perlombongan data yang digunakan untuk meramalkan pelbagai nilai numerik (juga dipanggil nilai berterusan ), diberikan set data tertentu. Sebagai contoh, regresi mungkin digunakan untuk meramalkan kos produk atau perkhidmatan, diberikan pembolehubah lain.

Regresi digunakan di pelbagai industri untuk perancangan perniagaan dan pemasaran, ramalan kewangan, pemodelan alam sekitar dan analisis trend.

Regresi Vs. Pengkelasan

Regresi dan pengelasan adalah teknik perlombongan data yang digunakan untuk menyelesaikan masalah yang sama, tetapi mereka sering keliru. Kedua-duanya digunakan dalam analisis ramalan, tetapi regresi digunakan untuk meramalkan nilai numerik atau berterusan sementara klasifikasi menyerahkan data ke dalam kategori diskret.

Sebagai contoh, regresi akan digunakan untuk meramalkan nilai rumah berdasarkan kedudukannya, kaki persegi, harga ketika terakhir dijual, harga rumah yang serupa, dan faktor lain. Pengelasan akan teratur sekiranya anda mahu mengorganisasikan rumah ke dalam kategori, seperti walkability, saiz lot atau kadar jenayah.

Jenis-jenis Teknik Regresi

Regresi bentuk paling mudah dan tertua ialah regresi linier yang digunakan untuk menganggarkan hubungan antara dua pembolehubah. Teknik ini menggunakan formula matematik garis lurus (y = mx + b). Secara ringkas, ini bermakna bahawa, diberi graf dengan Y dan paksi X, hubungan antara X dan Y adalah garis lurus dengan beberapa penglihatan. Sebagai contoh, kita mungkin mengandaikan bahawa, memandangkan peningkatan populasi, pengeluaran makanan akan meningkat pada kadar yang sama - ini memerlukan hubungan yang kuat dan linear antara dua angka. Untuk memvisualisasikan ini, pertimbangkan graf di mana paksi Y menjejaki peningkatan populasi, dan paksi X menjejaki pengeluaran makanan. Apabila nilai Y meningkat, nilai X akan meningkat pada kadar yang sama, menjadikan hubungan di antara mereka garis lurus.

Teknik lanjutan, seperti regresi berganda, meramalkan hubungan antara pemboleh ubah berganda - sebagai contoh, adakah ada kaitan antara pendapatan, pendidikan dan mana yang memilih untuk hidup? Penambahan lebih banyak pembolehubah dapat meningkatkan kerumitan ramalan. Terdapat beberapa jenis teknik regresi berganda termasuk standard, hierarki, setwise dan langkah demi langkah, masing-masing dengan aplikasi sendiri.

Pada ketika ini, penting untuk memahami apa yang kita cuba ramalkan (pembolehubah bergantung atau yang diramal ) dan data yang kami gunakan untuk membuat ramalan (pembolehubah bebas atau peramal ). Dalam contoh kami, kami ingin meramalkan lokasi di mana seseorang memilih untuk hidup (pembolehubah yang diramal ) yang diberikan pendapatan dan pendidikan (kedua-dua pemboleh ubah ramalan ).