Analisis regresi menganalisis hubungan antara pembolehubah
Regresi adalah teknik perlombongan data yang digunakan untuk meramalkan pelbagai nilai numerik (juga dipanggil nilai berterusan ), diberikan set data tertentu. Sebagai contoh, regresi mungkin digunakan untuk meramalkan kos produk atau perkhidmatan, diberikan pembolehubah lain.
Regresi digunakan di pelbagai industri untuk perancangan perniagaan dan pemasaran, ramalan kewangan, pemodelan alam sekitar dan analisis trend.
Regresi Vs. Pengkelasan
Regresi dan pengelasan adalah teknik perlombongan data yang digunakan untuk menyelesaikan masalah yang sama, tetapi mereka sering keliru. Kedua-duanya digunakan dalam analisis ramalan, tetapi regresi digunakan untuk meramalkan nilai numerik atau berterusan sementara klasifikasi menyerahkan data ke dalam kategori diskret.
Sebagai contoh, regresi akan digunakan untuk meramalkan nilai rumah berdasarkan kedudukannya, kaki persegi, harga ketika terakhir dijual, harga rumah yang serupa, dan faktor lain. Pengelasan akan teratur sekiranya anda mahu mengorganisasikan rumah ke dalam kategori, seperti walkability, saiz lot atau kadar jenayah.
Jenis-jenis Teknik Regresi
Regresi bentuk paling mudah dan tertua ialah regresi linier yang digunakan untuk menganggarkan hubungan antara dua pembolehubah. Teknik ini menggunakan formula matematik garis lurus (y = mx + b). Secara ringkas, ini bermakna bahawa, diberi graf dengan Y dan paksi X, hubungan antara X dan Y adalah garis lurus dengan beberapa penglihatan. Sebagai contoh, kita mungkin mengandaikan bahawa, memandangkan peningkatan populasi, pengeluaran makanan akan meningkat pada kadar yang sama - ini memerlukan hubungan yang kuat dan linear antara dua angka. Untuk memvisualisasikan ini, pertimbangkan graf di mana paksi Y menjejaki peningkatan populasi, dan paksi X menjejaki pengeluaran makanan. Apabila nilai Y meningkat, nilai X akan meningkat pada kadar yang sama, menjadikan hubungan di antara mereka garis lurus.
Teknik lanjutan, seperti regresi berganda, meramalkan hubungan antara pemboleh ubah berganda - sebagai contoh, adakah ada kaitan antara pendapatan, pendidikan dan mana yang memilih untuk hidup? Penambahan lebih banyak pembolehubah dapat meningkatkan kerumitan ramalan. Terdapat beberapa jenis teknik regresi berganda termasuk standard, hierarki, setwise dan langkah demi langkah, masing-masing dengan aplikasi sendiri.
Pada ketika ini, penting untuk memahami apa yang kita cuba ramalkan (pembolehubah bergantung atau yang diramal ) dan data yang kami gunakan untuk membuat ramalan (pembolehubah bebas atau peramal ). Dalam contoh kami, kami ingin meramalkan lokasi di mana seseorang memilih untuk hidup (pembolehubah yang diramal ) yang diberikan pendapatan dan pendidikan (kedua-dua pemboleh ubah ramalan ).
- Regresi berganda standard menganggap semua pemboleh ubah ramalan pada masa yang sama. Sebagai contoh 1) apakah hubungan antara pendapatan dan pendidikan (prediktor) dan pilihan kejiranan (yang diramalkan); dan 2) sejauh manakah setiap peramal individu menyumbang kepada hubungan itu?
- Regresi berganda langkah demi langkah menjawab soalan yang sama sekali berbeza. Algoritma regresi stepwise akan menganalisis yang peramal digunakan untuk meramal pilihan kejiranan - yang bermaksud bahawa model bertahap menilai susunan kepentingan pemboleh ubah ramalan dan kemudian memilih subset yang relevan. Masalah regresi jenis ini menggunakan "langkah-langkah" untuk membangunkan persamaan regresi. Memandangkan jenis regresi ini, semua ramalan mungkin tidak muncul dalam persamaan regresi akhir.
- Regresi hierarki , seperti langkah demi langkah, adalah proses berurutan, tetapi pemboleh ubah ramalan dimasukkan ke dalam model dalam susunan yang ditentukan terlebih dahulu terlebih dahulu, iaitu algoritma tidak mengandungi set persamaan terbina dalam untuk menentukan urutan di mana untuk masukkan peramal. Ini digunakan paling kerap apabila individu mewujudkan persamaan regresi mempunyai pengetahuan ahli bidang.
- Regresi saringan juga sama dengan langkah demi langkah tetapi menganalisis set pemboleh ubah dan bukan pemboleh ubah individu.