Generalized Linear Model (GLZ) merupakan prosedur alternatif dari General Linear Model (GLM) yang tidak mengharuskan data berdistribusi normal. Dengan demikian, GLZ menjadi prosedur pilihan lain saat kita mempunyai data yang tidak berdistribusi normal. Kalau data berdistribusi normal bisa tidak menggunakan GLZ? Jawabannya bisa.
Generalized Linear Model merupakan bentuk generalisasi dari General Linear Model (GLM), GLZ tidak mengikuti asumsi normalitas seperti GLM. Oleh karena itu, GLZ mengijinkan variabel tergantung tidak berdistribusi normal.
Dalam GLZ, variabel tergantung mempunyai hubungan linear dengan faktor-faktor dan kovariat-kovariatnya melalui fungsi penghubung (link function) khusus. Hal ini tidak sama dengan GLM yang menghubungkan antara variabel tergantung yang mempunyai hubungan linear dengan faktor-faktor dan kovariat-kovariatnya melalui identitas penghubung (identity link), yaitu distribusi normal. Beberapa contoh prosedur yang termasuk dalam model ini di antaranya model-model logistik untuk data binear (kategorikal), model-model loglinear dengan data frekeunsi, dan lain-lainnya.
Asumsi penggunaan prosedur GLZ ialah kasus-kasus (data) merupakan observasi yang independen dan tidak mengikuti asumsi normalitas.
Data yang digunakan dalam riset ialah :
- Variabel tergantung
dapat berupa data kuantitatif berskala metrik atau berskala interval dalam bentuk frekuensi atau biner (kategorikal). - Faktor
diasumsikan kategorikal, yaitu data dengan skala nominal - Kovariat
beruapa data berskala metrik, setidak-tidaknya berskala interval - Offset
data berskala metrik, setidak-tidaknya berskala interval
Tipe-tipe model pada prosedur GLZ :
- Respon Skala :
- Linear
Untuk memilih distribusi normal sebagai distribusi data dan identity sebagai fungsi penghubung. - Gamma with log link
untuk memilih distribusi Gamma sebagai distribusi data dan log sebagai fungsi penghubung (yang termasuk dalam distribusi ini ialah distribusi eksponensial dan Chi-Square). - Ordinal Logistic
untuk memilih distribusi multinominal (untuk data ordinal) sebagai distribusi data dan Cummulative Logit sebagai fungsi penghubung. Logit merupakan kependekan dari log odds unit, yaitu suatu unit pengukuran tambahan yang terdefinisi secara benar pada konteks pengujian yang bersifat tunggal homogen. Logit menghasilkan kesamaan dalam probilitas aslinnya tetapi makna dasarnya dapat berubah. Contoh yang mirip ialah temperatur diukur dengan derajat Fahrenheit dan Celcius. - Ordinal Probit
Untuk memilih distribusi Multinominal (untuk data ordinal) sebagai distribusi data dan Cummulative Probit sebagai fungsi penghubung. Probit adalah suatu pengukuran probabilitas statistik yang didasarkan pada deviasi dari suatu rata-rata distribusi normal.
- Linear
- Frekuensi (Count)
- Poisson Log Linear
Untuk memilih distribusi Poisson sebagai distribusi data dan log sebagai fungsi penghubung. - Negative Binomial With Log Link
Untuk memilih distribusi Binomial sebagai distribusi data dan Log sebagai fungsi penghubung.
- Poisson Log Linear
- Respon Biner (Binary Response)
- Binary Logistic
Untuk memilih distribusi Binomial sebagai distribusi data dan Logit sebagai fungsi penghubung. - Binary Probit
Untuk memmilih distribusi Binomial sebagai data dan Probit sebagai fungsi penghubung.
- Binary Logistic
- Campuran
- Tweedie with Log Link
Untuk memilih distribusi Tweedie sebagai distribusi data dan Log sebagai fungsi penghubung. Distribusi Tweedie merupakan distribusi rumpun dalam distribusi probabilitas distribusi normal kontinyu dan Gamma. - Tweedie with Identity Link
Untuk memilih distribusi Tweedie sebagai distribusi data dan Identity sebagai fungsi penghhubung.
- Tweedie with Log Link
- Pilihan Custom
Menentukan kombinasi distribusi fungsi penghubung.