Olah Data Penelitian Generalized Linear Model

Generalized Linear Model (GLZ) merupakan prosedur alternatif dari General Linear Model (GLM) yang tidak mengharuskan data berdistribusi normal. Dengan demikian, GLZ menjadi prosedur pilihan lain saat kita mempunyai data yang tidak berdistribusi normal. Kalau data berdistribusi normal bisa tidak menggunakan GLZ? Jawabannya bisa.

Generalized Linear Model merupakan bentuk generalisasi dari General Linear Model (GLM), GLZ tidak mengikuti asumsi normalitas seperti GLM. Oleh karena itu, GLZ mengijinkan variabel tergantung tidak berdistribusi normal.

Dalam GLZ, variabel tergantung mempunyai hubungan linear dengan faktor-faktor dan kovariat-kovariatnya melalui fungsi penghubung (link function) khusus. Hal ini tidak sama dengan GLM yang menghubungkan antara variabel tergantung yang mempunyai hubungan linear dengan faktor-faktor dan kovariat-kovariatnya melalui identitas penghubung (identity link), yaitu distribusi normal. Beberapa contoh prosedur yang termasuk dalam model ini di antaranya model-model logistik untuk data binear (kategorikal), model-model loglinear dengan data frekeunsi, dan lain-lainnya.

Asumsi penggunaan prosedur GLZ ialah kasus-kasus (data) merupakan observasi yang independen dan tidak mengikuti asumsi normalitas.

Data yang digunakan dalam riset ialah :

  1. Variabel tergantung
    dapat berupa data kuantitatif berskala metrik atau berskala interval dalam bentuk frekuensi atau biner (kategorikal).
  2. Faktor
    diasumsikan kategorikal, yaitu data dengan skala nominal
  3. Kovariat
    beruapa data berskala metrik, setidak-tidaknya berskala interval
  4. Offset
    data berskala metrik, setidak-tidaknya berskala interval

Tipe-tipe model pada prosedur GLZ :

  1. Respon Skala :
    • Linear
      Untuk memilih distribusi normal sebagai distribusi data dan identity sebagai fungsi penghubung.
    • Gamma with log link
      untuk memilih distribusi Gamma sebagai distribusi data dan log sebagai fungsi penghubung (yang termasuk dalam distribusi ini ialah distribusi eksponensial dan Chi-Square).
    • Ordinal Logistic
      untuk memilih distribusi multinominal (untuk data ordinal) sebagai distribusi data dan Cummulative Logit sebagai fungsi penghubung. Logit merupakan kependekan dari log odds unit, yaitu suatu unit pengukuran tambahan yang terdefinisi secara benar pada konteks pengujian yang bersifat tunggal homogen. Logit menghasilkan kesamaan dalam probilitas aslinnya tetapi makna dasarnya dapat berubah. Contoh yang mirip ialah temperatur diukur dengan derajat Fahrenheit dan Celcius.
    • Ordinal Probit
      Untuk memilih distribusi Multinominal (untuk data ordinal) sebagai distribusi data dan Cummulative Probit sebagai fungsi penghubung. Probit adalah suatu pengukuran probabilitas statistik yang didasarkan pada deviasi dari suatu rata-rata distribusi normal.
  2. Frekuensi (Count)
    • Poisson Log Linear
      Untuk memilih distribusi Poisson sebagai distribusi data dan log sebagai fungsi penghubung.
    • Negative Binomial With Log Link
      Untuk memilih distribusi Binomial sebagai distribusi data dan Log sebagai fungsi penghubung.
  3. Respon Biner (Binary Response)
    • Binary Logistic
      Untuk memilih distribusi Binomial sebagai distribusi data dan Logit sebagai fungsi penghubung.
    • Binary Probit
      Untuk memmilih distribusi Binomial sebagai data dan Probit sebagai fungsi penghubung.
  4. Campuran
    • Tweedie with Log Link
      Untuk memilih distribusi Tweedie sebagai distribusi data dan Log sebagai fungsi penghubung. Distribusi Tweedie merupakan distribusi rumpun dalam distribusi probabilitas distribusi normal kontinyu dan Gamma.
    • Tweedie with Identity Link
      Untuk memilih distribusi Tweedie sebagai distribusi data dan Identity sebagai fungsi penghhubung.
  5. Pilihan Custom
    Menentukan kombinasi distribusi fungsi penghubung.

Daftar Link Artikel Terkait :
olah data