Jenis Metode Analisis Data

Apabila terdapat data yang berisi x observasi dengan variabel adalah y variabel. y variabel dibagi kedalam 2 kelompok atau subset. Uji statistik untuk menganalisis set data, set seperti ini disebut metode dependen (dependence methods). Metode dependen menguji ada tidaknya hubungan dua set variabel. Jika si peneliti atas dasar teori yang ada menyatakan bahwa satu variabel dari subset adalah variabel bebas (independent variable) dan variabel lainnya dari subset adalah variabel terkait (dependent variable), maka tujuan dari metode dependen adalah menentukan untuk mengelompokkan ke dalam variabel bebas dan variabel terikat, maka tujuan dari jenis set data seperti ini adalah mengidentifikasi bagaimana dan mengapa variabel tersebut saling berkaitan satu sama lainnya. Metode statistik yang sesuai untuk menganalisis data seperti ini disebut metode interdependen (interdependence methods).

Metode Dependen
Metode dependen dapat dibagi menjadi : 
1. Satu variabel terikat (metrik) dan satu variabel bebas (non-metrik)
Metode statistik untuk satu variabel terikat dan satu variabel bebas sering disebut metode univariat (univariate methods), sedangkan metode statistik untuk set data dengan lebih dari satu variabel bebas dan lebih dari satu variabel terikat disebut dengan metode multivariat (multivariate methods). Jadi metode univariat merupakan kasus khusus metode multivariat. Contohnya jika kita ingin mengetahui apakah ada perbedaan antara keluarga berkulit putih dan hitam sebagai variabel bebas (Race) terhadap Gaji kepala keluarga (Earns) sebagai variabel terikat. Di sini pengukuran variabel bebas bersifat non-metrik dengan dua kategori yaitu kategori 1 untuk keluarga putih dan 2 keluarga berkulit hitam. Sedangkan pengukuran variabel terikat gaji kepala keluarga merupakan ukuran metrik. Uji statistik yang dapat digunakan adalah uji beda rata-rata  atau independent t-test (uji beda independen) dan paired t-test (uji beda berpasangan).
Apabila variabel bebas merupakan ukuran non-metrik dengan kategori lebih dari 2 (dua) dan variabel terikat dengan pengukuran metrik, misalkan dalam kasus apakah ada prebedaan gaji kepala keluarga dilihat dari tempat tinggal mereka (region) yang dibagi ke dalam empat kategori yaitu 1 untuk Northest, 2 untuk Northcentral, 3 untuk South dan 4 untuk West. Alat uji untuk kasus ini adalah Analysis of variance (ANOVA).

2. Dua atau lebih variabel terikat (metrik) dan dua atau lebih variabel bebas (non-metrik)
Metode statistik untuk menguji lebih dari satu variabel terikat (metrik) dan lebih dari satu variabel bebas (non-metrik) adalah Multivariate Analysis of Variance (MANOVA). Berikut ini kasus yang dapat dianalisis dengan MANOVA :
  1. Variabel terikat (metrik) lebih dari satu dan satu variabel bebas (non-metrik). Seperti apakah rata-rata gaji kepala keluarga (EARNS) dan total income anggota keluarga (INCOME) berbeda secara nyata untuk tiap region (REG).
  2. Variabel terikat (metrik) lebih dari satu dan variabel bebas (non-metrik) lebih dari satu. Seperti apakah rat-arata gaji kepala keluarga (EARNS) dan total income anggota keluarga (INCOME) berbeda secara nyata untuk tiap region (REG) dan ras (RACE).
3. Satu variabel terikat (metrik) dan satu atau lebih variabel bebas (metrik)
Metode statistik untuk menguji hubungan antara satu variabel terikat (metrik) dan satu atau lebih variabel bebas (metrik) adalah regresi. Regresi sederhana (simple regression) untuk menguji pengaruh satu variabel bebas (metrik) terhadap satu variabel terikat (metrik), sedangkan untuk lebih dari satu variabel bebas (metrik) disebut regresi berganda (multiple regression). Misalkan kita ingin mengetahui pengaruh jumlah anggota keluarga (SIZE), gaji kepala keluarga (EARNS), kekayaan keluarga (WEALTH) dan tingkat tabungan keluarga (SAVING) terhadap total income anggota keluarga (INCOME). Hubungan antara satu variabel terikat (metrik) dan lebih dari satu variabel bebas (metrik) dapat ditulis dalam persamaan linear sebagai berikut:

INCOME = b0 + b1 SIZE + b2 EARNS + b3 WEALTH + b4 SAVING + e

Tujuan dari teknik regresi adalah menaksir besarnya paramater b0, b1, b2, b3 dan b4 dari model di atas.

4. Satu variabel terikat (non-metrik) dan lebih dari satu variabel bebas (metrik)
Sebagai contoh variabel terikat adalah intensitas membeli produk (PI) yang diukur dengan skala nominal. Responden diminta untuk menjawab apakah akan membeli produk (1) atau tidak akan membeli produk (0). Sedangkan variabel bebasnya adalah Age (umur), Income, Education dan Life style (gaya hidup) yang semuanya diukur dengan ukuran interval atau rasio, maka kita sekarang mempunyai set data dimana variabel terikatnya adalah kategori atau nominal dan variabel bebasnya adalah metrik atau kontinyu. Persoalan uji statistik pada model seperti ini adalah menentukan apakah kedua grup yaitu pembeli atau non-pembeli produk secara signifikan berbeda dikaitkan dengan variabel bebas. Jika hasilnya memang nyata berbeda, pertanyaan selanjutnya adalah apakah variabel-variabel bebas dapat digunakan untuk membentuk persamaan prediksi atau aturan klasifikasi untuk mengelompokkan konsumen ke dalam dua kelompok pembeli dan non-pembeli. Metode statistik untuk menjawab persoalan seperti ini adalah analisis diskriminan (Discriminant analysis). Asumsi yang mendasari analisis diskriminan adalah data harus berdistribusi normal dan jumlah sampel untuk kategori variabel terikatnya yaitu pembeli dan non-pembeli harus sebanding 50% pembeli dan 50% non-pembeli.
Apabila variabel bebasnya kombinasi antara metrik dan nominal (non-metrik), maka asumsi normalitas multivariat tidak akan dipenuhi. Penyimpangan dari asumsi normalitas multivariat mempengaruhi signifikansi uji statistik dan tingkat ketepatan klasifikasi. Jika hal ini terjadi maka sebaiknya menggunakan uji statistik logistic regression. Logistic regression juga tidak mensyaratkan jumlah sampel untuk kategori variabel terikat yaitu pembeli dan non-pembeli harus sebanding.

5. Lebih dari satu variabel terikat (metrik) dan lebih dari satu variabel bebas (metrik)
Misalkan kita punya 2 variabel terikat yaitu pendapatan kepala keluarga (EARNS) dan income keluarga (INCOME) serta dua variabel bebas tabungan keluarga (SAVING) dan kekayaan keluarga (WEALTH). SAVING dan WEALTH berpengaruh langsung terhadap INCOME dan berpengaruh tidak langsung lewat EARNS baru ke INCOME. Seperti gambar di bawah ini :


Alat analisis model seperti di atas adalah analisis jalur (path analysis) jika variabelnya bersifat observed, tetapi jika variabelnya dalam bentuk laten (unobserved) maka menggunakan alat uji model persamaan struktural (Structural Equation Model atau SEM).

Tabel berikut ini menyajikan metode statistik dependen:
No Variabel Dependen Variabel Independen Uji Statistik
1 satu skala metrik satu non-metrik dengan dua kategori Uji beda t-test
2 satu skala metrik satu non-metrik dengna lebih 2 kategori Analysis of Variance (ANOVA)
3 lebih dari satu metrik satu atau lebih non-metrik Multivariate Analysis of Variance (MANOVA)
4 satu atau lebih metrik lebih dari satu metrik Canonical Correlations
5 satu non-metrik dua kategori satu atau lebih metrik Analisis Diskriminan
6 satu non-metrik lebih dari dua kategori satu atau lebih metrik Analisis Multiple
7 satu non-metrik dua kategori satu atau lebih metrik dan non-metrik Diskriminan
8 lebih dari satu metrik lebih dari satu metrik Logistic Regression

Metode Interdependen
Ada kemungkinan kita tidak dapat mengelompokkan set data yang ada ke dalam variabel terikat maupun variabel bebas. Pada situasi seperti ini tujuan utama dari analisis data adalah memahami atau mengidentifikasi mengapa dan bagaimana variabel-variabel tersebut saling berkorelasi. Tabel berikut ini menyajikan metode statistik untuk menguji metode interdependen.

Jumlah Variabel Metrik Non-Metrik
Dua Variabel Korelasi sederhana
  • Tabel kontjensi two-way
  • Loglinear models
Lebih dari dua variabel
  • Principle Components
  • Analisis faktor
  • Tabel kontinjensi Multiway
  • Loglinear models
  • Correspondence analysis

1. Variabel Metrik
Principle Components Analysis
Jika seorang analisis keuangan memiliki sejumlah rasio keuangan (katakan 100 rasio) yang dapat ia gunakan untuk menentukan kesehatan keuangan suatu perusahaan. Untuk tujuan ini analisis keuangan dapat menggunakan semua 100 rasio atau sejumlah indek komposit. Setiap indek komposit dibentuk dari menjumlahkan atau rata-rata tertimbang dari 100 rasio. Jelaslah bahwa lebih mudah membandingkan peruashaan dengan menggunakan dua indek komposit daripada menggunakan 100 rasio keuangan. Masalah yang dihadapi analisis direduksi menjadi mengidentifikasi prosedur atau aturan untuk membentuk dua indek komposit. Principal components analysis adalah teknik yang cocok untuk tujuan ini. Teknik ini kadang-kadang disebut sebagai teknik reduksi data oleh karena mencoba mereduksi jumlah besar variael menjadi indek komposit yang sedikit. 

Analisis Faktor
Jika seorang psikolog pendidikan memiliki nilai mahasiswa untuk mata kuliah (matematika, kimia, sejarah, bahasa Inggris dan Perancis) dan ingin mengamati bahwa nilai-nilai tersebut saling berkorelasi. Si psikologi ingin menentukan mengapa nilai-nilai tersebut saling berkorelasi atau apakah yang menjadi alasan atau faktor dapat digunakan untuk mengidentifikasi faktor-faktor yang menjadi penyebab korelasi antar nilai mata kuliah. Analisis faktor mengidentifikasi beberapa faktor yang menjadi penyebab korelasi di antara jumlah besar variabel dan teknik ini juga dikelompokkan sebagai teknik reduksi. Dalam hal ini analisis faktor dapat dipandang sebagai teknik untuk mengidentifikasi kelompok atau cluster suatu variabel dimana korelasi variabel dalam setiap cluster lebih tinggi daripada korelasi variabel cluster lainnya.

2. Variabel Non-Metrik
Loglinear Models
Jika kita ingin membuat tabel klasifikasi silang antara region (REG) dengan empat kategori dan ras (RACE) dengan dua kategori, maka data seperti ini dapat dianalisis dengan berbagai metode. Salah satu teknik yang sangat populer adalah analisis tabulasi silang (crosstabulation) atau analisis tabel kontijensi untuk menentukan ada tidaknya hubungan asosiasi antara dua variabel tersebut. Alternatif lain dapat menggunakan loglinear model untuk menaksir probabilitas bahwa satu observasi masuk dalam cell sebagai fungsi variabel bebas. Loglinear juga dapat digunakan untuk menguji hubungan asosiasi diantara lebih dari dua variabel kategori.

Analisis Korespondensi
Jika kita mempunyai tabel kontijensi atau tabel tabulasi silang besar (misal 20 x 20 tabel). Interpretasi terhadap tabel yang besar ini dapat disederhanakan jika beberapa komponen menggambarkan sebagian besar dari hubungan antara baris dan kolom dapat diidentifikasi. Analisis korespondensi bertujuan untuk memecahkan hal ini. Jadi analisis korespondensi sama identik dengan components analysis untuk data non-metrik. Loglinear model dan analisis korespondensi dapat digeneralisir menjadi tabel kontijensi multiway. Tabel kontijensi multiway adalah tabulasi silang untuk lebih dari dua variabel. 

Baca Juga