Senin, 18 Juni 2012

Bentuk-bentuk Validitas

Pada tahun 1940-an dan awal tahun 1950 para ahli pengukuran pendidikan telah melakukan berbagai macam pengkajian terhadap bagaimana menentukan dan menilai validitas. Pada tahun 1954 misalnya The American Psicological Association (APA) melalui Technical Reommendation for Psychological Test and Diasnostic Techniques mengusulkan empat pendekatan yang sering dinamakan empat muka validitas (four faces of validity) yang di gunakan untuk menentukan validitas yaitu:
1)  Validitas Isi (content validity)
2)  Validitas Konstruk (Konstruct validity)
3)  Validitas Prediksi (Predictive validity)
4)  Validitas Konkuren (Concurrent validity)

Kempat bentuk validitas tersebut sangat tepat sesuai dengan tujuanya. Sebagai contoh, untuk penilaian pendidikan misalnya, validitas isi merupakan hal yang paling berguna. Untuk kepentingan pribadi misalnya, validitas prediktif lebih bermanfaat. Landy (1987) memandang keempat bentuk ini sebagai kumpulan perangko (stamp collecting). Ia berpandangan bahwa keempat validitas ini harus di pandang dari skor ketimbang hanya membedakan bentuk, para ahli dewasa ini lebih sepakat untuk melihat validitas dalam kerangka memahami skor dan implikasinya. Messick (1989) misalnya mengemukakan bahwa validitas senantisa berkaitan dengan penemuan sains untuk memaknai skor.

1. Validitas Isi
Validitas isi (content validity) sering pula di namakan validitas kurikulum yang mengandung arti bahwa suatu alat ukur di pandang valid apabila sesuai dengan isi kurikulum yang hendak di ukur.

Salah satu cara yang di gunakan untuk menentukan validitas adalah dengan mengkaji isi tes itu. Sebuah tes misalnya terdiri atas 25 soal penjumlahan dan pengurangan sangat baik di gunakan untuk mengukur kemampuan matematika di bandingkan dengan tes yang terdiri atas 10 soal tentang olah raga tetapi tidak ada hal-hal yang berkaitan dengan penjumlahan dan pengurangan. Validitas isi di tentukan dengan melihat apakah soal-soal yang di gunakan telah menunjukkan sampel atribut yang di ukur. Dengan demikian menurut Guion (1997), validitas isi sangat bergantung kepada dua hal yaitu tes itu sendiri dan proses yang mempengaruhi dalam merespon tes. Sebagi contoh misalnya tes tertulis yang di persiapkan untuk pekerjaan mungkin tidak menyajikan pengukuran yang valid untuk kemampuan pegawai melakuka pekerjaan, sekalipun mungkin saja tes itu sudah merupakan alat yang valid untuk mengukur pengetahuan tentang apa yang harus di kerjakan.

Salah satu cara untuk memperoleh validitas isi adalah dengan melihat soal-soal yang membentuk tes itu. Jika keseluruhan soal nampak mengukur apa yang seharusnya tes itu di gunakan, tidak di ragukan lagi bahwa validitas isi sudah terpenuhi.

Dalam dunia pendidikan, sebuah tes di katakan memiliki isi apabila mengukur sesuai dengan domain dan tujuan khusus tertentu yang sama dengan isi pelajaran yang telah di berikan di kelas. Soal matematika di katakan valid apabila hanya mengukur kemampuan matematika, bukan mengukur kemampuan bahasa. Ketika kita mengatakan aka mengukur kemampuan X Peserta tes, kita harus mengukur atribut karakteristik khusus yang berkaitan dengan X peserta tes yang akan di ukur (Guion, 1977). Sebagai contoh, sebuah tes di rancang untuk mengukur kemampuan bermain bola basket dalam mata pelajaran Penjaskes misalnya, tentunya hal yang di ukur haruslah antara lain berkaitan dengan kemampuan berlari, membawa bola, menembak bola, dan mendreble bola. Hal-hal yang di ukur mungkin sangat luas seperti untuk kemampuan membaca misalnya, atau bahkan sangat sempit seperti untuk kemmpuan penjumlahan. Tabel 1 berikut ini menunjukkan domain yang di ukur dalam pengetahuan alam terpadu. Tentu saja, tidak semua domain yang akan di ukur dalam tes harus sama dengan tabel 1.

TABEL 1
Deskripsi domain yang hendak di ukur dalam tes IPA terpadu

Kemampuan yang di ukur
Fisika
Biologi
Kimia
Bumi Antariksa
Jumlah
Mengamati
1
1
-
-
2
Mengukur
1
-
1
1
3
Menbaca Tabel
-
1
1
1
3
Membaca Diagram
1
1
-
1
3
Membaca Grafik
1
1
-
-
2
Membaca/Interpretasi
1
-
1
1
3
Mengklasifikasi
1
-
1
-
2
Menginfering
1
1
1
-
3
Memprediksi
-
1
-
1
2
Menyimpulkan
-
1
1
1
3
Merancang percobaan
-
1
1
1
3
Reasoning
1
1
1
1
4
Problem solving
1
1
1
1
4
Berfikir kritis
1
-
1
1
3
Jumlah
10
10
10
10
40

Sebagian ahli tes berpendapat bahwa tidak ada satupun pendekatan statistic yang dapat digunakan untuk menentukan validitas isi suatu tes. Menurut Guion (1997), validitas isi hanya dapat ditentukan berdasarkan judgment para ahli.
Prosedur yang dapt di gunakan antara lain:
1)  Mendefinisikan domain yang hedak diukur
2)  Menentukan domain yang akan diukur oleh masing-masing soal
3)  Membandingkan masing-masing soal dengan domain yang sudah di tetapkan.

Sekalipun prosedur ini Nampak sederhana, tetapi dalam praktek terkadang sulit dilakukan. Kesulitan utama dalam prosedur ini adalah mendefinisikan domain yang hendak di ukur. Dalam buku tentang pedoman penulisan tes tertulis, domain ini sama halnya dengan kisi-kisi. Sebagi contoh misalnya, dalam menentukan soal fisika yang berkaitan dengan problem solving atau reasoning, beberapa ahli mungkin masih berdebat apakah suatu soal benar-benar telah masuk dalam kategori problem solving atau reasoning. Hal yang paling penting adalah adanya kesepakatan antara beberapa penulis tentang kemampuan yang di ukur oleh suatu soal.

2. Validitas Konstruk (Konstruct validity)
Konstruk (construct) adalah sesuatu yang berkaitan dengan fenomena dan objek yang abstrak, tetapi gejalanya dapat di amati dan dapat di ukur. Grafitasi, massa, kemampuan matematika, kemampuan bahasa inggris, kebahagiaan, dan kesedihan antara lain termasuk konstruk. Grafitasi misalnya dapat dijadikan sebagai contoh bagaimana memahami konstruk. Ketika buah apel jatuh ke tanah, komnstruk tentang grafitasi dapat di gunakan untuk menjelaskan dan memperkirakan perilaku (jatuhnya buah apel misalnya) yang di amati. Namun demikian, kita tidak dapat melihat yang di maksud dengan konstruk grafitasi itu sendiri. Hal yang dapat kita lihat hanyalah apel itu jatuh. Kita dapat mengukur grafitasi dan mengembangkan teori tentang grafitasi.

Validitas konstruk mengandung arti bahwa suatu alat ukur dikatakan valid apabila tidak cocok dengan konstruksi teoritik dimana tes itu di buat. Dengan kata lain sebuah tes di katakan memiliki validitas konstruksi apabila soal-soalnya mengukur setiap aspek berfikir seperti yang di uaraikan dalam standar kompetensi, kompetensi dasar, maupun indicator yang terdapat dalam kurikulum. Soal yang dapat di kembangkan dari kisi-kisi seperti Nampak pada table 2.2 haruslah beruapa soal yang sesuai dengan kemampuan mendeskripsikan berbagai bentuk pasar menurut struktur, mengidentifikasikan kebaikan dan keburukan bebtuk-bentuk pasar, serta memberi contoh berbagai bentuk pasar.

Konstruksi yang di maksud pada validitas ini bukanlah merupakan konstruksi seperti bangunan atau susunan, tetapi berupa rekaan psikologis yang berkaitan dengan aspek-aspek ingatan, pemahaman, aplikasi, analisis, sintesis, dan evaluasi. Konstruksi sebagaimana Nampak pada tabel 2 merupakan contoh kompetensi dasar, hasil belajar, dan indicator yang terdapat dalam kurikulum 2004.

TABEL 2
Kisi-kisi kompetensi Ekonomi SMA Kelas X

KOMPETENSI DASAR
MATERI POKOK
INDIKATOR
PENILAIAN
JENIS
BENTUK
Mendeskripsikan berbagai bentuk pasar menurut struktur
Bentuk-bentuk pasar
·  Mendeskripsikan berbagai bentuk pasar menurut struktur
·  Mengidentifikasikan ciri-ciri berbagai bentuk pasar
·  Mengidentifikasi kebaikan dan keburukan bentuk-bentuk pasar.
·  Memberi contoh berbagai bentuk pasar
Tertulis


Tertulis


Tertulis



Tertulis

Uraian


Uraian


Uraian



Uraian

3. Validitas Prediksi (Predictive validity)
Predictive validity menunjukkan kepada hubungan antara tes skor yang di peroleh peserta tes dengan keadaan yang akan terjadi di waktu yang akan datang. Sebuah dikatakan memiliki validitas prediksi apabila mempunyai kemampuan untuk memprediksikan apa yang akan terjadi di masa yang akan datang.

Contoh sederhana misalnya apa yang terjadi pada penerimaan peserta tes berdasarkan hasil tes seleksi setelah mereka lulus SMA. Peserta tes yang memiliki nilai yang bagus di tes seleksi tersebut lalu di terima diperguruan tinggi, di perkirakan akan berhasil ketika mereka belajar di perguruan tinggi. Apabila hal itu terjadi, maka tes masuk perguruan tinggi tersebut dikatakan memiliki validitas prediksi bagus. Sebaliknya, apabila hasil di perguruan tinggi kurang baik, maka tes seleksi di maksud tidak memiliki validitas yang bagus.
 
4. Validitas Konkuren (Concurrent validity)
Validitas concurrent atau validity ada sekarang menunjuk pada hubungan antara tes skor dengan yang dicapai dengankeadaan sekarang. Validitas ini dikenal sebagai validitas empiris. Sebuah tes dikatakan memiliki concurent validity apabila hasilnya sesuai dengan pengalaman. Tabel 3 berikut ini menunjukkan validitas konkuren untuk berbagai macam penilaian berbasis kelas.

TABEL 3
Validitas konkuren untuk beberapa penilaian berbasis kelas

Perbandingan
Korelasi
Ujian akhir nasional dan kuis di kelas
0.56
Ujian akhir nasional dan tugas
0.20
Soal benar salah dan pilihan ganda
0.31
Soal uraian dan benar salah
0.48
Soal pilihan ganda dan uraian
0.29-0.38
Teori dan praktek
0.35
4 buah soal uraian
0.13-0.32
Ujian dan studi kasus
0.41
Soal uraian dan kasus
0.61
Soal uraian dan tugas
0.54
Soal uraian dan partisipasi di kelas
0.10
Partisipasi di kelas dan studi kasus
0.70


Bacaan yang Mungkin Terkait:

5 komentar:

  1. makasih banyak mas blognya. saya sudah baca dan ini sangat membantu. sekali lagi trima kasih banyak.

    BalasHapus
  2. Makasih postingnya :),
    Saya juga punya sedikit referensi untuk validitas, mungkin bisa membantu

    http://unityofscience.org/category/educational-evaluation/

    BalasHapus
  3. Makasih postingnya :),
    Saya juga punya sedikit referensi untuk validitas, mungkin bisa membantu

    http://unityofscience.org/category/educational-evaluation/

    BalasHapus
  4. Makasih banyak ya atas informasinya, ini membantu banget buat persiapan uas psikometri.

    BalasHapus
  5. Terima kasih mas bloknya. dan referensinya

    BalasHapus