Pada tahun 1940-an dan awal tahun 1950 para ahli pengukuran pendidikan
telah melakukan berbagai macam pengkajian terhadap bagaimana menentukan dan
menilai validitas. Pada tahun 1954 misalnya The
American Psicological Association (APA) melalui Technical Reommendation for Psychological Test and Diasnostic
Techniques mengusulkan empat pendekatan yang sering dinamakan empat muka
validitas (four faces of validity)
yang di gunakan untuk menentukan validitas yaitu:
1) Validitas Isi (content
validity)
2) Validitas Konstruk (Konstruct
validity)
3) Validitas
Prediksi (Predictive validity)
Kempat bentuk validitas
tersebut sangat tepat sesuai dengan tujuanya. Sebagai contoh, untuk penilaian
pendidikan misalnya, validitas isi merupakan hal yang paling berguna. Untuk
kepentingan pribadi misalnya, validitas prediktif lebih bermanfaat. Landy
(1987) memandang keempat bentuk ini sebagai kumpulan perangko (stamp collecting). Ia berpandangan bahwa
keempat validitas ini harus di pandang dari skor ketimbang hanya membedakan
bentuk, para ahli dewasa ini lebih sepakat untuk melihat validitas dalam
kerangka memahami skor dan implikasinya. Messick (1989) misalnya mengemukakan
bahwa validitas senantisa berkaitan dengan penemuan sains untuk memaknai skor.
1. Validitas Isi
Validitas isi (content validity)
sering pula di namakan validitas kurikulum yang mengandung arti bahwa suatu
alat ukur di pandang valid apabila sesuai dengan isi kurikulum yang hendak di
ukur.
Salah satu cara yang di gunakan untuk menentukan validitas adalah dengan
mengkaji isi tes itu. Sebuah tes misalnya terdiri atas 25 soal penjumlahan dan
pengurangan sangat baik di gunakan untuk mengukur kemampuan matematika di
bandingkan dengan tes yang terdiri atas 10 soal tentang olah raga tetapi tidak
ada hal-hal yang berkaitan dengan penjumlahan dan pengurangan. Validitas isi di
tentukan dengan melihat apakah soal-soal yang di gunakan telah menunjukkan
sampel atribut yang di ukur. Dengan demikian menurut Guion (1997), validitas
isi sangat bergantung kepada dua hal yaitu tes itu sendiri dan proses yang
mempengaruhi dalam merespon tes. Sebagi contoh misalnya tes tertulis yang di
persiapkan untuk pekerjaan mungkin tidak menyajikan pengukuran yang valid untuk
kemampuan pegawai melakuka pekerjaan, sekalipun mungkin saja tes itu sudah
merupakan alat yang valid untuk mengukur pengetahuan tentang apa yang harus di
kerjakan.
Salah satu cara untuk memperoleh validitas isi adalah dengan melihat
soal-soal yang membentuk tes itu. Jika keseluruhan soal nampak mengukur apa
yang seharusnya tes itu di gunakan, tidak di ragukan lagi bahwa validitas isi
sudah terpenuhi.
Dalam dunia
pendidikan, sebuah tes di katakan memiliki isi apabila mengukur sesuai dengan
domain dan tujuan khusus tertentu yang sama dengan isi pelajaran yang telah di
berikan di kelas. Soal matematika di katakan valid apabila hanya mengukur
kemampuan matematika, bukan mengukur kemampuan bahasa. Ketika kita mengatakan
aka mengukur kemampuan X Peserta tes, kita harus mengukur atribut karakteristik
khusus yang berkaitan dengan X peserta tes yang akan di ukur (Guion, 1977).
Sebagai contoh, sebuah tes di rancang untuk mengukur kemampuan bermain bola
basket dalam mata pelajaran Penjaskes misalnya, tentunya hal yang di ukur haruslah
antara lain berkaitan dengan kemampuan berlari, membawa bola, menembak bola,
dan mendreble bola. Hal-hal yang di ukur mungkin sangat luas seperti untuk
kemampuan membaca misalnya, atau bahkan sangat sempit seperti untuk kemmpuan
penjumlahan. Tabel 1 berikut ini menunjukkan domain yang di ukur dalam
pengetahuan alam terpadu. Tentu saja, tidak semua domain yang akan di ukur
dalam tes harus sama dengan tabel 1.
TABEL 1
Deskripsi domain
yang hendak di ukur dalam tes IPA terpadu
Kemampuan yang di ukur
|
Fisika
|
Biologi
|
Kimia
|
Bumi Antariksa
|
Jumlah
|
Mengamati
|
1
|
1
|
-
|
-
|
2
|
Mengukur
|
1
|
-
|
1
|
1
|
3
|
Menbaca Tabel
|
-
|
1
|
1
|
1
|
3
|
Membaca Diagram
|
1
|
1
|
-
|
1
|
3
|
Membaca Grafik
|
1
|
1
|
-
|
-
|
2
|
Membaca/Interpretasi
|
1
|
-
|
1
|
1
|
3
|
Mengklasifikasi
|
1
|
-
|
1
|
-
|
2
|
Menginfering
|
1
|
1
|
1
|
-
|
3
|
Memprediksi
|
-
|
1
|
-
|
1
|
2
|
Menyimpulkan
|
-
|
1
|
1
|
1
|
3
|
Merancang percobaan
|
-
|
1
|
1
|
1
|
3
|
Reasoning
|
1
|
1
|
1
|
1
|
4
|
Problem solving
|
1
|
1
|
1
|
1
|
4
|
Berfikir kritis
|
1
|
-
|
1
|
1
|
3
|
Jumlah
|
10
|
10
|
10
|
10
|
40
|
Sebagian
ahli tes berpendapat bahwa tidak ada satupun pendekatan statistic
yang dapat digunakan untuk menentukan validitas isi suatu tes. Menurut Guion
(1997), validitas isi hanya dapat ditentukan berdasarkan judgment para ahli.
Prosedur yang dapt di gunakan
antara lain:
1) Mendefinisikan
domain yang hedak diukur
2) Menentukan
domain yang akan diukur oleh masing-masing soal
3) Membandingkan
masing-masing soal dengan domain yang sudah di tetapkan.
Sekalipun
prosedur ini Nampak sederhana, tetapi dalam praktek terkadang sulit dilakukan.
Kesulitan utama dalam prosedur ini adalah mendefinisikan domain yang hendak di
ukur. Dalam buku tentang pedoman penulisan tes tertulis, domain ini sama halnya
dengan kisi-kisi. Sebagi contoh misalnya, dalam menentukan soal fisika yang
berkaitan dengan problem solving atau reasoning, beberapa ahli mungkin masih
berdebat apakah suatu soal benar-benar telah masuk dalam kategori problem
solving atau reasoning. Hal yang paling penting adalah adanya kesepakatan
antara beberapa penulis tentang kemampuan yang di ukur oleh suatu soal.
2. Validitas Konstruk (Konstruct validity)
Konstruk
(construct) adalah sesuatu yang
berkaitan dengan fenomena dan objek yang abstrak, tetapi gejalanya dapat di
amati dan dapat di ukur. Grafitasi, massa, kemampuan matematika, kemampuan
bahasa inggris, kebahagiaan, dan kesedihan antara lain termasuk konstruk.
Grafitasi misalnya dapat dijadikan sebagai contoh bagaimana memahami konstruk.
Ketika buah apel jatuh ke tanah, komnstruk tentang grafitasi dapat di gunakan
untuk menjelaskan dan memperkirakan perilaku (jatuhnya buah apel misalnya) yang
di amati. Namun demikian, kita tidak dapat melihat yang di maksud dengan
konstruk grafitasi itu sendiri. Hal yang dapat kita lihat hanyalah apel itu
jatuh. Kita dapat mengukur grafitasi dan mengembangkan teori tentang grafitasi.
Validitas konstruk
mengandung arti bahwa suatu alat ukur dikatakan valid apabila tidak cocok
dengan konstruksi teoritik dimana tes itu di buat. Dengan kata lain sebuah tes
di katakan memiliki validitas konstruksi apabila soal-soalnya mengukur setiap
aspek berfikir seperti yang di uaraikan dalam standar kompetensi, kompetensi
dasar, maupun indicator yang terdapat dalam kurikulum. Soal yang dapat di
kembangkan dari kisi-kisi seperti Nampak pada table 2.2 haruslah beruapa soal
yang sesuai dengan kemampuan mendeskripsikan
berbagai bentuk pasar menurut struktur, mengidentifikasikan kebaikan dan
keburukan bebtuk-bentuk pasar, serta memberi contoh berbagai bentuk pasar.
Konstruksi
yang di maksud pada validitas ini bukanlah merupakan konstruksi seperti
bangunan atau susunan, tetapi berupa rekaan psikologis yang berkaitan dengan
aspek-aspek ingatan, pemahaman, aplikasi, analisis, sintesis, dan evaluasi.
Konstruksi sebagaimana Nampak pada tabel 2 merupakan contoh kompetensi dasar,
hasil belajar, dan indicator yang terdapat dalam kurikulum 2004.
TABEL 2
Kisi-kisi kompetensi Ekonomi SMA Kelas X
KOMPETENSI DASAR
|
MATERI POKOK
|
INDIKATOR
|
PENILAIAN
|
|
JENIS
|
BENTUK
|
|||
Mendeskripsikan
berbagai bentuk pasar menurut struktur
|
Bentuk-bentuk
pasar
|
·
Mendeskripsikan
berbagai bentuk pasar menurut struktur
·
Mengidentifikasikan
ciri-ciri berbagai bentuk pasar
·
Mengidentifikasi
kebaikan dan keburukan bentuk-bentuk pasar.
·
Memberi
contoh berbagai bentuk pasar
|
Tertulis
Tertulis
Tertulis
Tertulis
|
Uraian
Uraian
Uraian
Uraian
|
3. Validitas Prediksi (Predictive validity)
Predictive
validity menunjukkan kepada hubungan antara tes skor yang
di peroleh peserta tes dengan keadaan yang akan terjadi di waktu yang akan
datang. Sebuah dikatakan memiliki validitas prediksi apabila mempunyai
kemampuan untuk memprediksikan apa yang akan terjadi di masa yang akan datang.
Contoh sederhana
misalnya apa yang terjadi pada penerimaan peserta tes berdasarkan hasil tes
seleksi setelah mereka lulus SMA. Peserta tes yang memiliki nilai yang bagus di
tes seleksi tersebut lalu di terima diperguruan tinggi, di perkirakan akan
berhasil ketika mereka belajar di perguruan tinggi. Apabila hal itu terjadi,
maka tes masuk perguruan tinggi tersebut dikatakan memiliki validitas prediksi
bagus. Sebaliknya, apabila hasil di perguruan tinggi kurang baik, maka tes
seleksi di maksud tidak memiliki validitas yang bagus.
4. Validitas Konkuren (Concurrent validity)
Validitas concurrent
atau validity ada sekarang menunjuk
pada hubungan antara tes skor dengan yang dicapai dengankeadaan sekarang.
Validitas ini dikenal sebagai validitas empiris. Sebuah tes dikatakan memiliki concurent validity apabila hasilnya
sesuai dengan pengalaman. Tabel 3 berikut ini menunjukkan validitas konkuren
untuk berbagai macam penilaian berbasis kelas.
TABEL 3
Validitas konkuren untuk beberapa penilaian
berbasis kelas
Perbandingan
|
Korelasi
|
Ujian
akhir nasional dan kuis di kelas
|
0.56
|
Ujian
akhir nasional dan tugas
|
0.20
|
Soal
benar salah dan pilihan ganda
|
0.31
|
Soal
uraian dan benar salah
|
0.48
|
Soal
pilihan ganda dan uraian
|
0.29-0.38
|
Teori
dan praktek
|
0.35
|
4
buah soal uraian
|
0.13-0.32
|
Ujian
dan studi kasus
|
0.41
|
Soal
uraian dan kasus
|
0.61
|
Soal
uraian dan tugas
|
0.54
|
Soal
uraian dan partisipasi di kelas
|
0.10
|
Partisipasi
di kelas dan studi kasus
|
0.70
|
makasih banyak mas blognya. saya sudah baca dan ini sangat membantu. sekali lagi trima kasih banyak.
ReplyDeleteMakasih postingnya :),
ReplyDeleteSaya juga punya sedikit referensi untuk validitas, mungkin bisa membantu
http://unityofscience.org/category/educational-evaluation/
Makasih postingnya :),
ReplyDeleteSaya juga punya sedikit referensi untuk validitas, mungkin bisa membantu
http://unityofscience.org/category/educational-evaluation/
Makasih banyak ya atas informasinya, ini membantu banget buat persiapan uas psikometri.
ReplyDeleteTerima kasih mas bloknya. dan referensinya
ReplyDeleteThis comment has been removed by the author.
ReplyDelete