Menu Blog

Friday, June 29, 2012

Pengujian Validitas Tes Hasil Belajar

A. Pendahuluan
Tes hasil belajar (THB) adalah alat ukur yang digunakan untuk melakukan pengukuran guna pengumpulan data hasil belajar. Sebagai sebuah alat ukur maka THB harus memenuhi syarat sebagai alat ukur yang baik. Alat ukur yang baik harus memenuhi dua syarat yaitu validitas dan reliabilitas. Oleh karena itu, sebelum digunakan untuk mengumpulkan data THB harus terlebih dulu di uji validitas dan reliabilitasnya.

B. Validitas
Validitas berhubungan dengan kemampuan untuk mengukur secara tepat sesuatu yang diinginkan diukur. Menurut Anastasi dan Urbina (1997 : 113), validitas berhubungan dengan apakah tes mengukur apa yang mesti  diukurnya dan seberapa baik dia melakukannya. Validitas merupakan derajat sejauh mana tes mengukur apa yang ingin diukur (Borg dan Gall, 1983: 275; Poppham, 1981 :98).

Pengujian validitas dapat dilakukan menggunakan beberapa metode. Menurut Nunally (1978: 88), pengukuran psikologis mempunyai tiga fungsi utama yaitu membuat hubungan statistik dengan variabel tertentu, mengambarkan wilayah isi tertentu dan mengukur atribut psikologis.

C. Konsep Korelasi
Korelasi berasal dari kata KO yang berarti saling dan relasi  yang berarti hubungan, sehingga korelasi berarti saling hubungan. Dua hal atau lebih dikatakan mempunyai saling hubungan,  apabila di antara mereka terdapat kesejajaran nilai.

Gejala-gejala dalam korelasi terdiri dari variabel bebas  dan terikat. Variabel bebas (independen) adalah variabel yang menimbulkan terjadinya variabel terikat yang biasa diberikan notasi X. Variabel terikat (dependen) adalah variabel yang  disebabkn oleh variabel bebas yang biasa diberikan notasi Y. Tingkat hubungan biasa diberikan notasi r (relation) dan hubungan variabel X dan Y dinotasikan dengan rxy. Dalam memberikan penafsiran koefisien reliabilitas, rxy akan dibandingkan dengan rtabel. Nilai rtabel  akan menjadi penentu apakah hubungan X dan Y (rxy) signifikan atau terjadi secara kebetulan.

Besar rtabel sangat tergantung kepada jumlah peserta (N) dan taraf kesalahannya (a). Pada N yang lebih besar maka kemungkinan kasalahan kesimpulan yang dibuat mengenai hubungan X dan Y lebih kecil sehingga semakin kecil rtabel yang diperlukan. Sebaliknya bila N lebih kecil maka diperlukan rtabel yang lebih besar untuk mengantisipasi peluang kesalahan dalam mengambil kesimpulan mengenai hubungan X dan Y.

Korelasi dapat terjadi pada berbagi keadan. (1) bila bertambahnya nilai suatu gejala (X) diikuti pula dengan bertambahnya nilai gejala lain (Y) maka kedua gejala cenderung mempunyai korelasi positif. Pada keadaan sempurna dimana etiap bertambahnya X diikuti bertambahnya Y maka korelasi X dan Y adalah sebesar +1,00. (2) bila bertambahnya nilai suatu gejala (X) diikuti makin berkurangnya nilai gejala lain (Y) maka kedua gejala cenderung mempunyai korelasi negatif. Pada keadaan sempurna dimana setiap bertambahnya X diikuti dengan berkurangnya Y dan berkurangnya X diikuti bertambahnya Y maka korelasi X dan Y adalah sebesar -1,00 (3) Bila hubungan X dan Y tidak mempunyai pola, yaitu bertambahnya nilai suatu gejala (X) kadang diikuti dengan bertambahnya dan kadang diikuti dengan berkurangnya nilai gejala lain (Y) maka kedua gejala tidak mempunyai hubungan yang bermakna (signifikan). Hubungan kedua gejala terjadi secara kebetulan. Pada keadaan sempurna, korelasi X dan Y dalam keadaan demikian adalah sebesar 0,00.

Pengujian signifikansi korelasi hitung (rxy) dengan r pada tabel (rtabel). Pada korelasi positif, bila rxy> rtabel maka dapat disimpulkan bahwa X dan Y mempunyai korelasi positif secara signifikan. Pada korelasi negatif, bila !rxy! dimaksudkan bahwa koefisien negatifnya dihilangkan dan diperlakukan sebagai positif. Sebaliknya, pada keadaan dimana rxy atau!rxy! <rtabel maka dapat disimpulkan bahwa X dan Y tidak mempunyai hubungan yang signifikan. Hubungan X dan Y terjadi secara kebetulan.

Berikut adalah contoh kasus dan cara perhitungan indeks korelasi:
Nilai dua gejala X dan Y adalah sebagai berikut:

No
Siswa
X
Y
1
A
40
50
2
B
85
90
3
C
50
60
4
D
70
80
5
E
60
65

Hubungan gejala-gejala itu dapat diuji sebagai berikut:
1.  Menghitung rxy
Untuk dapat menghitung rxy diperlukan tabel persiapan perhitungan sebagai berikut:

No
Siswa
X
Y
X2
Y2
XY
1
A
40
50
1600
2500
2000
2
B
85
90
7225
8100
7650
3
C
50
60
2500
3600
3000
4
D
70
80
4900
6400
5600
5
E
60
65
3600
4225
3900

Jumlah
305
345
19825
24825
22150

Dengan menggunakan rumus korelasi prodict moment dapat dihitung rxy adalah sebesar 0,991
2.  Menentukan rtabel
Jumlah peserta (N) sadalah 5 orang siswa peserta tes. Bila ditetapkan a = 5 % maka rtabel atau r(5)(0,05) = 0,669
3.  Menarik kesimpulan
Oleh karena r hitung = 0,991 > r  tabel = 0,669 maka dapat disimpulkan bahwa X dan Y berkorelasi positif secara signifikan. Hal itu terlihat bahwa setiap kenaikan X selalu diikuti kenaikan Y dan setiap penurunan nilsi X selalu diikuti dengan penurunan Y.

D. Validitas isi
Validitas isi (conten validity) adalah pengujian validitas dilakukan atas isinya untuk memastikan apakah butir THB mengukur secara tepat keadaan yang ingin diukur. Vaiditas isi berhubungan dengan representativitas sampel butir dari semesta populasi butir. Secara teoretik butir yang dapat untuk mengukur hasil belajar jumlahnya tidak terhingga. Butir-butir THB yang akan digunakan untuk mengukur merupakan sebagian saja dari populasi butir yang tidak terhingga. Pengujian validitas butir dilakukan untuk menjamin bahwa meski pengumpulan data hanya dilakukan menggunakan sebagian butir namun butir-butir yang dipilih mewakili sifat populasi butirnya. Pengujian validitas isi dapat dilakukan menggunakan satu dari tiga metode yang menelaah butir instrumen, meminta prtimbangan ahli dan analisis korelasi butir-total.

Untukkeperluan pengembangan butir-butir THB yang representatif maka pengembagan buti-butir THB harus didasarkan pada perencanaan kisi-kisi. Pengujian validitas isi yang dilakukan dengan menelaah butir (item review) dilakukan dengan mencermati kesesuaian isi butir yang ditulis dengan perencanaan yang dituangkan dalam kisi-kisi. Kriteria yang menjadi dasar pengujian validitas isi adalah kisi-kisi yang direncanakan. Review dilakukan untuk menjaga agar materi butir THB yang dikembangkan tidak menyimpang dari kisi-kisi. Butir-butir THB dinyatakan valid (logically valid) apabila setelah mencermati isi butir-butir yang ditulis telah menunjukkan kesesuaian dengan kisi-kisi.

Pengujian validitas isi dapat dilakukan dengan meminta pertimbangan ahli (expert judgement). Orang yang memiliki kompetensi dalam suatu bidang dapat dimintakan pendapatnya untuk menilai ketepatan isi butir THB.

Respon selanjutnya diskor dengan cara tertentu. Misalnya: dua orang ahli diminta menilai kesesuaian materi butir dengan kisi-kisinya pada 10 butir THB. Penilaian dilakukan dengan menentukan pilihan pada pilihan yang tersedia yaitu “ tidak sesuai”, “ragu”, “sesuai”. Skoring dilakukan dengan memberikan skor -1 pada respon “tidak sesuai”, 0 pada respon “ragu” dan +1 pada responm “sesuai”. Hasil skoring respon dua orang ahli atas 10 butir instrumen diringkaskan sebagai berikut:

Butir
Rater 1
Rater2
1
1
1
2
1
0
3
1
1
4
1
1
5
1
1
6
0
0
7
1
1
8
1
1
9
1
1
10
1
1

Perhitungan dilakukan berdasarkan tabel persiapan sebagai berikut:

No
X
Y
X2
Y2
XY
1
1
1
1
1
1
2
1
1
1
0
0
3
1
1
1
1
1
4
1
1
1
1
1
5
1
1
1
1
1
6
0
0
0
0
0
7
1
1
1
1
1
8
1
1
1
1
1
9
1
1
1
1
1
10
1
1
1
1
1
9
8
9
8
8

Hasil korelasi skor kedua rater menunjukkan indeks korelasi hitung sebesar 0,667. Hasil konfirmasi tabel pada N= 10 dan a =5% menunjukkan harga tabel sebesar 0,632. Oleh karena r hitung > r tabel maka kedua skor berkorelasi signifikan dan kedua rater menilai bahwa kedua THB mengukur hal yang sama, sehingga dapat dikatakan bahwa THB mwngukur keadaan yang ingin diukurnya (valid).

Pengujian validitas isi dapat dilakukan dengan melihat korelasi butir dengan total. Korelasi butir dengan total menunjukkan sumbangan butir terhadap totalnya. Sebuah butir dinyatkan valid apabila dia berkorelasi tinggi dengan totalnya. Butir yang berkorelasi tinggi dengan totalnya menunjukkan bahwa butir tersebut merupakan isi dari instrumen karena mempunyai sumbangan besar membentuk skor total THB. Kriteria untuk menilai apakah butir memberikan sumbangan signifikan bagi total adalah apabila korelasi hitung butor dengan total (rit) > r tabel. Misalnya: dalam sebuah uji coba THB mata pelajaran matematika ats 10 butir THB yang diikuti oleh 10 peserta memberikan hasil sebagai berikut:

Responden
Butir
Total
1
2
3
4
5
6
7
8
9
10
1
4
3
1
5
2
2
2
3
5
2
29
2
5
4
2
4
3
1
1
4
5
3
32
3
3
2
1
4
2
2
1
3
4
2
24
4
4
2
1
3
2
3
2
3
4
2
26
5
5
1
2
4
2
2
2
4
5
2
29
6
3
2
3
5
1
1
1
3
5
3
27
7
4
3
2
5
2
2
1
3
4
3
29
8
5
2
1
4
3
2
1
3
4
2
27
9
2
1
1
3
2
1
2
3
5
1
21
10
3
2
2
4
2
1
1
4
5
3
27
rit
0,7869
0,7091
0,4398
0,5408
0,316
0,0163
-0,241
0,5078
0,1701
0,6889

kriteria
0,632
0,632
0,632
0,632
0,632
0,632
0,632
0,632
0,632
0,632

keputs
Tidak
valid
tidak
tidak
Tidak
tidak
tidak
tidak
Tidak
valid


Sebagai contoh perhitungan validitas butir 1. Tabel persiapan perhitungan untuk menghitung kerelasi product momen adalah sebagai berikut:

No
X
Y
X2
Y2
XY
1
4
29
16
841
116
2
5
32
25
1024
160
3
3
24
9
576
72
4
4
26
16
676
104
5
5
29
25
841
145
6
3
27
9
729
81
7
4
29
16
841
116
8
5
27
25
729
135
9
2
21
4
441
42
10
3
27
9
729
81
38
271
154
7427
1052

Keterangan:
N = jumlah siswa
X = skor siswa pada butir ke-1
Y = skor total siswa.

E. Validitas kriteria
Validitas kriteria (criterion related validity) adalah pengujian validitas yang dilakukan dengan mem,bandingkan THB dengan kriteria tertentu diluar THB. Instrumen dapat dinyatakan valid apabila telah mengukur dengan hasil sebagaimana hasil pengukuran kriterianya. Kesesuaian pengukuran ditunjukkan oleh hasil korelasi yang signifikan antara skor hasil pengukuran menggunakan THB dengan skor hasil pengukuran menggunakan instrumen kriteria yang diginakan sebagai dasar pengujian validitas. Berdasarkan kriteria yang digunakan sebagai dasar pengujian, validitas dapat dibagi menjadi dua yaitu validitas konkuren dan validitas prediktif.

Validitas konkuren (concurren related validity) adalah pengujian validitas menggunakan ktiteria eksternal dimana kriteria yang digunakan telah ada pada saat pengujian THB dilakukan. Tes akhir semester dapat diuji validitasnya menggunakan nilai ulangan harian sebagai kriteria, tes msuk siswa baru dapat diuji validitasnya menggunakan angka rapor sekolah sebelumnya dan sebagainya, misalnya: seorang guru ingin mengembangkan THB untuk hasil belajar maya pelajaran matematika. Untuk menguji validitasnya, dia memilih tes baku berupa soal bersama yang dibuat oleh kelompok kerja guru (KKG) yang mmpunyai tujuan pengukuran yang sama. Pengujian validitas selanjutnya dilakukan dengan mengkorelasikan skor hasil pengukuran siswa menggunakan THB dengan skor hasil pengukuran siswa menggunakan tes baku. Sebagai sebuah ilustrasi saja, pada siswa sebanyak 10 orang, kedua THB memberikan hasil pengukuran sebagai berikut:

No
X
Y
1
70
82
2
85
80
3
75
72
4
90
87
5
60
65
6
57
73
7
72
70
8
65
60
9
50
65
10
87
80

Keterangan:
X=hasil pengukuran menggunakan THB yang dikembangkan oleh guru.
Y=hasil pengukuran menggunakan THB yang disusun oleh tim KKG.

Validitas prediktif (predictive related validity) adlah pengujian validitas menggunakan kriteria eksternal diman kriteria pembandingnya belum ada pada saat THB dikembangkan. Kriteria yang digunakan sebagai pembanding untuk menguji valiitas masih harus diramalkan menggunakan skor hasil pengukuran THB. Misalnya: untuk menguji validitas tes seleksi penerimaan siswa baru, sekolah belum memiliki data tentang prestasi siswa, sehingga kriteria yang akan dibandin gkan belum tersedia. Kriteria pembanding yang diramalkan oleh tes seleksi dengan hasil belajar setelah mengikuti pembelajaran. Tes seleksi dinyatakan valid apabila skorpengukuran menggunakan tes seleksi berkorelasi signifikan dengan hasil belajar, karena tes selejsi mampu meramalkan dengan baik hasi belajar siswa dalm proses pembelajaran. Tes seleksi mengukur dengan baik keadaan tertentu yang ingin diukur yaitu hasil belajar dalam prises pembelajaran.

F.  Validitas konstruk
Validitas konstruk (construct validity) adalah pengujian validitas yang dilakukan dengan melihat kesesuaian kontruksi butir yang ditulis dengan kisi-kisinya.pengujian validitas kontruk menguji konstruksi hasil belajar. Misalnya: kontruksi “ hasil belajar ranah kognitif” menurut taksonomi bloom meliouti pengetahuan, pemahaman, aplikasi, analisis, sintesis dan evaluasi. Kontruksi ranah afektif menurut  Krathwhol terdiri dari penerimaan, partisipasi, penilaian, organisasi dan internalisasi. Kontruksi ranah psikomotorik menurut simpson terdiri dari presepsi, kesiapan, gerakan terbimbing, geakan terbiasa, gerakan kompleks dan kreatifitas.

Beberapa metode dapat digunakan untuk menguji validitas konstruk yaitu dengan:
1.  Menelaah butir
2.  Meminta pertimbangan ahli
3.  Konvergensi dan diskriminabilitas
4.  Multritrait-multimethod (MTMM)
5.  Analisis faktor.

Semuametode dibahas dalam bagian ini kecuali analisis faktor. Analisis faktor karena pembahasannya memerlukan perhatian khusus akan diberikan pada bab yang terpisah.

Pengujian validitas konstruk dapat dilakukan dengan cara menelaah kesesuaian  butir THB dengan kisi-kisi dalam hal kontruksinya. Hasil belajar, faktor (indikator) dan butir-butir instrumen direncanakan dalam kisi-kisi. Hasil belajar tersusun dari beberapa faktor. Butir-butir tertentu merupakan bagian dari sebuah faktor. Menelaah butir YHB dilakukan dengan mencermati kesesuian penempatan butir-butir dlam faktornya. Berbeda dengan penelaahan butir pada uji validitas isi yang meliihat kesewsuaian butir dengan kisi-kisi dalam hal muatannya. Penelaahan butir pada uji validitas konstruk dalam hal konstruksinya. Butir-butir selanjutnya dinyatakan valid apabila menempati faktor sebagaimana kisi-kisinya. Dengan kata lain, butir dikatakan valid apabila kontruksinya seperti direncanakan dalam kisi-kisi.

Pengujian validitas konstruk dapat dilakukan dengan meminta pertimbangan ahli atau rater. Prosedur pengujian serupa dengan pengujian yang sama dalam uji vaaliditas isi. Perbedaanya adalah bahwa permintaan pertimbangandalam pengujian validitas isi adalh kesesuaian butir dengan kisi-kisi dalam hal isi, sedang dalam pengujian validitas konstruk yang dimintakan pertimbangan dalam hal kontruksi. Instrumen dinyatakan valid apabila penilai menunjukkan kesepakatan dalam menilai kontruksi butir yng ditunjukkan oleh korelasi hitung skor kedua penilai yang signifikan pada taraf signifikansi tertentu.

Pengujian validitas konstruk dengan metode konvergensi dan diskriminabilitas adalah menguji validitas dengan menggunakan prinsip bahwa sebuah butir bersifat konvergen dengan butir yang mempunyai kontruksi sama dan bersifat diskriminan dengan butir yang mempunyai konstruksi berbeda. Titik temu (convergence) merupakan petunjuk dari berbagai sumber yang terkumpul dengan berbagai cara semua mengindikasikan arti yang sama atau mirip dari suatu konstruk tertentu. Diskriminabilitas adalah keadaan dimana kita dapat memperbedakan secara empiris suatu konstruk tertentu dari konstruk lain yang mungkin mirip dan menunjukkan hal-hal yang tidak berelasi dengan kontruk tersebut (Kerli8nger, 1996: 738). Misalnya pada sebuah tes prestasi belajar, kita ingin mengetahui butir-butir tes mana yang mengukur level kognitif yang sama dan butir-butir tes mana yang mengukur level kognituf berbeda. Sebanyak 4 butir tes diujicobakan kepada sejumlah siswa uji coba dan hasilnya dikorelasikan satu sama lain sehingga menghailkan matriks korelasi sebagai berikut:

Butir
1
2
3
4
1
-
0,15
0,50
-0,30
2
-
-
0,12
0,60
3
-
-
-
0,05
4
-
-
-
-

Koefisien korelasi dinyatakan signifikan apabila korelasi hitungnya 0,30 atau lebih. Dari matriks tersebut dapat disimpulkan:
1.Butir 1 dan 3 bersifat konvergen sehingga mengukur level kognitif yang sama
2.Butir 2 dan 4 bersifat konvergen sehingga mengykur level kogniyif yang sama
3.Butir 1 dan 3 bersifat diskriminan dengan butir 2 dan 4 sehingga mengukur level kognitif yang berbeda.

Pengujuian validitas konstruk dengan multritrait-multimethod (MTMM) adalah pengujian validitas yang dilakukan menggunakan beberapa metode dan beberapa kali testing untuk melihat:
1.Keandalan konsisitensi internal pada metode yang sama yang diujicobakan beberapa kali
2.Hasil yang sama (berkorelasi signifikan) antara kontruksi yang sama yang diujikan menggunakan metode yang berbeda.

Untuk memperjelas uraian berikut diberikan contoh. Terdapat dua butir tes hasil belajar yang mempunyai kontruksi yang berbeda. Butir 1 mengukur ranah kognitif level havalan (C1) dan butir 2 mengukur ranah kognitif level penerapan (C3). Kedua butir diukur masing-masing dalam dua bentuk: esai dan objektif. Keempat butir (2 level – 2 bentuk) diuljikan sebanyak dua kali pada sejumlah sisiwa uji coba. Haasil korelasi antara mereka diringkaskan dalam sebuah matriks korelasi sebagai berikut:




Testing 1



Objektif
Esai
Testing II


C1
C3
C1
C3
Objektif
C1
(0,85)
-
-
-
C3
-0,07
(0,88)
-
-
Esai
C1
(0,53)
-0,15
(0,81)
-
C3
-0,37
(0,54)
-0,09
(0,82)

Dari matriks korelasi tersebut dapat dibuat kesimpulan sebagai berikut:
1.Butir tes yang mempunyai keandalan konsistensi internal yang baik adalah:
a.Butir level C1 berbentuk objektif pada testing I dengan butir tes level C1 berbentuk objektif pada testing II dengan indeks korelasi sebesar 0,85,
b.Butir level C3 berbentuk objektif pada testing I dengan butir level C3 berbentuk objektif pada testing II dengan indeks korelasi sebesar 0,88,
c.Butir level C1 berbentuk esai pada testing I dengan butir levei C1 berbentuk esai pada testing II dengan indeks korelasi sebesar 0,81,
d.Butir level C3 berbentuk esai pada testing I dengan butir level C3 berbentuk esai pada testing II dengan indeks korelasi sebesar 0,82.

2.Butir-butir yang bersifat konvergen karena mempunyai kontruksi yang sama pada metode yang berbeda menunjukkan korelasi signifikan.
a.Butir level C1 berbenmtuk objektif pada testing I dengan butir level C1 berbentuk esai pada testing I menunjukkan indeks korelasi sebesar 0,54.
b.Butir level C3 berbentuk objektif pada testing I dengan butir level C3 berbentuk esai pada testing I menunjukkan indeks korelsi sebesar 0,53.

3.Butir-butir yang mempunyai diskriminabilitas karena kontruksinya berbeda akan berkorelasi tidak signifikan.
a.Butir level C1 berbentuk objktif pada testing I dengan butir level C3 berbentuk objektif pada testing II menunjukkan indekskorelasi sebesar -0,07.
b.Butir level C3 berbentuk objektif pada testing I dengan butir level C1 berbentuk objektif pada testing II menunjukkan indeks korelasi sebesar -0,37.
c.Butir level C1 berbentuk esai pada testing I dengan butir level C3 berbentuk esai pada testing II menunjukkan indeks korelasi sebesar -0,09.
d.Butir level C3 berbentuk esai pada testing I dengan butir level C1 berbentuk esai pada testing II menunjukkan indeks korelasi sebesar -0,15.

G. Penutup
Validitas adalah salah satu syarat THB yang baik. Validitas berhubungan dengan kemampuan THB untuk mengukur keadaan yang akan diukurnya. Pengujian validitas dapat dikelompokkan menjadi tiga: validitas isi, kriteria, dan konstruk.pengujian validitas isi dapat dilakukan dengan cara menelaah butir,meminta pertimbangan ahli dan menghitung korelasi butir dengan total. Pengujian validitas kriteria dapat berupa validitas konkuren dan prediktif. Pengujian validitas konsruk dapat dilakukan dengan menelaah butir, meminta pertimbangan ahli, konvergensi dan diskriminabilitas, multitrait-multimethod, dan analisis faktor.

No comments:

Post a Comment