Tingkat kesukaran soal adalah peluang
untuk menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks.
Indeks tingkat kesukaran
ini pada umumnya dinyatakan dalam bentuk proporsi yang besarnya berkisar 0,00 - 1,00 (Aiken (1994: 66). Semakin besar indeks tingkat
kesukaran yang diperoleh dari hasil hitungan, berarti semakin mudah soal itu. Suatu soal memiliki TK= 0,00
artinya bahwa tidak ada siswa yang menjawab benar dan
bila memiliki TK= 1,00 artinya bahwa siswa menjawab benar. Perhitungan indeks tingkat kesukaran ini
dilakukan untuk setiap nomor soal. Pada prinsipnya, skor rata-rata yang diperoleh peserta
didik pada butir soal yang
bersangkutan dinamakan tingkat kesukaran butir soal itu. Rumus ini dipergunakan untuk soal obyektif. Rumusnya adalah seperti
berikut ini (Nitko, 1996: 310).
Fungsi tingkat kesukaran butir soal
biasanya dikaitkan dengan tujuan tes. Misalnya untuk keperluan ujian semester digunakan
butir soal yang memiliki tingkat kesukaran sedang, untuk keperluan seleksi digunakan
butir soal yang memiliki tingkat kesukaran tinggi/sukar, dan untuk keperluan
diagnostik biasanya digunakan butir soal yang memiliki tingkat kesukaran rendah/mudah.
Untuk mengetahui tingkat kesukaran
soal bentuk uraian digunakan rumus berikut ini.
Hasil perhitungan dengan menggunakan rumus di atas
menggambarkan tingkat kesukaran soal itu. Klasifikasi tingkat kesukaran soal
dapat dicontohkan seperti berikut ini.
0,00 - 0,30 soal tergolong sukar
0,31 - 0,70 soal tergolong sedang
0,71 - 1,00 soal tergolong mudah
Tingkat kesukaran butir soal dapat mempengaruhi bentuk
distribusi total skor tes. Untuk tes yang sangat sukar (TK= < 0,25)
distribusinya berbentuk positif skewed, sedangkan tes yang mudah dengan TK=
>0,80) distribusinya berbentuk negatif skewed.
Tingkat kesukaran butir soal memiliki 2 kegunaan, yaitu
kegunaan bagi guru dan kegunaan bagi pengujian dan pengajaran (Nitko, 1996:
310-313). Kegunaannya bagi guru adalah: (1) sebagai pengenalan konsep terhadap
pembelajaran ulang dan memberi masukan kepada siswa tentang hasil belajar
mereka, (2) memperoleh informasi tentang penekanan kurikulum atau mencurigai
terhadap butir soal yang bias. Adapun kegunaannya bagi pengujian dan pengajaran
adalah: (a) pengenalan konsep yang diperlukan untuk diajarkan ulang, (b)
tanda-tanda terhadap kelebihan dan kelemahan pada kurikulum sekolah, (c)
memberi masukan kepada siswa, (d) tanda-tanda kemungkinan adanya butir soal
yang bias, (e) merakit tes yang memiliki ketepatan data soal.
Di samping kedua kegunaan di atas, dalam konstruksi tes,
tingkat kesukaran butir soal sangat penting karena tingkat kesukaran butir
dapat: (1) mempengaruhi karakteristik distribusi skor (mempengaruhi bentuk dan
penyebaran skor tes atau jumlah soal dan korelasi antarsoal), (2) berhubungan
dengan reliabilitas. Menurut koefisien alfa clan KR-20, semakin tinggi korelasi
antarsoal, semakin tinggi reliabilitas (Nunnally, 1981: 270-271).
Tingkat kesukaran butir soal juga dapat digunakan untuk mempredikst
alat ukur itu sendiri (soal) dan kemampuan peserta didik dalam memahami materi
yang diajarkan guru. Misalnya
satu butir soal termasuk kategori mudah, maka prediksi terhadap informasi ini
adalah seperti berikut.
1) Pengecoh
butir soal itu tidak berfungsi.
2) Sebagian
besar siswa menjawab benar butir soal itu; artinya bahwa sebagian besar siswa
telah memahami materi yang ditanyakan.
Bila suatu butir soal termasuk kategori sukar, maka
prediksi terhadap informasi ini adalah seperti berikut.
1) Butir
soal itu "mungkin" salah kunci jawaban.
2) Butir
soal itu mempunyai 2 atau lebih jawaban yang benar.
3) Materi
yang ditanyakan belum diajarkan atau belum tuntas pembelajarannya, sehingga
kompetensi minimum yang harus dikuasai siswa belum tercapai.
4) Materi
yang diukur tidak cocok ditanyakan dengan menggunakan bentuk soal yang
diberikan (misalnya meringkas cerita atau mengarang ditanyakan dalam bentuk
pilihan ganda).
5) Pernyataan
atau kalimat soal terlalu kompleks dan panjang.
Namun, analisis secara klasik ini memang memiliki
keterbatasan, yaitu bahwa tingkat kesukaran sangat sulit untuk mengestimasi
secara tepat karena estimasi tingkat kesukaran dibiaskan oleh sampel (Haladyna,
1994: 145). Jika sampel berkemampuan tinggi, maka soal akan sangat mudah (TK=
>0,90). Jika sampel berkemampuan rendah, maka soal akan sangat sulit (TK =
< 0,40). Oleh karena itu memang merupakan kelebihan analisis secara IRT,
karena 1RT dapat mengestimasi tingkat kesukaran soal tanpa menentukan siapa
peserta tesnya (invariance). Dalam IRT, komposisi sampel dapat mengestimasi
parameter dan tingkat kesukaran soal tanpa bias.