UJIAN (Akhir) Nasional alias UN selama ini sepertinya hanya diperlakukan semacam upacara ritual tahunan tanpa memberikan pengaruh berarti terhadap upaya pembina dan pengelola serta pelaksana pendidikan pada tingkat sekolah untuk memperbaiki dan meningkatkan kualitas pendidikan. Masukan berupa informasi pendidikan yang diperoleh lewat Ujian Akhir Nasional hanya diperlakukan sebagai barang pajangan dan menjadi dokumen mati.
APABILA sumber data ujian itu dipakai, pemanfaatannya pun hanya sebatas pada bahan kajian beberapa peneliti Pusat Penilaian Pendidikan (Puspendik) untuk kepentingan cum jabatan peneliti; sedangkan para pejabat pengelola kebijakan pada tingkat pusat (direktorat, Puspendik, dan pusat kurikulum) hampir dapat dipastikan tidak akan menyentuh dan memperbincangkannya lagi sampai masa ujian berikutnya.
Keteguhan sikap Menteri Pendidikan Nasional (Mendiknas) untuk tetap mempertahankan praktik UN pada sistem pendidikan menengah patut dihormati. Namun, pandangan dan pemikiran kritis terhadap praktik ujian akhir itu harus diutarakan agar sasaran yang dibuat dapat lebih proporsional, terarah, dan pencapaiannya dapat dimaksimalkan.
Meskipun praktik ujian akhir dapat digunakan untuk memengaruhi kualitas pendidikan, namun sebagaimana dikemukakan Ken Jones, asumsi dan rasionalitas yang digunakan pada high stake exams (seperti UN ini) pada umumnya sering bertentangan dengan kenyataan lapangan. Sebagaimana diketahui bahwa realitas pendidikan (sekolah) di Tanah Air sangat beragam, apakah itu sarana-prasarana pendidikan, sumber daya guru, dan school leadership. Diskrepansi kualitas pendidikan yang begitu lebar sebagai akibat dari keterbatasan kemampuan pengelola pendidikan pada tingkat pusat, daerah, dan sekolah semakin menguatkan tuduhan masyarakat selama ini bahwa penggunaan instrumen UN untuk menentukan kelulusan (sertifikasi) dan seleksi berpotensi misleading, bias, dan melanggar keadilan dalam tes.
Selain itu, instrumen UN yang akan digunakan pun sebenarnya masih menyimpan berbagai pertanyaan mendasar yang menuntut jawaban (baca: pembuktian), khususnya menyangkut metodologi, terutama pada saat melakukan interpretasi terhadap hasil skor tes dan pemanfaatannya agar sesuai dengan tujuan diselenggarakannya UN (validity evidence).
Pemanfaatan ganda (multiple purposes) hasil skor ujian yang bersifat tunggal semacam UN sebenarnya menyimpan berbagai potensi permasalahan mendasar secara metodologis, yang sebenarnya sudah sangat diketahui dan dipahami jajaran Puspendik Departemen Pendidikan Nasional (Depdiknas). Namun, yang agak mencengangkan dan mengundang pertanyaan, mengapa potensi kesalahan seperti pemanfaatan hasil skor UN untuk berbagai keperluan dan tujuan secara bersamaan tidak dikemukakan secara jujur kepada masyarakat pemakai (users) produk pendidikan dan stakeholders. Kenapa Puspendik tidak mengusulkan pemanfaatan hasil skor UN hanya sebatas pada alat pengendali mutu pendidikan nasional, sebagaimana yang dilakukan pada National Assessment of Educational Progress (NAEP) di Amerika Serikat, dan bukan untuk penentuan kelulusan (sertifikasi), apalagi sebagai tujuan untuk seleksi dan memecut mutu pendidikan sehingga persoalan metodologi yang mungkin timbul dapat dihindarkan.
TULISAN ini ditujukan sebagai masukan konstruktif bagi Mendiknas yang berkaitan dengan konsep dan praktik penilaian pendidikan di Tanah Air. Ujian atau tes sebenarnya berfungsi sebagai alat rekam dan/atau prediksi. Sebagai alat rekam untuk memotret, tes biasanya diselenggarakan untuk mengetahui sejauh mana pemahaman siswa terhadap suatu materi atau sejumlah materi dan keterampilan yang sudah diajarkan/dipelajari sesuai dengan tujuan kurikulum sehingga guru dapat menentukan langkah-langkah program pengajaran berikutnya.
Selain itu, tes juga bisa digunakan sebagai alat prediksi sebagaimana yang lazim digunakan pada tes seleksi masuk perguruan tinggi atau tes-tes yang digunakan untuk menerima pegawai baru atau promosi jabatan pada suatu perusahaan atau instansi pemerintah. Sebagai alat prediksi, hasil tes diharapkan mampu memberikan bukti bahwa seorang dapat melakukan tugas atau pekerjaan yang akan diamanatkan kepadanya. Apabila hasil tes yang digunakan mampu menunjukkan bukti terhadap peluang keberhasilan seorang kandidat mahasiswa atau calon pegawai melakukan tugas dan pekerjaan di hadapannya, tes itu diyakini memiliki kelayakan validity evidences.
Ujian atau tes sebenarnya hanyalah sebuah alat (bukan tujuan) yang digunakan untuk memperoleh informasi pencapaian terhadap proses pendidikan yang sudah dilakukan dan/atau yang akan diselenggarakan. Ujian atau tes tidak berfungsi untuk memecut, apalagi memiliki kemampuan mendorong mutu.
Namun, ujian atau tes memiliki kemampuan untuk memengaruhi proses pembelajaran di tingkat kelas sehingga menjadi lebih baik dan terarah sesuai dengan tuntutan dan tujuan kurikulum. Karena ujian hanya mampu memengaruhi pada proses pembelajaran pada tingkat kelas, maka pengaruh yang diakibatkannya tidak senantiasa positif. Sebaliknya, pengaruh itu dapat juga sangat bersifat destruktif terhadap kegiatan pendidikan, seperti apabila guru hanya memfokuskan kegiatan pembelajaran pada latihan-latihan Ujian Akhir Nasional atau pimpinan sekolah sengaja mengundang dan membiarkan Bimbingan Tes Alumni (BTA) masuk ke dalam sistem sekolah untuk mengedril siswa yang akan menempuh ujian akhir itu.
Dalam bahasa testing kegiatan itu disebut teaching for the test. Praktik pendidikan semacam itu sangat bertentangan dengan tujuan diselenggarakannya pendidikan formal di negara mana pun karena akan menyebabkan terjadinya proses penyempitan kurikulum (curriculum contraction).
UNSUR yang paling pokok dan sangat penting yang harus diperhatikan sebagai bahan pertimbangan dalam membuat interpretasi hasil skor tes siswa peserta ujian adalah validitas. Konsep validitas ini sebelumnya dipahami sebagai sebuah konsep yang terfragmentasi sehingga sering mengantarkan praktisi penilaian pendidikan kepada kebingungan dan berpikir secara keliru.
Studi validitas dilakukan untuk membuktikan bahwa kegiatan interpretasi dan pemanfaatan hasil skor tes yang ada sudah sesuai dengan tujuan diselenggarakan ujian. Sebagai misal, apabila kita menyusun seperangkat tes kemampuan/keterampilan membaca yang digunakan sebagai alat ukur untuk menentukan kelulusan (sertifikasi) SMA. Bagaimana cara kita menilai apakah proses interpretasi hasil ujian itu sudah dilakukan secara valid? Untuk keperluan itu kita harus membuat sejumlah pertanyaan, antara lain: apakah hasil skor tes itu sudah merupakan alat ukur yang sesuai dan tepat untuk tujuan di muka, yaitu untuk mengukur kemampuan/keterampilan membaca.
Sebagaimana diketahui bahwa salah satu fungsi ujian akhir adalah untuk memberikan sertifikasi bahwa siswa sudah belajar atau menguasai keterampilan membaca sebagaimana yang diminta pada kurikulum. Atas dasar itu, bukti-bukti validitas yang diperlihatkan harus mampu membuktikan bahwa skor yang diperoleh benar sudah mengukur keterampilan membaca, sebagaimana yang dijabarkan pada tujuan kurikulum.
Terdapat banyak sekali bukti yang harus dikumpulkan untuk melakukan kegiatan interpretasi terhadap hasil skor tes itu. Kita dapat menunjukkan bahwa instrumen tes yang digunakan sudah sesuai dengan tujuan pelajaran keterampilan membaca pada kurikulum. Selain itu, kita juga harus mampu menunjukkan bahwa jumlah jawaban yang benar pada soal tes betul-betul sudah sejalan dengan penekanan kegiatan pengajaran membaca pada kurikulum. Lebih dari itu, kita juga harus mampu menunjukkan bahwa keterampilan membaca teks singkat yang tercermin dari kemampuan siswa menjawab dengan benar soal pilihan ganda itu memiliki kualifikasi yang sama apabila yang bersangkutan diberikan teks bacaan yang lebih panjang, atau membaca novel, artikel surat kabar. Kita juga harus mampu membuktikan bahwa konten bacaan yang disajikan pada soal tes sudah merupakan representasi dari isi bacaan yang dianggap penting dan challenging yang mampu menggali kemampuan/keterampilan membaca siswa yang lebih dalam dan ekstensif; jadi bukan hanya berupa pertanyaan-pertanyaan yang bersifat superficial, faktual, atau trivial.
Apabila kita tidak mampu menunjukkan seluruh bukti di muka, validitas interpretasi yang dibuat terhadap hasil skor tes sangat lemah. Selain itu, kita juga harus mampu membuktikan bahwa skor yang tinggi yang diperoleh siswa bukan semata-mata sebagai akibat dari test wiseness, yaitu kemampuan siswa menjawab soal dengan benar sebagai akibat dari format soal pilihan ganda, tutorial khusus yang diberikan menjelang tes, seperti kegiatan bimbingan tes, menyontek, dan seterusnya. Lebih dari itu kita juga harus mampu menunjukkan bahwa skor rendah yang diperoleh siswa bukan hanya semata-mata disebabkan oleh faktor kegugupan pada diri siswa pada saat ujian. Selain itu, kita juga harus mampu menunjukkan bahwa latar belakang budaya siswa tidak membawa pengaruh terhadap kemampuan mereka menjawab soal tes dengan benar.
Semua faktor yang disajikan di muka dapat merupakan ancaman terhadap interpretasi validitas sebuah alat ukur yang bersifat tunggal (seperti pada UN) yang digunakan untuk mendeteksi kemampuan/keterampilan membaca. Apabila kita tidak mampu menunjukkan bukti (evidences), hasil ujian berupa skor tes untuk mengukur kemampuan/keterampilan membaca memiliki tingkat validitas yang rendah.
Kesimpulan yang dapat ditarik dari uraian di muka bahwa kita harus mampu menunjukkan bukti dan penalaran yang logis untuk membuat keputusan pemanfaatan atas hasil skor tes. Untuk keperluan itu kita tidak bisa hanya berpatokan pada hasil satu kali studi dan mengklaim bahwa kita sudah memiliki tes valid yang dapat digunakan untuk berbagai keperluan.
Syamsir Alam Mantan Staf Teknis Puspendik, Balitbang Depdiknas
Sumber: http://www.kompas.com/kompas-cetak/0506/27/Didaktika/1838832.htm