Probabilitas sebuah tes statistik (yang dilakukan di masa depan) akan setidaknya sama besar/ekstrimnya seperti yang terobservasi dalam penelitian yang dilakukan, apabila semua asumsi terpenuhi dan hipotesis yang diuji (hipotesis nol) benar.
Amel adalah seorang dosen Psikologi Unair, dan Ilham adalah suaminya. Berdasarkan hasil observasinya ketika membandingkan Amel dengan dosen yang lain, Ilham menyimpulkan bahwa Amel adalah dosen yang tercantik di Psikologi Unair (p=0.03).
H0: Semua dosen Psikologi Unair sama cantiknya (tidak ada perbedaan level kecantikan)
H1: Amel adalah dosen yang paling cantik (ada perbedaan level kecantikan)
Kalau seandainya semua dosen sama cantiknya (H0) adalah benar, maka peluang laki-laki lain (bukan Ilham) mengobservasi dosen lain yang sama cantiknya dengan Amel, adalah kecil sekali (0.03).
Jadi mungkin, H0 ga bener (ditolak).
Artinya, p-value adalah peluang yang melekat pada observasi/penelitian di masa depan (in the long run), bukan pada penelitian/observasi yang sedang dilakukan.
Juga, p-value sangat bergantung pada ukuran sampel. Pada jumlah sampel yang terlalu besar, atau terlalu kecil, p-value hampir-hampir tidak ada artinya sama sekali.
Tidak.
Pendekatan null hypothesis significant testing (NHST) ada dua aliran.
Keduanya pendekatan yang berbeda, jadi jangan dikombinasikan
Baca Perezgonzalez (2015) untuk mengetahui lebih lanjut.
The absence of evidence is not the evidence of absence (Alderson 2004)
Kalau anda tidak punya bukti bahwa efek/pengaruh/korelasi/perbedaan itu (mungkin) ada, bukan berarti tidak ada sama sekali.
Apabila anda gagal menolak H0, bukan berarti H0 dinyatakan dapat diterima
"…after conducting Pearson's correlation analysis, we failed to reject null hypothesis, even though our analysis yielded a rather moderate correlation coefficient"
"…to analyse our data, we performed ordinary least square regression, and we are not convinced that we have an evidence to confirm the existence of an adequate relationship between x and y.."
"..or there might be an association. However, it could be anything but linear" (tambahan dari mba Zida. Thanks mba!)
"…to detect whether there was a difference between control and treatment group, we performed Student's t-test. We failed to find any evidences to reject our hypothesis which is a meaningful difference between control and treatment group does not exist…"