Ứng dụng phân tích chất lượng đề thi và ngân hàng câu hỏi theo hai phương pháp đo lường hiện đại: Lý thuyết Khảo thí Cổ điển (CTT) và Lý thuyết Đáp ứng Câu hỏi (IRT) trên nền tảng SmartTest – TEX Vietnam.
Hai phương pháp tiêu chuẩn quốc tế được SmartTest tích hợp để phân tích chất lượng ngân hàng câu hỏi toàn diện.
CTT phân tích câu hỏi dựa trên điểm số quan sát của toàn nhóm thí sinh. Các chỉ số mang tính phụ thuộc mẫu – thay đổi khi nhóm thí sinh thay đổi.
IRT mô hình hóa xác suất trả lời đúng theo năng lực (θ) của thí sinh. Tham số câu hỏi bất biến mẫu – ổn định hơn CTT khi so sánh nhóm.
| Tiêu chí | CTT | IRT (1PL/2PL/3PL) |
|---|---|---|
| Phụ thuộc mẫu | ✗ Phụ thuộc cao | ✓ Bất biến mẫu |
| Yêu cầu cỡ mẫu | ✓ N ≥ 30–50 | ✗ N ≥ 200–500 |
| Độ phức tạp tính toán | ✓ Đơn giản | ✗ Phức tạp (MLE/Bayesian) |
| Đo lường năng lực cá nhân | ~ Gián tiếp qua tổng điểm | ✓ Trực tiếp (θ estimation) |
| Thiết kế đề thi thích nghi (CAT) | ✗ Không hỗ trợ | ✓ Nền tảng của CAT |
| Phân tích phương án nhiễu | ✓ Dễ thực hiện | ~ Cần Nominal Response Model |
| Phù hợp với SmartTest | ✓ Phân tích nhanh, báo cáo GV | ✓ Chuẩn hóa NH câu hỏi, IRT-CAT |
| Chỉ số | Tốt | Chấp nhận | Loại bỏ |
|---|---|---|---|
| Độ khó (p) | 0,30 – 0,70 | 0,20–0,30 | 0,70–0,80 | <0,20 | >0,80 |
| Phân biệt (D) | ≥ 0,30 | 0,20–0,29 | <0,20 |
| rpbis | ≥ 0,30 | 0,20–0,29 | <0,20 |
| Cronbach's α | ≥ 0,80 | 0,70–0,79 | <0,70 |
| Tham số | Tốt | Chấp nhận | Xem xét lại |
|---|---|---|---|
| Độ khó (b) | −1,5 đến 1,5 | ±1,5–2,5 | |b| > 2,5 |
| Phân biệt (a) | 0,8 – 2,5 | 0,5–0,8 | < 0,5 |
| Đoán mò (c) | ≤ 0,20 | 0,20–0,25 | > 0,25 |
| Infit/Outfit MNSQ | 0,7 – 1,3 | 1,3–1,5 | > 1,5 |
Phân tích 20 câu hỏi trắc nghiệm với N = 200 sinh viên. Dữ liệu được xử lý bởi module SmartTest Analytics.
| Câu | Nội dung tóm tắt | Độ khó (p) | Phân biệt (D) | rpbis | α if Deleted | Nhiễu A | Nhiễu B | Nhiễu C | Đánh giá |
|---|
Câu Q06 có độ phân biệt thấp (D = 0.14). Phân tích phương án cho thấy phương án nhiễu C* (đáp án đúng) thu hút ít hơn phương án B ở nhóm năng lực cao – dấu hiệu câu hỏi có vấn đề về nội dung hoặc cách diễn đạt.
| Nhóm | PA A | PA B | PA C* ✓ | PA D | Bỏ qua |
|---|---|---|---|---|---|
| Cao (n=50) | 18% | 32% | 36% | 12% | 2% |
| TB (n=100) | 22% | 28% | 30% | 18% | 2% |
| Thấp (n=50) | 26% | 20% | 22% | 30% | 2% |
Ước lượng tham số IRT bằng phương pháp MLE (Maximum Likelihood Estimation) – mô hình 3 tham số (3PL). Sử dụng engine phân tích tích hợp SmartTest.
| Câu | a (Discrimination) | b (Difficulty) | c (Guessing) | SE(b) | Infit MNSQ | Outfit MNSQ | IIF Peak | θ at Peak | Model Fit |
|---|
Trực quan hóa toàn diện các chỉ số CTT và IRT giúp giảng viên và cán bộ khảo thí nhanh chóng nhận diện câu hỏi cần cải thiện.
| Câu | Vấn đề CTT | Vấn đề IRT | Khuyến nghị |
|---|---|---|---|
| Q06 | p=0.71, D=0.14, r=0.18 – Quá dễ, phân biệt kém | a=0.41, c=0.22 – Phân biệt thấp, đoán mò cao | Viết lại toàn bộ |
| Q11 | p=0.81, D=0.10, r=0.12 – Quá dễ | b=−2.41, Outfit=1.67 – Không phù hợp model | Điều chỉnh độ khó |
| Q17 | p=0.19, D=0.18 – Quá khó | b=2.61, SE=0.42 – Ước lượng không ổn định | Đơn giản hóa câu |
Các câu này đạt một số tiêu chí nhưng có 1–2 chỉ số nằm vùng biên. Nên giữ lại với điều chỉnh nhỏ:
Hệ số Cronbach's α = 0.782 cho thấy bài thi có độ tin cậy chấp nhận được (ngưỡng khuyến nghị ≥ 0.70 cho thi thành tích, ≥ 0.80 cho thi quan trọng). Để đạt α ≥ 0.80, cần:
Dựa trên phân tích 3 kỳ thi gần nhất, SmartTest phát hiện: câu hỏi thuộc chủ đề "Tích phân" có xu hướng độ khó cao bất thường (p trung bình = 0.31). Đề xuất tăng cường tài nguyên học tập cho chương này.
Kết quả IRT cho thấy ngân hàng câu hỏi hiện tại cung cấp thông tin tốt nhất ở mức năng lực θ ∈ [−0.5, 1.0], thiếu câu hỏi ở vùng θ > 1.5 (sinh viên xuất sắc).
→ Khuyến nghị bổ sung 5–8 câu khó (b ∈ [1.5, 2.5]) cho kỳ thi tiếp theo.
TEX Vietnam Technology Joint Stock Company
Address: Zone 11, Dong Anh Town, Ha Noi

Can't find the answer you're looking for?. Please contact us via: