Như vậy, biến số và sự biến thiên của nó là mối quan tâm của nhà nghiên cứu. Biến thiên (variation), hay còn gọi là phương sai (variance) trong thống kê là một trong những khái niệm nền tảng của các phép tính kiểm định thống kê như phân tích phương sai (ANOVA) hay phân tích hồi quy (regression analysis). Với sự giúp đỡ của phần mềm thống kê, hầu như bây giờ không ai còn phải tính tay công thức tính của phân tích phương sai nữa, việc hiểu bản chất của công thức này bắt nguồn từ khái niệm biến thiên (hay phương sai) vẫn rất cần thiết vì nó sẽ giúp bạn có một ‘sense’ tốt hơn về tác động của phương pháp nghiên cứu (nghĩa là toàn bộ từ thiết kế nghiên cứu cho đến phân tích thống kê) lên kết quả nghiên cứu. Ở bài này, biến thiên được hiểu theo nghĩa chung nhất đó là sự dao động của một đại lượng và dùng thuật ngữ variation để diễn tả. Biến thiên có thể xảy ra trong một nghiên cứu bởi một trong ba nguyên nhân.
1. Biến thiên hệ thống do điều kiện thí nghiệm (systematic variation due to experimental condition).
Đây là loại biến thiên mà nhà nghiên cứu mong đợi và là mục tiêu của thiết kế nghiên cứu. Ví dụ, nhà nghiên cứu muốn kiểm nghiệm tác động của việc tập yoga lên cải thiện giấc ngủ của những người bị mất ngủ kinh niên. Ông ta thiết kế nghiên cứu sao cho có một nhóm có tập yoga mỗi ngày 1 tiếng vào buổi sáng, một nhóm không tập yoga (nhóm để so sánh, gọi là nhóm chứng). Sau đó, từng người được hỏi rằng đêm đó họ ngủ bao nhiêu tiếng. Kết quả thu được là những người có tập yoga có giấc ngủ dài hơn những người không tập. Ta nói, sự khác biệt mà ta quan sát được giữa hai nhóm này chính là biến thiên có hệ thống do điều kiện thí nghiệm (tâp yoga).
2. Biến thiên hệ thống do yếu tố nhiễu (systematic variation due to confounders).
Đây là loại biến thiên mà ta không mong đợi nhưng thường sẽ đi kèm theo một cách bất khả kháng trong nhiều trường hợp. Loại biến thiên này gây ra mối đe dọa đối với độ nội hiệu lực của nghiên cứu bởi vì nó làm cho kết quả nghiên cứu trở nên không chắc chắn. Ví dụ, bạn giả thuyết rằng việc xem video bạo lực sẽ gây ra hành vi gây hấn ở trẻ nhỏ. Bạn quan sát và đo lường số giờ trẻ chơi video bạo lực của trẻ trong vòng 1 tuần. Sau đó, bạn quan sát trẻ trong giờ chơi ở trường trong tuần tiếp theo. Những quan sát này dẫn đến kết luận rằng trẻ nào xem video bạo lực thì sẽ có xu hướng có hành vi gây hấn với bạn trong giờ chơi và ngược lại, những trẻ không xem video bạo lực ở nhà thì cũng có xu hướng ôn hòa hơn. Tuy nhiên, có những khả năng khác có thể xảy ra không? Chẳng hạn, những trẻ có hành vi gây hấn là vì chúng có cha mẹ ít quản thúc hơn, vì vậy chúng có cơ hội (1) chơi video bạo lực và (2) dám bộc lộ hành vi gây hấn ra bên ngoài. Như vậy, yếu tố gây ra sự khác biệt về xu hướng gây hấn giữa hai nhóm trẻ (A) có xem video bạo lực và (B) không xem video bạo lực có thể nằm ở một yếu tố thứ ba, đó là phong cách của cha mẹ (parenting style) hơn là do bản thân yếu tố xem video bạo lực (violence exposure). Trong trường hợp này, ta nói rằng phong cách cha mẹ (parenting style) là một yếu tố gây nhiễu (confounder), hay biến nhiễu (confounding variable).
3. Biến thiên không hệ thống do sai số ngẫu nhiên (unsystematic variation due to random errors)
Biến thiên không hệ thống là sự dao động của một đại lượng trong từng cá thể và/ hoặc từng nhóm những cá thể. Sự dao động này là ngẫu nhiên và theo những chiều hướng có thể hoàn toàn trái ngược nhau, có người thì giữ nguyên không thay đổi. Ví dụ, một số học sinh có cùng học lực làm bài kiểm tra học kỳ này tốt hơn học kỳ trước, một vài học sinh khác thì làm tệ hơn kỳ trước, vài học sinh thì có điểm số không thay đổi. Khi cộng lại, sự biến thiên này trở nên không đáng kể. Tương tự, tâm trạng của một người có thể khác nhau tùy hôm. Hôm nay, có người cảm thấy vui vẻ hơn hôm qua, lại có người thấy chán hơn hôm qua, có người thì hôm qua với hôm nay không có gì thay đổi. Như vậy, ta thấy rằng biến thiên không hệ thống có thể làm nhiễu kết quả nghiên cứu theo những chiều hướng mà nhà nghiên cứu không thể biết trước được. Tuy nhiên, đa số đều nhìn nhận rằng biến thiên không hệ thống là một phần của cuộc sống mà hầu như không thể hoàn toàn bị xóa bỏ với những biện pháp đo lường hiện thời của tâm lý học. Có hai kiểu sai số ngẫu nhiên đồng thời gây ra biến thiên không hệ thống là sự khác biệt cá nhân (individual differences) và sai số trong đo lường (measurement error).
Sai số trong đo lường (measurement error)
Sai số trong đo lường xảy ra là do các công cụ đo lường không đưa ra kết quả giống nhau về một đại lượng (hiện tượng) trong những lần đo khác nhau. Công cụ đo lường trong nghiên cứu tâm lý có thể là một bài kiểm tra trắc nghiệm (test), bản hỏi (questionnaire), hoặc một quan sát trực tiếp (direct observation). Một ví dụ dễ thấy nhất và có lẽ là nhiều người trong chúng ta từng trải nghiệm qua ít nhất một lần đó là sai số của máy đo chiều cao và cân nặng. Nếu bạn thực sự nặng 52 kg nhưng cân chỉ kết quả 50 kg thì ta nói cân đã có sai số là 2 kg. Nếu chiếc cân này cho ra kết quả lần lượt là 50 kg, 48 kg, 55 kg vào những lần cân khác nhau trong những thời điểm gần nhau (giả định cân nặng thực sự của bạn là 52 kg), thì ta nói rằng chiếc cân đã có sai số đo lường và sai số này là sai số không hệ thống, nói cách khác, nó xảy ra một cách ngẫu nhiên. Nếu ta thực hiện phép cân này rất nhiều lần, kéo dài đến vô hạn, thì sai số này sẽ tịnh tiến về giá trị 0 (trung bình cộng của sai số là bằng tổng số cân nặng trong tất cả các lần cân chia cho số lần thực hiện cân). Trên thực tế, nhà nghiên cứu không cần phải thực hiện vô cực lần đo lường để đạt được sai số bằng zero. Điều mà ông ta làm là giảm thiểu sai số này xuống con số nhỏ nhất có thể và con số này thường được quy ước ngầm. Sai số đo lường có liên quan trực tiếp đến độ tin cậy (reliability) của phép đo lường. Độ tin cậy càng cao, sai số đo lường càng thấp. Vì vậy, khi đọc các bài báo khoa học, bạn sẽ thường hay thấy trong phần phương pháp, tác giả hay nêu rõ là chỉ số độ tin cậy của phép đo lường mà ông ta sử dụng đạt bao nhiêu. Ví du, bài báo viết ‘Inter-rater reliability was achieved with a Cohen kappa coefficient of 0.96….’, nghĩa là theo tiêu chí về độ tin cậy của Cohen thì phép đo lường mà tác giả sử dụng có sai số đo lường là 4%. Bạn đọc không nên cảm thấy lúng túng với các khái niệm mới lạ này, chúng sẽ bàn kỹ về độ tin cậy cách diễn giải ý nghĩa của khái niệm quan trọng này lần lượt trong các bài sau.
Khác biệt cá nhân (individual differences)
Một nguồn khác của sai số không hệ thống là sự khác biệt giữa cá nhân. Mỗi người có những sự khác nhau nội tại hoặc những nguyên nhân nào đó không được tính đến. Chẳng hạn, trong cùng một hoàn cảnh khó khăn như nhau, có những trẻ em lấy đó làm động lực lớn để thoát khỏi nền tảng thấp kém và trở thành những cá nhân ưu tú và thành đạt. Ngược lại, có những trẻ em không thể thoát ra khỏi tình cảnh mà chúng được sinh ra và thậm chí còn tụt dốc hơn hoàn cảnh ban đầu của chúng. Thành quả tích cực mà những cá nhân ở trên đạt được có thể là do những phẩm chất cá nhân bẩm sinh hoặc những yếu tố bên ngoài khác mà nhà nghiên cứu chưa biết. Với các nhà nghiên cứu thí nghiệm (experimental psychologists), sai số do khác biệt cá nhân là điều mà hết sức kiêng kị và ai cũng tìm mọi cách để loại bỏ đi. Trong khi đó, kiểu biến thiên do khác biệt cá nhân này chính là chủ đề nghiên cứu của môn tâm lý học nhân cách (personality psychology). Theo nhà tâm lý nhân cách lỗi lạc của thế kỷ 20, Lee J. Cronbach (1916-2001), các nhà tâm lý học tính cách là những người đi nghiên cứu các biến số mà những nhà nghiên cứu khác, giống như CS. Mỹ Tâm, chỉ muốn nói tha thiết rằng ‘người hãy quên em đi’.
Tóm lại, biến thiên là một khái niệm hữu ích trong phương pháp nghiên cứu và trong phân tích dữ liệu bằng các phép thống kê. Hiểu được khái niệm nền tảng này sẽ giúp cho bạn cảm nhận sự thú vị và tầm quan trọng của các kỹ thuật cụ thể trong quá trình nghiên cứu về sau.
Không có nhận xét nào:
Đăng nhận xét