Quy trình bình duyệt (peer review) từ lâu đã được xem là yếu tố không thể thiếu trong công tác xuất bản học thuật, đặc biệt trong các lĩnh vực nghiên cứu khoa học. Hoạt động không chỉ giúp đảm bảo tính chính xác của các nghiên cứu được công bố mà còn bảo vệ tính toàn vẹn của cộng đồng học thuật. Tuy nhiên, trong những năm qua, quy trình này đã phải đối mặt với nhiều thách thức, từ sự chậm trễ trong việc hoàn thành đánh giá cho đến những vấn đề về tính nhất quán và công bằng trong việc đưa ra phản hồi. Chính vì thế, sự xuất hiện của trí tuệ nhân tạo (AI) đã mở ra những cơ hội mới trong việc cải thiện quy trình này, đặc biệt là khả năng giảm tải khối lượng công việc cho các chuyên gia đồng nghiệp và tăng tốc thời gian đánh giá.
Nghiên cứu đã tiến hành so sánh giữa các đánh giá do con người thực hiện và những đánh giá của hệ thống AI Claude-3 Anthropic trong việc đánh giá các bài báo khoa học chưa được công bố. Kết quả cho thấy AI có ưu thế rõ rệt trong việc hoàn thành các bài đánh giá nhanh chóng và nhất quán. AI có thể đưa ra phản hồi trong vòng vài phút, trong khi các chuyên gia con người thường mất từ ba đến mười hai tuần để hoàn thành một bài đánh giá. Điều này phản ánh rõ khả năng của AI trong việc giảm bớt thời gian và công sức của các chuyên gia đồng nghiệp, góp phần làm cho quy trình xuất bản trở nên nhanh chóng và hiệu quả hơn. Tuy nhiên, việc AI hoàn thành nhanh chóng không có nghĩa là AI có thể thay thế hoàn toàn con người trong công tác đánh giá này.
Khi xét về chất lượng và độ sâu của các bài đánh giá, kết quả nghiên cứu lại chỉ ra sự khác biệt rõ rệt. Các chuyên gia con người, với kinh nghiệm và sự am hiểu sâu rộng về lĩnh vực nghiên cứu, có khả năng đưa ra những nhận định chi tiết, đầy đủ và sâu sắc hơn AI. Các đánh giá của con người không chỉ đơn thuần là phát hiện lỗi mà còn đi vào phân tích các khía cạnh quan trọng của bài báo như tính bối cảnh, đạo đức và sự phù hợp của phương pháp nghiên cứu. Ngược lại, mặc dù AI có thể cung cấp phản hồi nhất quán và nhanh chóng, nhưng đôi khi nó thiếu khả năng đánh giá bối cảnh rộng và những chi tiết quan trọng của nghiên cứu mà chỉ có chuyên gia con người mới có thể nhận diện được.
Một yếu tố quan trọng khác là khả năng tích hợp và nhận diện tài liệu nghiên cứu. Các chuyên gia con người, nhờ vào sự hiểu biết sâu sắc về lĩnh vực nghiên cứu và sự am hiểu về các tài liệu đã được công bố, có thể dễ dàng liên kết các nghiên cứu có liên quan và đưa ra những dẫn chứng cụ thể. Trong khi đó, AI hiện nay vẫn gặp khó khăn trong việc nhận diện đúng đắn các tài liệu nghiên cứu có giá trị, điều này dẫn đến việc hệ thống AI đôi khi gợi ý những tài liệu không phù hợp hoặc không liên quan trực tiếp đến nội dung bài báo. Điều này một lần nữa khẳng định tầm quan trọng của chuyên môn con người trong việc duy trì sự chính xác và tính phù hợp của các tài liệu nghiên cứu được trích dẫn.
Với những kết quả này, nghiên cứu đề xuất một phương pháp hợp tác giữa con người và AI, trong đó AI sẽ đảm nhận những nhiệm vụ mang tính tự động như kiểm tra lỗi chính tả, định dạng và các phần đánh giá cơ bản, còn con người sẽ tập trung vào việc đánh giá bối cảnh, đạo đức và các khía cạnh phức tạp của nghiên cứu. Phương pháp này không chỉ giúp nâng cao hiệu quả quy trình đánh giá mà còn bảo vệ tính toàn vẹn học thuật, đồng thời giảm bớt gánh nặng công việc cho các chuyên gia. Việc kết hợp AI vào quy trình đánh giá sẽ tạo ra một hệ thống linh hoạt hơn, trong đó con người sẽ vẫn giữ vai trò chủ đạo trong việc đưa ra các quyết định cuối cùng liên quan đến chất lượng nghiên cứu. Tuy nhiên, để triển khai phương pháp này một cách hiệu quả, vẫn cần phải giải quyết một số thách thức lớn, bao gồm vấn đề về độ tin cậy của AI, tính minh bạch trong quyết định của AI và việc duy trì sự công bằng trong quy trình đánh giá. Nghiên cứu khuyến nghị rằng, để tích hợp AI hiệu quả, cần phải có sự đa dạng trong dữ liệu huấn luyện, sử dụng các kỹ thuật AI có thể giải thích được và duy trì sự giám sát của con người trong quy trình đánh giá.
Ở Việt Nam, việc áp dụng AI vào quy trình bình duyệt trong xuất bản học thuật đang bắt đầu được quan tâm, đặc biệt là trong bối cảnh các nghiên cứu khoa học ngày càng gia tăng và yêu cầu về thời gian phản hồi từ các tạp chí ngày càng khắt khe. Tuy nhiên, để thực hiện thành công phương pháp kết hợp giữa AI và con người trong công tác đánh giá, Việt Nam cần phải tập trung vào một số yếu tố quan trọng. Thứ nhất, cần phát triển hệ thống AI với dữ liệu huấn luyện phù hợp và đa dạng, bao gồm các nghiên cứu trong các lĩnh vực khác nhau, đặc biệt là những lĩnh vực khoa học xã hội và nhân văn vốn có sự khác biệt lớn trong cách thức nghiên cứu và đánh giá. Thứ hai, việc đào tạo các chuyên gia đánh giá đồng nghiệp vẫn là yếu tố then chốt để bảo đảm tính chính xác và đạo đức trong quy trình này. Các chuyên gia không chỉ cần có kiến thức chuyên môn mà còn phải được trang bị kỹ năng nhận diện các vấn đề đạo đức, xã hội trong nghiên cứu. Cuối cùng, Việt Nam cũng cần xây dựng các cơ chế giám sát và đánh giá hiệu quả của AI trong quy trình bình duyệt, nhằm đảm bảo rằng AI không chỉ làm giảm bớt gánh nặng công việc mà còn duy trì sự công bằng và tính minh bạch trong nghiên cứu học thuật.
Vân An lược dịch
Nguồn:
Farber, S. (2025). Comparing human and AI expertise in the academic peer review process: towards a hybrid approach. Higher Education Research & Development, 44(4), 871–885. https://doi.org/10.1080/07294360.2024.2445575