Dự án cơ sở dữ liệu các bài báo khoa học quy mô lớn, truy cập mở được khởi động

Dự án OpenAlex sẽ lập chỉ mục hàng trăm triệu tài liệu nghiên cứu và các quan hệ giữa chúng. Đây được cho sẽ là dự án thiết lập cơ sở dữ liệu khoa học quy mô và tham vọng nhất của thế giới; đặc biệt hơn, OpenAlex sẽ cho phép truy cập mở hoàn toàn miễn phí.

OpenAlex, một dự án cơ sở dữ liệu chỉ mục miễn phí đầy tham vọng, bao gồm hơn 200 triệu tài liệu khoa học với đầy đủ thông tin về các nguồn xuất bản, thông tin tác giả và chủ đề nghiên cứu, đã chính thức khởi động.

OpenAlex được đặt tên theo Thư viện Alexandria thời cổ đại ở Ai Cập, có mục tiêu thiết lập kết nối giữa các điểm dữ liệu nói trên nhằm tạo ra một cơ sở dữ liệu toàn diện, liên kết lẫn nhau về hệ thống nghiên cứu khoa học toàn cầu. Được ra mắt vào ngày 03/01/2022, OpenAlex là sự thay thế cho Microsoft Academic Graph (MAG) - dịch vụ miễn phí hoạt động tương tự như các nền tảng trả phí như Scopus, Dimensions và Web of Science song đã ngừng hoạt động vào cuối năm 2021.

Động thái của Microsoft trong việc đóng cửa MAG được đưa ra vào tháng 5 năm ngoái, đã khiến một số nhà khoa học lo lắng - những người vốn sử dụng dữ liệu từ MAG để tiến hành nghiên cứu và xây dựng các công cụ khoa học.

Trước động thái đóng cửa MAG, tổ chức cung cấp dịch vụ học thuật phi lợi nhuận OurResearch có trụ sở tại Vancouver, Canada đã tạo ra OpenAlex, sử dụng một phần kinh phí tài trợ trị giá 4,5 triệu USD do tổ chức từ thiện Arcadia Fund, có trụ sở tại London, cung cấp. Cơ sở dữ liệu này hiện đang cho phép truy cập thông qua một hàm giao diện lập trình ứng dụng (API), cho phép thực hiện các truy vấn tìm kiếm phức tạp. Một giao diện đơn giản và thân thiện với người dùng hơn được dự kiến ra mắt vào tháng 2 tới.

OpenAlex sẽ lấy dữ liệu từ các bản ghi sẵn có của MAG và một số nguồn khác, bao gồm các mã nhận dạng từ Wikidata (dự án cơ sở dữ liệu mở do Wikimedia Foundation, tổ chức đứng đằng sau Wikipedia, vận hành), ORCID, Crossref và ROR, Jason Priem, đồng sáng lập OurResearch cho biết.

Công cụ này cũng được tích hợp với cơ sở dữ liệu Unpaywall, bao gồm hơn 30 triệu bài nghiên cứu dạng truy cập mở do Priem và Heather Piwowar (đồng sáng lập OurResearch), tạo ra năm 2017. Priem cũng cho biết OpenAlex sẽ được cập nhật 2 tuần một lần để tải thêm dữ liệu từ các nguồn. Công cụ này thậm chí còn tiến xa hơn so với MAG một bước, bởi dữ liệu trên OpenAlex là hoàn toàn miễn phí, được cung cấp theo giấy phép CC0 (phạm vi công cộng) cho phép tất cả mọi người sử dụng. Do đó, nếu OpenAlex bị đóng cửa, tất cả mọi người đều có thể kế thừa từ những thành quả mà OurResearch đã xây dựng, thay vì phải bắt đầu lại từ đầu.

OpenAlex cũng hoàn toàn miễn phí một phần nhờ sự tài trợ của Amazon Web Services, hệ thống hạ tầng điện toán đám mây của Amazon, và không yêu cầu người dùng phải đăng ký hay đăng nhập để có thể sử dụng. Điều này khác với MAG, vốn yêu cầu người dùng phải đăng nhập vào hệ thống hạ tầng đám mây Azure của Microsoft và trả một khoản phí nhỏ để tải dữ liệu về. Priem cho biết OurResearch cũng có thể sẽ tung ra phiên bản trả phí của OpenAlex cho những người dùng muốn có quyền truy cập rất nhanh vào cơ sở dữ liệu này, nhưng sẽ luôn luôn duy trì phiên bản miễn phí.

Vân An dịch

Nguồn:

Singh Chawla, D. (2022). Massive open index of scholarly papers launches. Nature. https://doi.org/10.1038/d41586-022-00138-y

Ghi chú: Các quan điểm của Tác giả không hẳn là quan điểm của Tạp chí Giáo dục.

Bạn đang đọc bài viết Dự án cơ sở dữ liệu các bài báo khoa học quy mô lớn, truy cập mở được khởi động tại chuyên mục Xuất bản khoa học của Tạp chí Giáo dục. Mọi thông tin góp ý và chia sẻ, xin vui lòng liên hệ SĐT: (+84)2462598109 hoặc gửi về hòm thư tapchigiaoduc@moet.gov.vn