Tạp chí Khoa học Đại học Đà Lạt, T. 6, S. 2 (2016)

Cỡ chữ:  Nhỏ  Vừa  Lớn

CÁC PHƯƠNG PHÁP ÁNH XẠ THUỘC TÍNH HỘP THÔNG TIN WIKIPEDIA ĐẾN WIKIDATA

Tạ Hoàng Thắng

Tóm tắt


Wikidata là một cơ sở dữ liệu trực tuyến mở lưu trữ các tài nguyên chung của các dự án liên quan do tổ chức Wikimedia quản lý. Việc đồng nhất hóa các hộp thông tin (infobox) của Wikipedia được nêu trong kế hoạch giai đoạn 2 của Wikidata. Theo đó, các hộp thông tin sẽ được đồng nhất hóa để tránh tình trạng đa dạng dữ liệu giữa các dự án ngôn ngữ. Đồng thời, nhóm phát triển Wikidata cũng lên kế hoạch phát triển hệ thống tự động diễn dịch các thuộc tính của các hộp thông tin Wikipedia. Bài báo này nhắm đến việc đưa ra một vài phương pháp tiếp cận để ánh xạ các thuộc tính của hộp thông tin đến Wikidata, từ đó nâng cao khả năng phát triển làm giàu nội dung cho các bài viết Wikipedia. Chúng tôi tập trung chủ yếu vào việc ánh xạ các thuộc tính ở Wikipedia Tiếng Việt và Wikipedia tiếng Anh.

Toàn văn: PDF