Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.author | Đỗ, Thị Thanh Tuyền, ThS. | - |
dc.contributor.author | Nguyễn, Tuấn Đăng, TS. | - |
dc.date.accessioned | 2018-12-12T07:34:37Z | - |
dc.date.available | 2018-12-12T07:34:37Z | - |
dc.date.issued | 2015 | - |
dc.identifier.uri | http://ir.vnulib.edu.vn/handle/VNU_HCM/5370 | - |
dc.description | 87 tr. | |
dc.description.abstract | Đề tài đặt mục tiêu xây dựng một mô hình tìm kiếm thông tin dựa trên ngữ nghĩa cụm từ truy vấn cho các văn bản tiếng Việt. Theo các kết quả nghiên cứu của đề tài, mô hình có các thành phần chính gồm thành phần phân tích ngữ nghĩa, thành phần lập chỉ mục và thành phần tìm kiếm Thành phần phân tích ngữ nghĩa là thành phần quan trọng nhất trong hệ thống. Thành phần này sử dụng một cơ sở tri thức ngữ nghĩa từ vựng tiếng Việt được xây dựng để mô tả các quan hệ ngữ pháp và ngữ nghĩa giữa các lớp nghĩa. Các lớp nghĩa là ý nghĩa thực sự của các từ trong ngữ cảnh xác định. Quá trình phân tích ngữ nghĩa gồm các bước xác định lớp nghĩa, xác định quan hệ giữa các lớp nghĩa để sản sinh cấu trúc biểu diễn ngữ nghĩa của các cụm từ truy vấn từ biểu diễn bằng văn bản của nó. Thành phần lập chỉ mục thực hiện việc lập chỉ mục cho cấu trúc biểu diễn ngữ nghĩa của các ngữ đoạn theo cấu trúc chỉ mục nghịch đảo. Có hai loại đối tượng để lập chỉ mục: các lớp nghĩa và các quan hệ của các lớp nghĩa. Vì vậy, thành phần lập chỉ mục sử dụng hai cấu trúc chỉ mục nghịch đảo. Thành phần tìm kiếm được thiết kế để tìm những câu phù hợp với truy vấn. Trong quá trình tìm kiếm, câu truy vấn được phân tích thành các lớp nghĩa và các quan hệ của nó, gọi là đối tượng tìm kiếm. Đối tượng tìm kiếm này được tìm trong cấu trúc chỉ mục thích hợp theo mô hình Extended Boolean với độ đo là độ tương đồng ngữ nghĩa. Độ tương đồng ngữ nghĩa được xác định là khoảng cách giữa hai lớp nghĩa trên cơ sở tri thức ngữ nghĩa từ vựng tiếng Việt. Để đánh giá mô hình, một hệ thống tìm kiếm tài liệu văn bản tiếng Việt dựa trên ngữ nghĩa đã được xây dựng theo mô hình đề xuất. Hệ thống được đánh giá bằng một tập dữ liệu kiểm thử gồm các truy vấn được xây dựng thủ công cùng với các kết quả của nó. Kết quả đánh giá hệ thống có độ phủ đạt 78.35%, độ chính xác đạt 96,55%, độ F đạt 86,51% | |
dc.language.iso | vi | |
dc.publisher | Trường Đại học Công nghệ Thông tin | |
dc.relation.ispartofseries | C2013-26-06 | - |
dc.subject | Computer engineering. | |
dc.subject | Kỹ thuật máy tính. | |
dc.title | Mô hình tìm kiếm văn bản tiếng Việt dựa trên ngữ nghĩa cụm từ truy vấn = Phrasal query based semantic information retrieval model for Vietnamese texts / Đỗ Thị Thanh Tuyền, Nguyễn Tuấn Đăng. | |
dc.type | Working Paper | |
Appears in Collections | Đại học Quốc gia TP.HCM---VNU |