Note: English translation below.
Đây là dự án đồ án tốt nghiệp thạc sỹ của tôi, được thực hiện dưới sự hướng dẫn của PGS. TS. Nguyễn Đình Hiển. Đề tài xây dựng bộ dữ liệu hỏi đáp về bảo hiểm trong luật lao động từ nguồn trực tuyến của cơ quan bảo hiểm xã hội Việt Nam và bổ sung câu trả lời từ các mô hình ngôn ngữ lớn để so sánh. Do ngôn ngữ pháp luật thường dùng trích dẫn văn bản pháp lý, đề tài đề xuất tạo thang đo riêng cho lĩnh vực này, đồng thời phát triển thuật toán và công cụ hỗ trợ trích xuất trích dẫn pháp luật để nâng cao hiệu quả áp dụng các công thức liên quan.
- Python 3.x
- Selenium để chạy crawl
- Trần Mạnh Chánh Quân
- Thông tin liên hệ: quandum@gmail.com
This is my master's thesis project, conducted under the supervision of Assoc. Prof. Dr. Nguyen Dinh Hien. The research focuses on building a Q&A dataset about insurance in labor law from online sources of Vietnam Social Insurance and supplementing answers from large language models for comparison. Since legal language often uses legal citations, the thesis proposes creating a specialized metric for this domain, while developing algorithms and tools to support legal citation extraction to improve the efficiency of applying related formulas.
- Python 3.x
- Selenium for web crawling
- Tran Manh Chanh Quan
- Contact: quandum@gmail.com