Nghiên cứu của 2 sinh viên trường ĐH Bách khoa (ĐHQG TP. HCM) được công bố tại Hội nghị về AI hàng đầu thế giới

0:00 / 0:00
0:00
SVVN - Hai sinh viên Phạm Khánh Trình và Lê Minh Khôi, trường ĐH Bách khoa (ĐHQG TP. HCM) đã có nghiên cứu được đăng tải tại Hội nghị AAAI - Hội nghị về AI hàng đầu thế giới.

Nghiên cứu về mô hình đa ngôn ngữ huấn luyện AI tạo câu đồng nghĩa là sự tiếp tục phát triển đồ án tốt nghiệp của Minh Khôi và Khánh Trình, hai sinh viên mất khoảng 8 tháng để có thể hoàn thiện nghiên cứu. Quá trình thực hiện nghiên cứu gặp khá nhiều thử thách, một trong những vấn đề lớn nhất mà nhóm cố gắng vượt qua là giải quyết bài toán có thể áp dụng trong các trường hợp thực tế. Hướng nghiên cứu của Minh Khôi và Khánh Trình tiếp cận đến những ngôn ngữ ít tài nguyên, trong quá trình làm việc, một số mô hình ngôn ngữ lớn như Chat GPT gặp một số vấn đề đối với những ngôn ngữ ít tài nguyên, ví dụ như tiếng Indonesia, tiếng Kazakhstan… Nhận thấy vấn đề này, nhóm đã quyết định phát triển một phương pháp để làm sao mà không phụ thuộc quá nhiều vào tài nguyên ngôn ngữ và vẫn sinh ra được một câu tương đối giống với một câu người bản xứ nói.

Nói thêm về nghiên cứu, Khánh Trình cho biết, mọi người thường dùng những từ đồng nghĩa với những từ trong câu để tạo ra một câu khác, trong tiếng Anh có “soccer” thay thế “football” chẳng hạn, đó là cách thông thường. Để đa dạng quá trình tạo câu đồng nghĩa hơn, Trình và Khôi đã sử dụng phương pháp đào tạo đối nghịch để có chất lượng đầu ra tốt hơn. “Có thể câu đồng nghĩa sinh ra chưa sát vì nó bị thay đổi nhiều, vì vậy, trong quá trình huấn luyện, chúng mình có thực hiện một số kỹ thuật bên AI về huấn luyện đối nghịch và thêm các biến số chặn trên và chặn dưới của sự ngẫu nhiên để câu sinh ra không vượt qua khỏi phạm vi đã đề ra”, Trình nói thêm.

Nghiên cứu của 2 sinh viên trường ĐH Bách khoa (ĐHQG TP. HCM) được công bố tại Hội nghị về AI hàng đầu thế giới ảnh 1

Minh Khôi (trái) và Khánh Trình trong buổi bảo vệ đồ án tốt nghiệp. (Ảnh: NVCC)

Mỗi thứ tiếng trên thế giới sẽ có những điểm đặc biệt khác nhau, tính khách quan đối với mô hình nghiên cứu cũng khác nhau. Với tiếng Việt, nhóm cho biết cái khó của tiếng Việt là dấu câu, tất cả các từ ngữ tiếng Việt đều có một âm tiết, lúc tiền xử lý dữ liệu khó hơn các thứ tiếng khác. Ví dụ như từ “nhà hàng”, tiếng Việt cần hai từ “nhà” và “hàng” thì tiếng Anh chỉ cần một từ là “restaurant”. Vì thế, thông thường, tiếng Việt có số lượng từ nhiều hơn tiếng Anh, tiếng Việt khó ở chỗ có dấu, nếu không gõ dấu thì nó cũng chỉ như chuỗi ký tự Latinh, như tiếng Anh bình thường. Khi có dấu, sẽ khó tiến hành các bước tiền xử lý để mô hình học tốt hơn. Nhưng may mắn, nhóm đã tìm được hướng giải quyết thông qua huấn luyện đối nghịch, và kết quả cho ra tốt hơn các phương pháp trước đó.

Để có thể kiểm tra chất lượng đầu ra của nghiên cứu, nhóm đã liên hệ với những chuyên gia ngôn ngữ để có thể nhận được những đánh giá cụ thể dựa trên ba tiêu chí: tính trôi chảy, ngữ nghĩa và đa dạng từ vựng. Kết quả đánh giá đạt 4,2 - 4,7 trên thang điểm 5.

Nghiên cứu của 2 sinh viên trường ĐH Bách khoa (ĐHQG TP. HCM) được công bố tại Hội nghị về AI hàng đầu thế giới ảnh 2
Minh Khôi và Khánh Trình chụp hình cùng PGS. TS Quản Thành Thơ - Phó Trưởng khoa Khoa học và Kỹ thuật Máy tính, trường ĐH Bách khoa, ĐHQG TP. HCM trong Lễ tốt nghiệp. (Ảnh: NVCC)

Chia sẻ về cảm xúc của mình khi nghiên cứu được công bố tại hội nghị AAAI, Trình và Khôi không khỏi bất ngờ và xúc động khi đạt được thành tựu to lớn này. Về những ấp ủ trong tương lai với nghiên cứu, hai nam sinh Bách khoa cho biết, nhóm tiến hành tổng hợp thêm một số ngôn ngữ khác, hướng tới bộ dữ liệu khổng lồ là Wikipedia nhưng đây là một dự án mở, tất cả mọi người đều có thể đóng góp nội dung, chất lượng nội dung là điều đáng lo ngại. Nguồn thứ hai mà nhóm quan tâm, đó là các bài báo, bởi hầu hết các quốc gia đều có tòa soạn báo và chất lượng kiểm duyệt của các tòa soạn báo sẽ tốt hơn. Khôi cho biết: “Sau khi nghiên cứu được ra mắt, nhiều công trình nghiên cứu khác ra đời bổ sung nhiều thứ tiếng thuộc khu vực miền nam châu Mỹ, nhóm nhận thấy những thứ tiếng này có mức độ ảnh hưởng nhất định nên trong tương lai có thể sẽ thêm vào để có thể mở rộng tập ngôn ngữ”.

Hiện tại, Khánh Trình và minh Khôi hiện đang làm việc tại các công ty lớn và công việc hằng ngày là nghiên cứu trí tuệ nhân tạo và xử lý ngôn ngữ tự nhiên. Được biết, cả hai đều dự định sẽ học lên cao, tiếp tục con đường nghiên cứu về trí tuệ nhân tạo để có thể mang lại những công trình nghiên cứu chất lượng.

MỚI - NÓNG
Thí sinh chưa đỗ tốt nghiệp THPT 2024 sẽ có đề thi riêng
Thí sinh chưa đỗ tốt nghiệp THPT 2024 sẽ có đề thi riêng
SVVN - Bộ GD - ĐT đã có thông tin chính thức về việc tổ chức thi tốt nghiệp THPT cho thí sinh chưa đỗ kỳ thi năm 2024. Theo đó, từ năm 2025, những học sinh chưa đỗ Kỳ thi Tốt nghiệp năm 2024 và những năm trước đó sẽ được tổ chức thi tốt nghiệp đúng nội dung chương trình giáo dục phổ thông đã được học, theo tinh thần đảm bảo đầy đủ quyền lợi của học sinh.

Có thể bạn quan tâm

Hoa hậu Nguyễn Thúc Thuỳ Tiên: 'Thanh niên luôn được coi là chủ thể quan trọng trong quá trình phát triển của ASEAN'

Hoa hậu Nguyễn Thúc Thuỳ Tiên: 'Thanh niên luôn được coi là chủ thể quan trọng trong quá trình phát triển của ASEAN'

SVVN - 'Gương mặt trẻ Việt Nam tiêu biểu' 2021 Nguyễn Thúc Thuỳ Tiên có mặt tại Học viện Ngoại giao để tham dự chương trình đối thoại giữa Tổng Thư ký ASEAN với thanh niên ASEAN về chủ đề 'Thanh niên ASEAN - Tương lai ASEAN: Vai trò của Thanh niên trong việc định hình tương lai ASEAN'. Đây là hoạt động nằm trong khuôn khổ 'Diễn đàn Tương lai ASEAN 2024'.
Bạn trẻ Sài Gòn mê mẩn bởi đồng cỏ lau Làng Đại học Thủ Đức đang mùa bung nở

Bạn trẻ Sài Gòn mê mẩn bởi đồng cỏ lau Làng Đại học Thủ Đức đang mùa bung nở

SVVN - Cánh đồng cỏ lau tại Làng Đại học Thủ Đức đang đua nhau bung nở, rực rỡ một màu trắng muốt, tạo nên một khung cảnh thơ mộng, lãng mạn. Ngay sau khi lan truyền trên mạng xã hội, cánh đồng cỏ lau nhận được sự quan tâm lớn của cư dân mạng, thu hút nhiều bạn trẻ đến chụp ảnh, lưu giữ những khoảnh khắc đẹp.
Mãn nhãn, xúc động với 'biên niên sử' về lực lượng Cảnh sát Cơ động

Mãn nhãn, xúc động với 'biên niên sử' về lực lượng Cảnh sát Cơ động

SVVN - Chương trình nghệ thuật '50 năm Cảnh sát Cơ động - Những chặng đường vinh quang' là một trong những hoạt động văn hóa, nghệ thuật điểm nhấn trong chuỗi hoạt động chào mừng kỷ niệm 50 năm Ngày truyền thống lực lượng Cảnh sát Cơ động (15/4/1974 – 15/4/2024). Chương trình nói về lực lượng Cảnh sát Cơ động từ những ngày đầu mới thành lập, trải qua các giai đoạn trưởng thành, phát triển cho đến hôm nay.
Muôn kiểu tránh nóng của sinh viên TP. HCM

Muôn kiểu tránh nóng của sinh viên TP. HCM

SVVN - Những ngày này, nhiệt độ tại TP. HCM luôn ở mức cao, phổ biến từ 37 - 39 độ C. Thời tiết nắng nóng, ngột ngạt khiến nhiều sinh viên tìm cách “chạy trốn”. Từ che chắn đến “ẩn nấp” ở thư viện, quán cà phê... đều được sinh viên áp dụng để chống chọi với cái nắng khắc nghiệt.
Hành trình theo ‘dấu chân mặt trời’ của 2 nữ runner 'Top 8 vận động viên phong trào cự ly HM' hướng tới ‘TPM 2024’

Hành trình theo ‘dấu chân mặt trời’ của 2 nữ runner 'Top 8 vận động viên phong trào cự ly HM' hướng tới ‘TPM 2024’

SVVN - Không chỉ là hai trong 8 runner nữ có vinh dự được xếp pen E (Elite) chung với tuyển quốc gia tại "Giải Vô địch Quốc gia và Cự ly dài báo Tiền Phong" (Tiền Phong Marathon - TPM) lần thứ 65, năm 2024, tại Phú Yên, Nguyễn Thị Hưởng và Lê Thị Lai còn được biết đến là hai nữ runner có tiếng trong làng chạy phong trào, cùng nhiều thành tích cao ở các giải chạy lớn, nhỏ.
Cựu sinh viên Nhân văn nhắn nhủ sinh viên Nhân văn trước ngưỡng cửa thế giới việc làm

Cựu sinh viên Nhân văn nhắn nhủ sinh viên Nhân văn trước ngưỡng cửa thế giới việc làm

SVVN - Anh Nguyễn Văn Đạt có 8 năm kinh nghiệm làm việc tại Tập đoàn Thế giới di động, đang là Giám đốc Phát triển mạng lưới kiêm Giám đốc Đối ngoại Công ty cổ phần Thời trang YODY. Anh là 1 trong số 5 diễn giả khách mời tại talkshow "Chuyển đổi việc làm: Cơ hội, thách thức cho người lao động và doanh nghiệp" do trường Đại học Khoa học Xã hội & Nhân văn - ĐHQG Hà Nội tổ chức. Đây là chia sẻ của anh dành riêng cho chuyên trang Sinh Viên Việt Nam, báo Tiền Phong.
Gen Z sử dụng mạng xã hội sao cho hiệu quả?

Gen Z sử dụng mạng xã hội sao cho hiệu quả?

SVVN - Tại chương trình "Hỗ trợ tâm lý học đường - đưa chuyên gia đến với trường học", diễn ra ở trường THCS-THPT Hai Bà Trưng (quận Tân Bình, TP. HCM), ThS Tâm lý Trần Thị Thanh Trà - giảng viên trường ĐH Mở TP. HCM cho biết: “Theo thống kê của Google vào tháng 6/2023, gần 80% người dân Việt Nam sử dụng mạng xã hội, thời lượng trung bình là 3 giờ đồng/ngày”.