Nghiên cứu của 2 sinh viên trường ĐH Bách khoa (ĐHQG TP. HCM) được công bố tại Hội nghị về AI hàng đầu thế giới

0:00 / 0:00
0:00
SVVN - Hai sinh viên Phạm Khánh Trình và Lê Minh Khôi, trường ĐH Bách khoa (ĐHQG TP. HCM) đã có nghiên cứu được đăng tải tại Hội nghị AAAI - Hội nghị về AI hàng đầu thế giới.

Nghiên cứu về mô hình đa ngôn ngữ huấn luyện AI tạo câu đồng nghĩa là sự tiếp tục phát triển đồ án tốt nghiệp của Minh Khôi và Khánh Trình, hai sinh viên mất khoảng 8 tháng để có thể hoàn thiện nghiên cứu. Quá trình thực hiện nghiên cứu gặp khá nhiều thử thách, một trong những vấn đề lớn nhất mà nhóm cố gắng vượt qua là giải quyết bài toán có thể áp dụng trong các trường hợp thực tế. Hướng nghiên cứu của Minh Khôi và Khánh Trình tiếp cận đến những ngôn ngữ ít tài nguyên, trong quá trình làm việc, một số mô hình ngôn ngữ lớn như Chat GPT gặp một số vấn đề đối với những ngôn ngữ ít tài nguyên, ví dụ như tiếng Indonesia, tiếng Kazakhstan… Nhận thấy vấn đề này, nhóm đã quyết định phát triển một phương pháp để làm sao mà không phụ thuộc quá nhiều vào tài nguyên ngôn ngữ và vẫn sinh ra được một câu tương đối giống với một câu người bản xứ nói.

Nói thêm về nghiên cứu, Khánh Trình cho biết, mọi người thường dùng những từ đồng nghĩa với những từ trong câu để tạo ra một câu khác, trong tiếng Anh có “soccer” thay thế “football” chẳng hạn, đó là cách thông thường. Để đa dạng quá trình tạo câu đồng nghĩa hơn, Trình và Khôi đã sử dụng phương pháp đào tạo đối nghịch để có chất lượng đầu ra tốt hơn. “Có thể câu đồng nghĩa sinh ra chưa sát vì nó bị thay đổi nhiều, vì vậy, trong quá trình huấn luyện, chúng mình có thực hiện một số kỹ thuật bên AI về huấn luyện đối nghịch và thêm các biến số chặn trên và chặn dưới của sự ngẫu nhiên để câu sinh ra không vượt qua khỏi phạm vi đã đề ra”, Trình nói thêm.

Nghiên cứu của 2 sinh viên trường ĐH Bách khoa (ĐHQG TP. HCM) được công bố tại Hội nghị về AI hàng đầu thế giới ảnh 1

Minh Khôi (trái) và Khánh Trình trong buổi bảo vệ đồ án tốt nghiệp. (Ảnh: NVCC)

Mỗi thứ tiếng trên thế giới sẽ có những điểm đặc biệt khác nhau, tính khách quan đối với mô hình nghiên cứu cũng khác nhau. Với tiếng Việt, nhóm cho biết cái khó của tiếng Việt là dấu câu, tất cả các từ ngữ tiếng Việt đều có một âm tiết, lúc tiền xử lý dữ liệu khó hơn các thứ tiếng khác. Ví dụ như từ “nhà hàng”, tiếng Việt cần hai từ “nhà” và “hàng” thì tiếng Anh chỉ cần một từ là “restaurant”. Vì thế, thông thường, tiếng Việt có số lượng từ nhiều hơn tiếng Anh, tiếng Việt khó ở chỗ có dấu, nếu không gõ dấu thì nó cũng chỉ như chuỗi ký tự Latinh, như tiếng Anh bình thường. Khi có dấu, sẽ khó tiến hành các bước tiền xử lý để mô hình học tốt hơn. Nhưng may mắn, nhóm đã tìm được hướng giải quyết thông qua huấn luyện đối nghịch, và kết quả cho ra tốt hơn các phương pháp trước đó.

Để có thể kiểm tra chất lượng đầu ra của nghiên cứu, nhóm đã liên hệ với những chuyên gia ngôn ngữ để có thể nhận được những đánh giá cụ thể dựa trên ba tiêu chí: tính trôi chảy, ngữ nghĩa và đa dạng từ vựng. Kết quả đánh giá đạt 4,2 - 4,7 trên thang điểm 5.

Nghiên cứu của 2 sinh viên trường ĐH Bách khoa (ĐHQG TP. HCM) được công bố tại Hội nghị về AI hàng đầu thế giới ảnh 2
Minh Khôi và Khánh Trình chụp hình cùng PGS. TS Quản Thành Thơ - Phó Trưởng khoa Khoa học và Kỹ thuật Máy tính, trường ĐH Bách khoa, ĐHQG TP. HCM trong Lễ tốt nghiệp. (Ảnh: NVCC)

Chia sẻ về cảm xúc của mình khi nghiên cứu được công bố tại hội nghị AAAI, Trình và Khôi không khỏi bất ngờ và xúc động khi đạt được thành tựu to lớn này. Về những ấp ủ trong tương lai với nghiên cứu, hai nam sinh Bách khoa cho biết, nhóm tiến hành tổng hợp thêm một số ngôn ngữ khác, hướng tới bộ dữ liệu khổng lồ là Wikipedia nhưng đây là một dự án mở, tất cả mọi người đều có thể đóng góp nội dung, chất lượng nội dung là điều đáng lo ngại. Nguồn thứ hai mà nhóm quan tâm, đó là các bài báo, bởi hầu hết các quốc gia đều có tòa soạn báo và chất lượng kiểm duyệt của các tòa soạn báo sẽ tốt hơn. Khôi cho biết: “Sau khi nghiên cứu được ra mắt, nhiều công trình nghiên cứu khác ra đời bổ sung nhiều thứ tiếng thuộc khu vực miền nam châu Mỹ, nhóm nhận thấy những thứ tiếng này có mức độ ảnh hưởng nhất định nên trong tương lai có thể sẽ thêm vào để có thể mở rộng tập ngôn ngữ”.

Hiện tại, Khánh Trình và minh Khôi hiện đang làm việc tại các công ty lớn và công việc hằng ngày là nghiên cứu trí tuệ nhân tạo và xử lý ngôn ngữ tự nhiên. Được biết, cả hai đều dự định sẽ học lên cao, tiếp tục con đường nghiên cứu về trí tuệ nhân tạo để có thể mang lại những công trình nghiên cứu chất lượng.

MỚI - NÓNG
Tân binh HALEY kết hợp với MANBO của 'Rap Việt' khắc họa góc nhìn mới mẻ về nỗi buồn trong tình yêu của gen Z
Tân binh HALEY kết hợp với MANBO của 'Rap Việt' khắc họa góc nhìn mới mẻ về nỗi buồn trong tình yêu của gen Z
SVVN - HALEY chính thức ra mắt ca khúc mang tên 'Em buồn anh'. Sự trở lại lần này của tân binh gen Z đánh dấu cho bước phát triển tiếp theo sau khoảng thời gian chuẩn bị kỹ lưỡng, kể từ sản phẩm debut, tháng 9/2024. Ca khúc một lần nữa khẳng định được thế mạnh sáng tác và sản xuất âm nhạc của HALEY.
Điểm qua dàn 'mỹ nhân' trong 'bom tấn' của Lý Hải: Từ 'ngôi sao trăm tỷ' đến 'nàng thơ' phim nghệ thuật Việt
Điểm qua dàn 'mỹ nhân' trong 'bom tấn' của Lý Hải: Từ 'ngôi sao trăm tỷ' đến 'nàng thơ' phim nghệ thuật Việt
SVVN - 'Lật mặt 8: Vòng tay nắng' của Lý Hải được kỳ vọng tiếp nối thành công vang dội của loạt phim này, trong đó ,được quan tâm hàng đầu là dàn diễn viên nữ xinh đẹp, tài năng. Những 'bóng hồng' của phim trải dài đủ thế hệ, với những thành tích và thực lực diễn xuất đa dạng, hứa hẹn mang đến một 'bữa tiệc' mãn nhãn và nhiệt huyết trên màn ảnh rộng.
Phát triển mạng lưới nhóm nghiên cứu mạnh
Phát triển mạng lưới nhóm nghiên cứu mạnh
SVVN - Trong khuôn khổ Diễn đàn ‘Tiếng nói tuổi trẻ - Hành động của Đoàn’, TS Khúc Thế Anh - Giảng viên Viện Ngân hàng Tài chính (ĐH Kinh tế Quốc dân) đã chia sẻ về việc phát triển mạng lưới nhóm nghiên cứu mạnh trong giảng viên trẻ và sinh viên nhằm hưởng ứng thực hiện các mục tiêu theo tinh thần Nghị quyết 57-NQ/TW của Bộ Chính trị về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia.

Có thể bạn quan tâm

Nhà trọ không đảm bảo an toàn PCCC sắp phải dừng hoạt động: Sinh viên và chủ trọ ứng phó ra sao?

Nhà trọ không đảm bảo an toàn PCCC sắp phải dừng hoạt động: Sinh viên và chủ trọ ứng phó ra sao?

SVVN - Từ ngày 1/4, theo Chỉ thị 19/CT-TTg của Thủ tướng Chính phủ về tăng cường công tác phòng cháy, chữa cháy (PCCC), những nhà trọ không đảm bảo an toàn PCCC sẽ phải dừng hoạt động sau ngày 30/3/2025. Trước thông tin này, nhiều sinh viên bày tỏ sự lo lắng, tìm thêm phương án khi đang thuê trọ trên địa bàn TP. HCM.
Diễn đàn Tương lai ASEAN 2025: Cơ hội và trải nghiệm ‘đặc thù’ của sinh viên Học viện Ngoại giao

Diễn đàn Tương lai ASEAN 2025: Cơ hội và trải nghiệm ‘đặc thù’ của sinh viên Học viện Ngoại giao

SVVN - Vinh dự là đơn vị tổ chức Diễn đàn Tương lai ASEAN 2025 (AFF 2025), Học viện Ngoại giao có ưu thế với nhiều sinh viên trẻ đầy năng động, nhiệt huyết và có kỹ năng công tác ngoại giao tốt. Chính vì vậy, đây vừa là một nguồn nhân lực tiềm năng hỗ trợ Diễn đàn diễn ra suôn sẻ, vừa là cơ hội để các bạn sinh viên Ngoại giao được đóng góp cho hoạt động đối ngoại của đất nước.
Hành trình chinh phục đỉnh cao Olympic Hóa học quốc tế của nam sinh Bắc Ninh

Hành trình chinh phục đỉnh cao Olympic Hóa học quốc tế của nam sinh Bắc Ninh

SVVN - Nguyễn Hữu Tiến Hưng, chàng trai từng đam mê tiếng Anh, rồi bén duyên với Hóa học, đã xuất sắc giành Huy chương Vàng Olympic Hóa học quốc tế 2024. Không chỉ đạt điểm số cao nhất đoàn Việt Nam, cậu còn ghi dấu ấn với hành trình học tập đầy nghị lực, tinh thần tự học bền bỉ và khát vọng chinh phục đỉnh cao tri thức.
Thân Thế Công – từ cậu bé 'nghiện' game đến nhà Vô địch Olympic Vật lý quốc tế

Thân Thế Công – từ cậu bé 'nghiện' game đến nhà Vô địch Olympic Vật lý quốc tế

SVVN - Liệu có ai nghĩ rằng, một cậu bé từng nghiện game, từng bị bố mẹ bán đi máy tính vì ham chơi, lại có thể trở thành nhà vô địch Olympic Vật lý Quốc tế? Câu chuyện của Thân Thế Công, chàng trai giành Huy chương Vàng Olympic Vật lý Quốc tế 2024, chắc chắn sẽ truyền cảm hứng mạnh mẽ cho thế hệ sinh viên hôm nay.