Nghiên cứu của 2 sinh viên trường ĐH Bách khoa (ĐHQG TP. HCM) được công bố tại Hội nghị về AI hàng đầu thế giới

0:00 / 0:00
0:00
SVVN - Hai sinh viên Phạm Khánh Trình và Lê Minh Khôi, trường ĐH Bách khoa (ĐHQG TP. HCM) đã có nghiên cứu được đăng tải tại Hội nghị AAAI - Hội nghị về AI hàng đầu thế giới.

Nghiên cứu về mô hình đa ngôn ngữ huấn luyện AI tạo câu đồng nghĩa là sự tiếp tục phát triển đồ án tốt nghiệp của Minh Khôi và Khánh Trình, hai sinh viên mất khoảng 8 tháng để có thể hoàn thiện nghiên cứu. Quá trình thực hiện nghiên cứu gặp khá nhiều thử thách, một trong những vấn đề lớn nhất mà nhóm cố gắng vượt qua là giải quyết bài toán có thể áp dụng trong các trường hợp thực tế. Hướng nghiên cứu của Minh Khôi và Khánh Trình tiếp cận đến những ngôn ngữ ít tài nguyên, trong quá trình làm việc, một số mô hình ngôn ngữ lớn như Chat GPT gặp một số vấn đề đối với những ngôn ngữ ít tài nguyên, ví dụ như tiếng Indonesia, tiếng Kazakhstan… Nhận thấy vấn đề này, nhóm đã quyết định phát triển một phương pháp để làm sao mà không phụ thuộc quá nhiều vào tài nguyên ngôn ngữ và vẫn sinh ra được một câu tương đối giống với một câu người bản xứ nói.

Nói thêm về nghiên cứu, Khánh Trình cho biết, mọi người thường dùng những từ đồng nghĩa với những từ trong câu để tạo ra một câu khác, trong tiếng Anh có “soccer” thay thế “football” chẳng hạn, đó là cách thông thường. Để đa dạng quá trình tạo câu đồng nghĩa hơn, Trình và Khôi đã sử dụng phương pháp đào tạo đối nghịch để có chất lượng đầu ra tốt hơn. “Có thể câu đồng nghĩa sinh ra chưa sát vì nó bị thay đổi nhiều, vì vậy, trong quá trình huấn luyện, chúng mình có thực hiện một số kỹ thuật bên AI về huấn luyện đối nghịch và thêm các biến số chặn trên và chặn dưới của sự ngẫu nhiên để câu sinh ra không vượt qua khỏi phạm vi đã đề ra”, Trình nói thêm.

Nghiên cứu của 2 sinh viên trường ĐH Bách khoa (ĐHQG TP. HCM) được công bố tại Hội nghị về AI hàng đầu thế giới ảnh 1

Minh Khôi (trái) và Khánh Trình trong buổi bảo vệ đồ án tốt nghiệp. (Ảnh: NVCC)

Mỗi thứ tiếng trên thế giới sẽ có những điểm đặc biệt khác nhau, tính khách quan đối với mô hình nghiên cứu cũng khác nhau. Với tiếng Việt, nhóm cho biết cái khó của tiếng Việt là dấu câu, tất cả các từ ngữ tiếng Việt đều có một âm tiết, lúc tiền xử lý dữ liệu khó hơn các thứ tiếng khác. Ví dụ như từ “nhà hàng”, tiếng Việt cần hai từ “nhà” và “hàng” thì tiếng Anh chỉ cần một từ là “restaurant”. Vì thế, thông thường, tiếng Việt có số lượng từ nhiều hơn tiếng Anh, tiếng Việt khó ở chỗ có dấu, nếu không gõ dấu thì nó cũng chỉ như chuỗi ký tự Latinh, như tiếng Anh bình thường. Khi có dấu, sẽ khó tiến hành các bước tiền xử lý để mô hình học tốt hơn. Nhưng may mắn, nhóm đã tìm được hướng giải quyết thông qua huấn luyện đối nghịch, và kết quả cho ra tốt hơn các phương pháp trước đó.

Để có thể kiểm tra chất lượng đầu ra của nghiên cứu, nhóm đã liên hệ với những chuyên gia ngôn ngữ để có thể nhận được những đánh giá cụ thể dựa trên ba tiêu chí: tính trôi chảy, ngữ nghĩa và đa dạng từ vựng. Kết quả đánh giá đạt 4,2 - 4,7 trên thang điểm 5.

Nghiên cứu của 2 sinh viên trường ĐH Bách khoa (ĐHQG TP. HCM) được công bố tại Hội nghị về AI hàng đầu thế giới ảnh 2
Minh Khôi và Khánh Trình chụp hình cùng PGS. TS Quản Thành Thơ - Phó Trưởng khoa Khoa học và Kỹ thuật Máy tính, trường ĐH Bách khoa, ĐHQG TP. HCM trong Lễ tốt nghiệp. (Ảnh: NVCC)

Chia sẻ về cảm xúc của mình khi nghiên cứu được công bố tại hội nghị AAAI, Trình và Khôi không khỏi bất ngờ và xúc động khi đạt được thành tựu to lớn này. Về những ấp ủ trong tương lai với nghiên cứu, hai nam sinh Bách khoa cho biết, nhóm tiến hành tổng hợp thêm một số ngôn ngữ khác, hướng tới bộ dữ liệu khổng lồ là Wikipedia nhưng đây là một dự án mở, tất cả mọi người đều có thể đóng góp nội dung, chất lượng nội dung là điều đáng lo ngại. Nguồn thứ hai mà nhóm quan tâm, đó là các bài báo, bởi hầu hết các quốc gia đều có tòa soạn báo và chất lượng kiểm duyệt của các tòa soạn báo sẽ tốt hơn. Khôi cho biết: “Sau khi nghiên cứu được ra mắt, nhiều công trình nghiên cứu khác ra đời bổ sung nhiều thứ tiếng thuộc khu vực miền nam châu Mỹ, nhóm nhận thấy những thứ tiếng này có mức độ ảnh hưởng nhất định nên trong tương lai có thể sẽ thêm vào để có thể mở rộng tập ngôn ngữ”.

Hiện tại, Khánh Trình và minh Khôi hiện đang làm việc tại các công ty lớn và công việc hằng ngày là nghiên cứu trí tuệ nhân tạo và xử lý ngôn ngữ tự nhiên. Được biết, cả hai đều dự định sẽ học lên cao, tiếp tục con đường nghiên cứu về trí tuệ nhân tạo để có thể mang lại những công trình nghiên cứu chất lượng.

MỚI - NÓNG

Có thể bạn quan tâm

Gặp nhóm bạn GenZ đưa lịch sử đến gần hơn với giới trẻ chỉ qua 41 giây

Gặp nhóm bạn GenZ đưa lịch sử đến gần hơn với giới trẻ chỉ qua 41 giây

SVVN - Vượt qua hơn 68 đội thi, TVC 'Hồi sử' của nhóm Freedom Girls đã xuất sắc giành Quán quân tại cuộc thi 'TVCreate 2025'. Với thời lượng chỉ vẻn vẹn 41 giây, sản phẩm đã gây ấn tượng mạnh mẽ khi làm theo 'đặt hàng' từ Bảo tàng Lịch sử TP. HCM, mang đến một góc nhìn đầy mới mẻ, nơi người trẻ và di sản dân tộc tìm thấy sự kết nối sâu sắc.
Sinh viên khởi nghiệp và những nỗi lo về thuế

Sinh viên khởi nghiệp và những nỗi lo về thuế

SVVN - Với sự sáng tạo và lợi thế từ các nền tảng số, nhiều bạn trẻ đã mạnh dạn xây dựng những mô hình kinh doanh riêng, ngay từ khi còn ngồi trên ghế nhà trường. Tuy nhiên, đằng sau những câu chuyện thành công được lan tỏa, có một thực tế ít được đề cập: Gánh nặng và nỗi lo về các nghĩa vụ thuế.
Từ cô học sinh nhút nhát đến Trung úy Công an mang hoài bão phục vụ Tổ quốc

Từ cô học sinh nhút nhát đến Trung úy Công an mang hoài bão phục vụ Tổ quốc

SVVN - Trong khoảnh khắc được xướng tên là một trong 20 học viên xuất sắc của Học viện Cảnh sát nhân dân và được phong hàm Trung úy tại Lễ tốt nghiệp, Ngô Thị Ngọc Ánh không giấu nổi niềm xúc động. Với cô gái trẻ ấy, đây là sự ghi nhận xứng đáng cho hành trình nỗ lực không ngừng nghỉ suốt 5 năm dưới mái trường mang sắc phục Công an – hành trình đã tôi luyện nên một người chiến sĩ vừa có bản lĩnh, vừa có khát vọng cống hiến.
Giữ lửa học thuật kỷ nguyên số- Hành trình lan tỏa tri thức bằng tư duy sáng tạo

Giữ lửa học thuật kỷ nguyên số- Hành trình lan tỏa tri thức bằng tư duy sáng tạo

SVVN - Bằng nỗ lực học tập không ngừng, tinh thần vượt khó và tình yêu sâu sắc với tri thức, Nguyễn Quý Khánh Duy ( sinh năm 2000 ) – cựu sinh viên ngành Kỹ thuật điện tại University Southern California (USC, Mỹ) hay Đại học Nam California – đã chinh phục hành trình học vấn đầy gian nan, đồng thời sáng lập kênh YouTube “Vật Lý Chill” nhằm lan tỏa tinh thần học vì đam mê đến cộng đồng học sinh Việt Nam.
Hành trình 9 năm theo đuổi ước mơ của cô gái xứ Nghệ

Hành trình 9 năm theo đuổi ước mơ của cô gái xứ Nghệ

SVVN - Từ một cô bé ở làng quê, Nguyễn Thị Thương (sinh năm 2001) đã tự học, tự rèn luyện để trở thành MC Hoài Thương – gương mặt quen thuộc trong hàng ngàn chương trình lớn nhỏ. Không qua trường lớp bài bản, cô bắt đầu từ con số 0, dậy từ 4h sáng đi học, đi dẫn, vượt mọi khó khăn để theo đuổi đam mê. Hành trình ấy là minh chứng rằng: nỗ lực bền bỉ sẽ đưa bạn đến được ước mơ.
Tỏa sáng vẻ đẹp Ngoại ngữ 2025: Gặp gỡ 20 gương mặt thanh lịch vào vòng Chung kết

Tỏa sáng vẻ đẹp Ngoại ngữ 2025: Gặp gỡ 20 gương mặt thanh lịch vào vòng Chung kết

SVVN - Sau hơn một tháng phát động, cuộc thi 'Tỏa sáng vẻ đẹp Ngoại ngữ 2025’ đã chính thức lộ diện 20 gương mặt xuất sắc nhất bước vào vòng Chung kết. Đây là hoạt động trọng điểm chào mừng 70 năm thành lập trường ĐH Ngoại ngữ (ĐHQG Hà Nội), thu hút sự quan tâm của đông đảo sinh viên toàn trường.