Nghiên cứu của 2 sinh viên trường ĐH Bách khoa (ĐHQG TP. HCM) được công bố tại Hội nghị về AI hàng đầu thế giới

0:00 / 0:00
0:00
SVVN - Hai sinh viên Phạm Khánh Trình và Lê Minh Khôi, trường ĐH Bách khoa (ĐHQG TP. HCM) đã có nghiên cứu được đăng tải tại Hội nghị AAAI - Hội nghị về AI hàng đầu thế giới.

Nghiên cứu về mô hình đa ngôn ngữ huấn luyện AI tạo câu đồng nghĩa là sự tiếp tục phát triển đồ án tốt nghiệp của Minh Khôi và Khánh Trình, hai sinh viên mất khoảng 8 tháng để có thể hoàn thiện nghiên cứu. Quá trình thực hiện nghiên cứu gặp khá nhiều thử thách, một trong những vấn đề lớn nhất mà nhóm cố gắng vượt qua là giải quyết bài toán có thể áp dụng trong các trường hợp thực tế. Hướng nghiên cứu của Minh Khôi và Khánh Trình tiếp cận đến những ngôn ngữ ít tài nguyên, trong quá trình làm việc, một số mô hình ngôn ngữ lớn như Chat GPT gặp một số vấn đề đối với những ngôn ngữ ít tài nguyên, ví dụ như tiếng Indonesia, tiếng Kazakhstan… Nhận thấy vấn đề này, nhóm đã quyết định phát triển một phương pháp để làm sao mà không phụ thuộc quá nhiều vào tài nguyên ngôn ngữ và vẫn sinh ra được một câu tương đối giống với một câu người bản xứ nói.

Nói thêm về nghiên cứu, Khánh Trình cho biết, mọi người thường dùng những từ đồng nghĩa với những từ trong câu để tạo ra một câu khác, trong tiếng Anh có “soccer” thay thế “football” chẳng hạn, đó là cách thông thường. Để đa dạng quá trình tạo câu đồng nghĩa hơn, Trình và Khôi đã sử dụng phương pháp đào tạo đối nghịch để có chất lượng đầu ra tốt hơn. “Có thể câu đồng nghĩa sinh ra chưa sát vì nó bị thay đổi nhiều, vì vậy, trong quá trình huấn luyện, chúng mình có thực hiện một số kỹ thuật bên AI về huấn luyện đối nghịch và thêm các biến số chặn trên và chặn dưới của sự ngẫu nhiên để câu sinh ra không vượt qua khỏi phạm vi đã đề ra”, Trình nói thêm.

Nghiên cứu của 2 sinh viên trường ĐH Bách khoa (ĐHQG TP. HCM) được công bố tại Hội nghị về AI hàng đầu thế giới ảnh 1

Minh Khôi (trái) và Khánh Trình trong buổi bảo vệ đồ án tốt nghiệp. (Ảnh: NVCC)

Mỗi thứ tiếng trên thế giới sẽ có những điểm đặc biệt khác nhau, tính khách quan đối với mô hình nghiên cứu cũng khác nhau. Với tiếng Việt, nhóm cho biết cái khó của tiếng Việt là dấu câu, tất cả các từ ngữ tiếng Việt đều có một âm tiết, lúc tiền xử lý dữ liệu khó hơn các thứ tiếng khác. Ví dụ như từ “nhà hàng”, tiếng Việt cần hai từ “nhà” và “hàng” thì tiếng Anh chỉ cần một từ là “restaurant”. Vì thế, thông thường, tiếng Việt có số lượng từ nhiều hơn tiếng Anh, tiếng Việt khó ở chỗ có dấu, nếu không gõ dấu thì nó cũng chỉ như chuỗi ký tự Latinh, như tiếng Anh bình thường. Khi có dấu, sẽ khó tiến hành các bước tiền xử lý để mô hình học tốt hơn. Nhưng may mắn, nhóm đã tìm được hướng giải quyết thông qua huấn luyện đối nghịch, và kết quả cho ra tốt hơn các phương pháp trước đó.

Để có thể kiểm tra chất lượng đầu ra của nghiên cứu, nhóm đã liên hệ với những chuyên gia ngôn ngữ để có thể nhận được những đánh giá cụ thể dựa trên ba tiêu chí: tính trôi chảy, ngữ nghĩa và đa dạng từ vựng. Kết quả đánh giá đạt 4,2 - 4,7 trên thang điểm 5.

Nghiên cứu của 2 sinh viên trường ĐH Bách khoa (ĐHQG TP. HCM) được công bố tại Hội nghị về AI hàng đầu thế giới ảnh 2
Minh Khôi và Khánh Trình chụp hình cùng PGS. TS Quản Thành Thơ - Phó Trưởng khoa Khoa học và Kỹ thuật Máy tính, trường ĐH Bách khoa, ĐHQG TP. HCM trong Lễ tốt nghiệp. (Ảnh: NVCC)

Chia sẻ về cảm xúc của mình khi nghiên cứu được công bố tại hội nghị AAAI, Trình và Khôi không khỏi bất ngờ và xúc động khi đạt được thành tựu to lớn này. Về những ấp ủ trong tương lai với nghiên cứu, hai nam sinh Bách khoa cho biết, nhóm tiến hành tổng hợp thêm một số ngôn ngữ khác, hướng tới bộ dữ liệu khổng lồ là Wikipedia nhưng đây là một dự án mở, tất cả mọi người đều có thể đóng góp nội dung, chất lượng nội dung là điều đáng lo ngại. Nguồn thứ hai mà nhóm quan tâm, đó là các bài báo, bởi hầu hết các quốc gia đều có tòa soạn báo và chất lượng kiểm duyệt của các tòa soạn báo sẽ tốt hơn. Khôi cho biết: “Sau khi nghiên cứu được ra mắt, nhiều công trình nghiên cứu khác ra đời bổ sung nhiều thứ tiếng thuộc khu vực miền nam châu Mỹ, nhóm nhận thấy những thứ tiếng này có mức độ ảnh hưởng nhất định nên trong tương lai có thể sẽ thêm vào để có thể mở rộng tập ngôn ngữ”.

Hiện tại, Khánh Trình và minh Khôi hiện đang làm việc tại các công ty lớn và công việc hằng ngày là nghiên cứu trí tuệ nhân tạo và xử lý ngôn ngữ tự nhiên. Được biết, cả hai đều dự định sẽ học lên cao, tiếp tục con đường nghiên cứu về trí tuệ nhân tạo để có thể mang lại những công trình nghiên cứu chất lượng.

MỚI - NÓNG
Thi tốt nghiệp THPT 2025: Lần đầu theo chương trình mới, tăng cường đánh giá năng lực và giảm áp lực cho thí sinh
Thi tốt nghiệp THPT 2025: Lần đầu theo chương trình mới, tăng cường đánh giá năng lực và giảm áp lực cho thí sinh
SVVN - Kỳ thi tốt nghiệp THPT 2025 sẽ là lần đầu tiên áp dụng theo Chương trình giáo dục phổ thông 2018, với mục tiêu đánh giá toàn diện năng lực học sinh, đồng thời giảm áp lực và chi phí cho thí sinh và xã hội. Bộ GD - ĐT đang chuẩn bị kỹ lưỡng các điều kiện để tổ chức kỳ thi nghiêm túc, an toàn và hiệu quả.
Tỏa sáng Nghị lực Việt 2024: Tuyên dương 38 gương thanh niên khuyết tật tiêu biểu
Tỏa sáng Nghị lực Việt 2024: Tuyên dương 38 gương thanh niên khuyết tật tiêu biểu
SVVN - Tối ngày 7/10, tại Hà Nội, T.Ư Hội LHTN Việt Nam phối hợp cùng Ủy ban Quốc gia về người khuyết tật Việt Nam và TCP Việt Nam tổ chức chương trình “Tỏa sáng Nghị lực Việt”, năm 2024. Chương trình tuyên dương 38 gương thanh niên khuyết tật tiêu biểu, những người đã vượt qua nghịch cảnh, nỗ lực vươn lên trong cuộc sống và đóng góp tích cực cho cộng đồng. 
ĐHQG TP. HCM tiên phong trong việc giảm bớt phương thức thức tuyển sinh vào năm 2025
ĐHQG TP. HCM tiên phong trong việc giảm bớt phương thức thức tuyển sinh vào năm 2025
SVVN - PGS. TS Vũ Hải Quân - Giám đốc ĐHQG TP. HCM cho biết, năm 2025, ĐHQG TP. HCM thống nhất chủ trương thực hiện 3 phương thức tuyển sinh đại học gồm: (1) Xét tuyển thẳng; (2) Xét tuyển dựa trên kết quả Kỳ thi Đánh giá năng lực do ĐHQG TP. HCM tổ chức; (3) Xét tuyển dựa trên kết quả thi tốt nghiệp THPT. Đồng thời, ĐHQG TP. HCM khuyến khích các đơn vị xây dựng phương thức xét tuyển kết hợp.

Có thể bạn quan tâm

Nữ sinh giàu nghị lực vượt lên chính mình, tỏa sáng với ước mơ học ngành Tâm lý học Giáo dục

Nữ sinh giàu nghị lực vượt lên chính mình, tỏa sáng với ước mơ học ngành Tâm lý học Giáo dục

SVVN - Lê Thảo Nguyên, cô gái khuyết tật đầy nghị lực, đã vượt qua mọi khó khăn để theo đuổi ước mơ học ngành Tâm lý học Giáo dục tại trường ĐH Quy Nhơn. Với sự kiên cường và sự hỗ trợ từ gia đình, Nguyên trở thành tấm gương người khuyết tật tiêu biểu, được vinh danh trong chương trình ‘Tỏa sáng nghị lực Việt’, năm 2024.
Nữ cán bộ Đoàn xuất sắc chinh phục danh hiệu Thủ khoa: Hành trình từ giảng đường đến cống hiến xã hội

Nữ cán bộ Đoàn xuất sắc chinh phục danh hiệu Thủ khoa: Hành trình từ giảng đường đến cống hiến xã hội

SVVN - Vũ Thu Hằng – Thủ khoa tốt nghiệp trường ĐH Ngoại ngữ (ĐHQG Hà Nội) không chỉ gây ấn tượng với thành tích học tập xuất sắc mà còn là một cán bộ Đoàn đầy nhiệt huyết. Với vai trò Ủy viên Ban Thường vụ Đoàn Trường, Hằng đã tích cực tham gia và lãnh đạo nhiều hoạt động Đoàn – Hội, đồng thời đại diện sinh viên Việt Nam tham gia các chương trình giao lưu quốc tế. Hành trình của Hằng là minh chứng cho sự kết hợp hoàn hảo giữa kiến thức vững chắc và tinh thần cống hiến cho cộng đồng.
Thủ khoa Hồng Nga: Từ ước mơ đến hiện thực - Một hành trình cảm hứng

Thủ khoa Hồng Nga: Từ ước mơ đến hiện thực - Một hành trình cảm hứng

SVVN - Hoàng Thị Hồng Nga - Thủ khoa kép đầu vào và đầu ra ngành Công nghệ Nông nghiệp, trường ĐH Công nghệ (ĐHQG Hà Nội) có điểm học tập xuất sắc 3,78/4,0. Trong quá trình học tập 4,5 năm tại trường, nữ sinh đã nhận nhiều học bổng danh giá, đồng thời có 6 bài báo được công bố trên các tạp chí khoa học và hội nghị quốc tế.
Chinh phục địa hình: Giải đua ôtô – môtô Tuyên Quang 2024 đầy kịch tính

Chinh phục địa hình: Giải đua ôtô – môtô Tuyên Quang 2024 đầy kịch tính

SVVN - Giải trình diễn lái xe và đua ô tô - mô tô địa hình mở rộng lần thứ III, năm 2024 diễn ra ngày 28/9 tại tỉnh Tuyên Quang, quy tụ gần 60 đội đua từ khắp cả nước và một số nước trên thế giới. Với mục tiêu là nâng cao ý thức lái xe an toàn và khuyến khích các tay đua tham gia hoạt động xã hội, từ thiện ở những vùng khó khăn. Các vận động viên sẽ thi đấu trên các cung đường dài 2,5 km và 3,5 km, mang đến những màn trình diễn kỹ thuật mạo hiểm đầy ấn tượng.
Hành trình theo đuổi âm nhạc cổ điển của chàng nghệ sĩ Piano 9X tài năng

Hành trình theo đuổi âm nhạc cổ điển của chàng nghệ sĩ Piano 9X tài năng

SVVN - Nhật Anh tốt nghiệp Học viện Âm nhạc Hannover tại Đức và là một nghệ sĩ tài năng với nhiều thành tích nổi bật tại các cuộc thi Piano. Mang tình yêu lớn dành cho âm nhạc cổ điển, thông qua các buổi hòa nhạc cộng đồng, Nhật Anh mong muốn đưa loại hình nghệ thuật âm nhạc hàn lâm này đến gần hơn với giới trẻ và khán giả Việt.
Giới trẻ Malaysia 'phát cuồng' vì gỏi cuốn Việt Nam: Hơn 1.000 cuốn được bán trong tích tắc!

Giới trẻ Malaysia 'phát cuồng' vì gỏi cuốn Việt Nam: Hơn 1.000 cuốn được bán trong tích tắc!

SVVN - Gần đây, gỏi cuốn Việt Nam đã bất ngờ trở thành "hot trend" tại Malaysia, thu hút sự quan tâm giới trẻ nước này. Sự kết hợp hài hòa giữa các nguyên liệu tươi ngon cùng phong cách chế biến độc đáo biến món ăn trở thành lựa chọn yêu thích trong thực đơn hàng ngày của nhiều bạn trẻ tại xứ sở tháp đôi.