Nghiên cứu để người khiếm thị nhận biết xung quanh bằng hỏi đáp

01/01/2022 | 20:39

0:00 / 0:00

0:00

SVVN - Bằng hỏi đáp dựa trên hình ảnh (VQA), qua ứng dụng thị giác máy tính và xử lý ngôn ngữ tự nhiên, nhóm sinh viên trường ĐH CNTT (ĐHQG TP. HCM) đã nghiên cứu giải pháp giúp những người khiếm thị có thể nhận biết được những thông tin xung quanh mình qua việc đặt các câu hỏi và nhận về đáp án cụ thể từ hệ thống.

“ViVQA: A modern Vietnamese Visual Question Answering for SOTA solutions” là công trình khoa học do nhóm sinh viên: Trần Quốc Khánh, Nguyễn Trọng Ân, Dương Văn Bình và Lê Trần Hoài Ân, ngành Khoa học Dữ liệu, khoa Khoa học & Kỹ thuật thông tin, trường ĐH CNTT (ĐHQG TP. HCM) thực hiện. Bài báo của nhóm đã được đăng tại Hội nghị quốc tế về Xử lý ngôn ngữ tự nhiên PACLIC.

Theo nhóm, hỏi đáp dựa trên hình ảnh (Visual Questions Answering) là một lĩnh vực khá mới mẻ, là một trong những lĩnh vực nghiên cứu tiềm năng với sự kết hợp của xử lý ngôn ngữ tự nhiên và thị giác máy tính. Việc đưa ra một hình ảnh cùng với câu hỏi về nó, một hệ thống hỏi đáp có thể trích xuất được các thông tin cơ bản về ảnh và trả lời các câu hỏi liên quan, công việc đơn giản đối với con người nhưng lại là thách thức lớn đối với máy tính.

Nghiên cứu để người khiếm thị nhận biết xung quanh bằng hỏi đáp ảnh 1

Nhóm nghiên cứu nhận giải thưởng tại Liên hoan Tuổi trẻ sáng tạo TP. HCM năm 2021.

Nguyễn Trọng Ân cho biết: “Các công trình nghiên cứu hiện nay đã có trên tiếng Anh, tiếng Nhật và một vài ngôn ngữ khác, nhưng trên tiếng Việt vẫn chưa có vì hạn chế về dữ liệu. Chính vì lý do đó, nhóm quyết định thực hiện đề tài này với mục tiêu xây dựng một bộ dữ liệu để góp phần phát triển các hệ thống hỏi đáp trên ảnh tự động cho tiếng Việt. Chúng mình là một nhóm bạn thân. Có nhiều ý tưởng và sở thích nghiên cứu giống nhau nên khi nhận được gợi ý từ ThS Nguyễn Văn Kiệt về Visual Questions Answering, cả nhóm bắt tay vào làm luôn. Nhóm cảm thấy đề tài này rất thú vị và có tính ứng dụng cao nên cả nhóm bắt đầu nghiên cứu thực hiện đề tài này cho ngôn ngữ tiếng Việt”.

Dự án này được thực hiện trong vòng 12 tháng, gồm nhiều công đoạn có thể như xác định hướng đi cho đề tài, tìm hiểu các công trình nghiên cứu liên quan, xây dựng bộ dữ liệu, sau đó tiến hành thực nghiệm và huấn luyện các mô hình trên bộ dữ liệu đã được xây dựng, và cuối cùng là quá trình kiểm định, đánh giá và phát triển mô hình.

Bộ dữ liệu được nhóm xây dựng trên miền dữ liệu các hình ảnh từ MS COCO, cùng với đó là việc triển khai mô hình VisualQA sử dụng các phương pháp khác nhau như LSTM, CNN và Hierarchical Co-Attention để đánh giá hiệu suất trên bộ dữ liệu cũng như trình bày về các tinh chỉnh trong các mô hình mà nhằm tìm ra mô hình cho kết quả tốt nhất với bộ dữ liệu này. Một thách thức lớn nhất đối với nhóm là mất nhiều thời gian để hiện thực bộ dữ liệu bởi vì muốn hệ thống hỏi đáp đạt độ chính xác cao.

Bên cạnh đó, tính mới của dự án cũng là một thử thách lớn. Hỏi đáp tự động trên ảnh (VQA) là một lĩnh vực vẫn còn mới ở Việt Nam. Chính vì vậy, tài liệu tham khảo cũng như tài nguyên các bộ dữ liệu về lĩnh vực này chủ yếu trên tiếng Anh. Tìm kiếm và nghiên cứu tài liệu bằng tiếng Việt đã “ngốn” không ít thời gian của nhóm.

Khi phát triển thành công, hệ thống do nhóm thực hiện có thể giúp những người khiếm thị có thể nhận biết được những thông tin xung quanh mình qua việc đặt các câu hỏi và nhận về đáp án cụ thể từ hệ thống. Đây đều là các cuộc thi và giải thưởng nhằm tìm kiếm, tuyên dương các tác giả, sản phẩm có tính ứng dụng cao về khoa học kỹ thuật và tuyển chọn các sản phẩm tiêu biểu tham gia Liên hoan Tuổi trẻ sáng tạo toàn quốc năm 2021.

Ngoài được đăng trên kỷ yếu hội thảo khoa học quốc tế, nghiên cứu của nhóm còn giành giải Ba cuộc thi Makerthon và Huy chương Đồng, Giải thưởng Thiết kế - Chế tạo - Ứng dụng năm 2021.

Khoa Tư

MỚI - NÓNG

Đội Pennypal giành giải Nhất cuộc thi ‘Fintech - Fintech Startup Incubator 2024’ với ứng dụng Pennypu

Giáo dục

SVVN - Ngày 21/12, chương trình ‘Ươm mầm khởi nghiệp trong lĩnh vực Fintech - Fintech Startup Incubator 2024’ chính thức khép lại. Đội PennyPal cùng ứng dụng 'PennyPu' - Trợ lý ảo tài chính dành cho giới trẻ. Chương trình do Học viện Ngân hàng phối hợp cùng BK-Fintech tổ chức, với sự đồng hành của Quỹ hợp tác quốc tế các Ngân hàng tiết kiệm Đức (DSIK).

22/12 tàu điện Metro số 1 bắt đầu vận hành thương mại và miễn phí trong 30 ngày đầu

Sống trẻ

SVVN - Từ 10h sáng 22/12, toàn bộ 14 nhà ga của tuyến Metro số 1 Bến Thành - Suối Tiên sẽ đồng loạt mở cửa và sẵn sàng đón khách.

Ngô Kiến Huy, Trường Giang và Karik nhắn nhủ thông điệp 'Tết về với ba mẹ' đầy cảm xúc

Giải trí

SVVN - Trong không khí vội vã tất bật của những ngày cuối năm, ca khúc 'Tết về đi con' của ba nghệ sĩ Ngô Kiến Huy, Trường Giang, Karik như một phút lắng đọng để những người con dừng lại, nhớ về ba mẹ, gia đình của mình.

ĐH CNTT

Có thể bạn quan tâm

Chàng trai khiếm thính với quyết tâm từ 'tay mơ' trở thành giáo viên tiếng Anh

Sống trẻ

SVVN - Chàng trai Trần Việt Dũng (quê Thái Bình) bị điếc một bên tai nhưng đã chinh phục 4 tấm bằng đại học và đạt thành tích ấn tượng trong các chứng chỉ tiếng Anh. Câu chuyện của Dũng đã tạo cảm hứng cho nhiều bạn trẻ về niềm tin, nghị lực và một trái tim luôn tràn đầy nhiệt huyết với ước mơ, hoài bão.

Tình bạn tan vỡ vì trào lưu giữ 'chuỗi lửa' trên TikTok

Sống trẻ

SVVN - "Chuỗi tình bạn" là cách gọi sáng tạo của người dùng Việt dành cho tính năng streak trên TikTok vừa được ra mắt vào mùa hè vừa qua. Tính năng này ghi nhận số ngày nhắn tin liên tiếp giữa hai tài khoản. Mỗi ngày tương tác sẽ duy trì một “đốm lửa”, và số lượng đốm lửa tăng lên tương ứng với số ngày liên tục.

Sinh viên cần chuẩn bị hành trang gì trước xu hướng sáp nhập, tinh gọn bộ máy

Sống trẻ

SVVN - Sáng 19/12, tại Đại học Kinh tế Quốc dân đã diễn ra Tuần sinh hoạt công dân cuối khóa dành cho sinh viên K63. Xuất hiện tại sự kiện, các diễn giả đã trao đổi và giải đáp nhiều vấn đề của tân sinh viên liên quan đến định hướng nghề nghiệp, kỹ năng mềm và chuẩn bị hành trang cho trước khi bước vào thị trường việc làm.

Chàng trai chinh phục học bổng Chính phủ Úc - Không bao giờ là quá muộn cho ước mơ học tập

Sống trẻ

SVVN - Nguyễn Việt Bách - cựu sinh viên Trường Đại học Ngoại thương, vừa nhận được tin vui khi nhận học bổng toàn phần chính phủ Úc năm 2024. Bên cạnh những thành tích đáng nể trong học tập, Bách còn sở hữu những thành tích nổi bật trong hoạt động ngoại khoá và trong công việc.

Màn trình diễn mãn nhãn của tiêm kích Su-30MK2 và trực thăng Mi trên bầu trời Hà Nội

Sống trẻ

SVVN - Sáng 19/12, Lễ khai mạc ‘Triển lãm Quốc phòng quốc tế Việt Nam 2024’ đã diễn ra tại Hà Nội, với điểm nhấn là màn trình diễn mãn nhãn của các tiêm kích Su-30MK2 và trực thăng Mi. Sự kiện thu hút sự quan tâm lớn từ người dân, đặc biệt là các bạn trẻ yêu thích công nghệ và quốc phòng.

Hàng ngàn người dân háo hức chờ đón màn trình diễn máy bay tại Lễ khai mạc 'Triển lãm Quốc phòng 2024'

Sống trẻ

SVVN - Từ sáng sớm, dòng người đã ùn ùn đổ về khu vực sân bay Gia Lâm, nơi diễn ra Lễ khai mạc 'Triển lãm Quốc phòng 2024'. Ai cũng háo hức, hồi hộp mong chờ những màn trình diễn máy bay ‘cực chất’ mà họ chỉ thấy trên màn ảnh nay được tận mắt chứng kiến.

Không gian check-in Noel chuẩn ‘studio’ đầy ấn tượng ở các trường đại học

Sống trẻ

SVVN - Mùa Giáng sinh mỗi năm, các trường đại học trên địa bàn TP. HCM đều đầu tư trang trí không gian ấn tượng, trở thành điểm check-in đầy cuốn hút cho sinh viên. Không chỉ là nơi để sinh viên chụp ảnh, những góc Noel được thiết kế đầy sáng tạo còn trở thành một phần của văn hóa học đường, khơi dậy tinh thần sẻ chia, đoàn kết và tạo ra nhiều kỷ niệm đẹp.

Hành trình 10 năm khẳng định giá trị bản thân của một 'drag queen' Việt Nam

Sống trẻ

SVVN - Vượt qua những định kiến ban đầu, bằng đam mê nghệ thuật chân chính, Lê Nghĩa (nghệ danh Sunny Lee) đã có được hạnh phúc trong hành trình khẳng định giá trị của 'drag queen' tại Việt Nam (nghệ sĩ biểu diễn có phong cách ăn mặc nữ tính).

Giới trẻ đua nhau cosplay phong cách 'Chill Guy'

Sống trẻ

SVVN - Từ một meme đáng yêu, “Chill Guy” – hay “Anh chàng thư giãn” – đã nhanh chóng vượt ra khỏi thế giới mạng, trở thành nguồn cảm hứng thời trang độc đáo cho giới trẻ trên toàn cầu. Được biết đến qua hình ảnh chú chó nâu với phong cách giản dị, thư thái, meme này không chỉ mang lại tiếng cười mà còn khơi gợi tinh thần sống chậm, thoải mái giữa nhịp sống hối hả.

Nghiên cứu để người khiếm thị nhận biết xung quanh bằng hỏi đáp

Tekmonk Coding Olympiad: Hé lộ chủ nhân những giải thưởng danh giá

Hành trình 8 năm của thủ khoa ‘kép’ ngành Sư phạm Hoá

Những người trẻ đi làm nhưng ‘thất nghiệp’

Vụn Art: Ghép vải vụn - chắp cánh ước mơ cho những người trẻ khiếm khuyết

Trào lưu 'sống ảo' trước sóng lớn biển Nha Trang tiềm ẩn nguy hiểm

Đội Pennypal giành giải Nhất cuộc thi ‘Fintech - Fintech Startup Incubator 2024’ với ứng dụng Pennypu

22/12 tàu điện Metro số 1 bắt đầu vận hành thương mại và miễn phí trong 30 ngày đầu

Ngô Kiến Huy, Trường Giang và Karik nhắn nhủ thông điệp 'Tết về với ba mẹ' đầy cảm xúc

Có thể bạn quan tâm

Chàng trai khiếm thính với quyết tâm từ 'tay mơ' trở thành giáo viên tiếng Anh

Tình bạn tan vỡ vì trào lưu giữ 'chuỗi lửa' trên TikTok

Sinh viên cần chuẩn bị hành trang gì trước xu hướng sáp nhập, tinh gọn bộ máy

Chàng trai chinh phục học bổng Chính phủ Úc - Không bao giờ là quá muộn cho ước mơ học tập

Màn trình diễn mãn nhãn của tiêm kích Su-30MK2 và trực thăng Mi trên bầu trời Hà Nội

Hàng ngàn người dân háo hức chờ đón màn trình diễn máy bay tại Lễ khai mạc 'Triển lãm Quốc phòng 2024'

Không gian check-in Noel chuẩn ‘studio’ đầy ấn tượng ở các trường đại học

Hành trình 10 năm khẳng định giá trị bản thân của một 'drag queen' Việt Nam

Giới trẻ đua nhau cosplay phong cách 'Chill Guy'