Nhóm sinh viên dùng AI chuyển đổi thủ ngữ sang giọng nói và văn bản

0:00 / 0:00
0:00
Nhóm sinh viên dùng AI chuyển đổi thủ ngữ sang giọng nói và văn bản
SVVN - 6 sinh viên trường ĐH Bách khoa (ĐHQG TP. HCM) đã nghiên cứu chế tạo một thiết bị dùng AI để chuyển ngôn ngữ ký hiệu (thủ ngữ) sang giọng nói và văn bản, giúp người khiếm thanh và khiếm thính có thể giao tiếp dễ dàng với cộng đồng.

Nhóm gồm Nguyễn Quang Đức, Lê Đỗ Thanh Bình, Phan Quốc Long, Nguyễn Thành Lưu, Bùi Ngô Hoàng Long (cùng khóa 2018, khoa Khoa học và Kỹ thuật Máy tính) và Cao Khánh Gia Hy (khóa 2020, khoa Quản lý Công nghiệp).

Theo trưởng nhóm Nguyễn Quang Đức, nước ta hiện có khoảng 1 đến 2,5 triệu người khiếm thanh và người khiếm thính, tương đương dân số một tỉnh. Tuy nhiên có rất ít phiên dịch viên ngôn ngữ ký hiệu. Riêng tại Hà Nội hiện chỉ có 6 người đạt đến trình độ có thể dịch các lĩnh vực cho người điếc, trong cả nước có khoảng 10 người. Hiện nay, những người khiếm thanh, khiếm thính hiện vẫn đang sử dụng thủ ngữ (ngôn ngữ ký hiệu Việt Nam) để giao tiếp trong cuộc sống. Cách này có nhiều điểm hạn chế như: người tương tác buộc phải biết thủ ngữ, thời gian tương tác lâu, dễ nhầm lẫn. Đặc biệt, nhu cầu lớn nhưng nước ta rất ít các trung tâm dạy thủ ngữ.

Nhóm sinh viên dùng AI chuyển đổi thủ ngữ sang giọng nói và văn bản ảnh 1

Nhóm nghiên cứu và các giảng viên tư vấn gồm TS Quản Thành Thơ và TS Võ Thanh Hằng.

Đức cho biết, dự án “Thiết bị giao tiếp thông minh dành cho người khiếm thanh, khiếm thính – Speak your mind” (SYM) là thiết bị giao tiếp sử dụng công nghệ AI để chuyển ngôn ngữ ký hiệu sang văn bản và giọng nói phát ra từ các thiết bị điện thoại thông minh để những người khiếm thanh, khiếm thính dễ dàng trao đổi thông tin với mọi người.

Sản phẩm là một thiết bị tích hợp phần mềm thông minh nhằm hỗ trợ người khiếm thanh có thể tương tác với mọi người một cách dễ dàng và thuận tiện hơn bằng cách chuyển đổi thủ ngữ thành văn bản và giọng nói. Thiết bị bao gồm bao gồm hai thành phần: mô-đun camera được gắn trên nón và ứng dụng trên điện thoại Android.

Theo Hoàng Long, chuỗi hình ảnh thủ ngữ của người dùng được ghi nhận từ camera sẽ đi qua bộ nhận diện các điểm chốt của bàn tay MediaPipe của Facebook và được trích xuất thành các đặc trưng. Mô hình AI được huấn luyện trước bằng mạng học sâu sẽ dự đoán từ tương ứng. Kết quả này sẽ xuất ra dưới dạng văn bản và giọng nói thông qua Text2Speech API của Google.

Nhóm sinh viên dùng AI chuyển đổi thủ ngữ sang giọng nói và văn bản ảnh 2

Mô phỏng hoạt động của thiết bị qua chiếc nón.

Camera nhỏ gọn và các linh kiện điện tử được lắp đặt trong hộp nhựa gắn vào nón của người dùng. Vật liệu sử dụng cho hộp chứa linh kiện điện tử là nhựa sinh học (Polylactic Acid – PLA) không độc hại, không gây ảnh hưởng đến sức khỏe người tiêu dùng và có khả năng dễ phân hủy, thân thiện với môi trường

Khi người dùng nhấn nút khởi động của thiết bị, camera này sẽ ghi nhận và chuyển dòng hình ảnh vào ứng dụng của chúng tôi đã cài đặt sẵn trên điện thoại thông minh của người dùng. Ứng dụng sẽ sử dụng các công nghệ ở trên để chuyển dòng hình ảnh thủ ngữ thành văn bản và giọng nói tương ứng hiện lên màn hình và phát ra loa. Bằng cách này, người đối diện có thể hiểu được điều mà người khiếm thanh, khiếm thính cần truyền đạt mà không cần phải học qua thủ ngữ. Ngoài ra, ứng dụng còn có chức năng lưu lại thủ ngữ cùng với văn bản và phát âm tương ứng. Chức năng này giúp cho những người muốn học thủ ngữ có thể lưu trữ bài học một cách dễ dàng. Nói cách khác, hệ thống của chúng tôi vừa là thiết bị dịch thủ ngữ sang văn bản và lời nói, vừa là ứng dụng hỗ trợ học thủ ngữ hiệu quả.

Đối tượng khách hàng mục tiêu trước mắt của sản phẩm hướng đến trong 3 năm tới là cá nhân những người khiếm thanh, khiếm thính và phụ huynh của những người bị khiếm thanh, khiếm thính tại Việt Nam.

Theo đánh giá của nhóm tư vấn gồm TS Võ Thanh Hằng (Khoa Môi trường và tài nguyện) và TS Quản Thành Thơ (Phó Khoa Khoa học và kỹ thuật máy tính), tính độc đáo và sáng tạo của SYM còn là toàn bộ sản phẩm được mã hóa bằng tiếng Việt, dễ dàng sử dụng đối với khách hàng. Bên cạnh đó, thiết bị cũng tích hợp các ngôn ngữ khác nhau đáp ứng các đối tượng khách hàng.

Quang Đức cho biết, giá thành sản phẩm thấp cũng là một ưu thế của dự án: “Nhóm người điếc/khiếm thính có thu nhập bình quân cao nhất ở mức 3 triệu đồng một tháng, so với mức thu nhập chung trên cả nước 5,4 triệu đồng một tháng.”

Nhóm sinh viên dùng AI chuyển đổi thủ ngữ sang giọng nói và văn bản ảnh 3

Tổng quan giao diện của ứng dụng trên thiết bị Android.

Dựa vào chi phí cố định 1 sản phẩm (dao động khoảng 405.600 VND) và chi phí biến động, phân khúc thị trường cùng những dòng sản phẩm cạnh tranh cùng phân khúc, SYM định giá sản phẩm phân phối đến tay người dùng chỉ từ 800.000 – 1 triệu đồng. Một nghiên cứu tiến hành tại Hà Nội, Thái Nguyên, Nghệ An, TP.HCM và Đà Nẵng 2017 với 574 người khuyết tật chỉ ra rằng những người khuyết tật nói chung, người khiếm thanh, khiếm thính nói riêng rất khó khăn để tiếp cận các dịch vụ y tế, giáo dục, tỷ lệ thất nghiệp cao, cảm nhận bị kỳ thị ảnh hưởng đến đời sống vật chất, tinh thần.

Dự án của nhóm đang tham gia cuộc thi “Sinh viên với quyền sở hữu trí tuệ S&IP” năm 2021 với chủ đề “Từ ý tưởng đến cơ hội kinh doanh” do Trung tâm Sở hữu trí tuệ và Chuyển giao Công nghệ (IPTC) ĐHQG TP.HCM phối hợp cùng Khu Công nghệ phần mềm (Khu CNPM) ĐHQG TP. HCM và Trung tâm Nghiên cứu Đào tạo và Hỗ trợ tư vấn, Cục Sở hữu trí tuệ, Bộ KH - CN tổ chức

MỚI - NÓNG

Có thể bạn quan tâm

Kỳ công phục dựng lồng đèn truyền thống trăm tuổi

Kỳ công phục dựng lồng đèn truyền thống trăm tuổi

SVVN - Trong khi nhiều người trẻ chọn con đường đi tìm cái mới, cái hiện đại để nâng cao đời sống tinh thần của người dân, thì vẫn có những người trẻ chọn hướng quay về với những giá trị xưa cũ của dân tộc: Chị Nguyễn Thị Kim Thủy và anh Nguyễn Hoàng Sơn (cựu sinh viên trường ĐH Kiến trúc TP. HCM), đồng sáng lập cửa hàng quà tặng văn hóa Khởi Đăng Tác Khí (KĐTK).
Chàng trai Hải Phòng kiên trì làm nội dung giáo dục trên TikTok: Không có đường tắt trong dạy và học

Chàng trai Hải Phòng kiên trì làm nội dung giáo dục trên TikTok: Không có đường tắt trong dạy và học

SVVN - Tốt nghiệp trường Đại học Ngoại ngữ - ĐHQG Hà Nội, Đặng Quốc Dũng (sinh năm 2000) hiện đang học Thạc sĩ ngành Giảng dạy Ngôn ngữ Anh tại trường Southern New Hampshire. Chàng trai gốc Hải Phòng còn được cộng đồng giáo viên, học sinh biết đến qua kênh TikTok “Dũng Đi Dạy” với những nội dung mang tính giáo dục cao liên quan đến việc dạy và học tiếng Anh.
Hành trình biến ‘giấc mơ nghệ thuật’ trở thành hiện thực của chàng trai từng nặng 100kg

Hành trình biến ‘giấc mơ nghệ thuật’ trở thành hiện thực của chàng trai từng nặng 100kg

SVVN - Từng là nạn nhân của body shaming, bị bạn bè “chê bai, dè bỉu”, chàng trai Nolan với thân hình quá khổ, mang trong mình ước mơ nghệ thuật đã quyết tâm thay đổi, “lột xác” để theo đuổi ước mơ. Bên cạnh đó là những khó khăn vô cùng khác, nhưng cũng không thể “dập tắt” niềm đam mê nghệ thuật của bản thân Nolan.
Áp lực tạo nên kim cương - Hành trình trở mình từ ‘viên ngọc thô’ của nam MC gốc Huế

Áp lực tạo nên kim cương - Hành trình trở mình từ ‘viên ngọc thô’ của nam MC gốc Huế

SVVN - Nguyễn Minh Hiếu - cựu sinh viên điển trai trường ĐH Công nghiệp Hà Nội - là gương mặt MC sự kiện quen thuộc trong cộng đồng MC Hà thành. Ít ai biết rằng, để đạt được những thành công như ngày hôm nay, Minh Hiếu đã phải đối mặt với muôn vàn áp lực, từ đó nỗ lực thay đổi và ghi dấu ấn trong lòng khán giả, trở thành MC/BTV của VTC News.
Những 'bóng hồng' tình nguyện viên

Những 'bóng hồng' tình nguyện viên

SVVN - 200 liên lạc viên, tình nguyện viên phục vụ Hội nghị Nghị sĩ trẻ toàn cầu lần thứ 9 được tổ chức tại Hà Nội, từ ngày 14 - 17/9. Các tình nguyện viên như là một 'đại sứ văn hoá' để giới thiệu về đất nước, con người Việt Nam và những thành tựu phát triển mà Việt Nam đạt được.