Nhiều công nghệ ứng dụng xử lý ngôn ngữ tiếng nói Việt

Các công nghệ tiên tiến, giải pháp ứng dụng AI được nhiều nhóm nghiên cứu ứng dụng để giải quyết và xử lý lời nói có xúc cảm hơn hoàn toàn có thể ứng dụng vấn đáp tự động hóa, thuyết minh phim, đọc truyện .Sáng 26/11 Câu lạc bộ Xử lý ngôn từ và lời nói tiếng Việt ( VLSP ) và Hội Tin học Nước Ta đã tổ chức triển khai hội thảo chiến lược, tổng kết cuộc thi và trao giải cho những đội xuất sắc trong VLSP 2022 .tiến sỹ Nguyễn Thị Minh Huyền, Trường ĐH Khoa học Tự nhiên, ĐHQG TP.HN, quản trị Câu lạc bộ VLSP, cho biết, VLSP 2022 đã tổ chức triển khai 7 cuộc thi về giải quyết và xử lý lời nói và văn bản. Trong đó gồm tổng hợp, nhận dạng lời nói, xác lập người nói, nghiên cứu và phân tích cú pháp thành phần, tóm tắt đa văn bản, dịch máy Trung – Việt, hỏi đáp đa ngữ về nội dung ảnh .

Theo đó đội Speech World (VinBig Data) giành giải nhất với chiến thắng với mô hình dữ liệu chuyển đổi văn bản của cuộc thi tổng hợp tiếng nói có cảm xúc. Tổng hợp tiếng nói có cảm xúc (Emotional Speech Synthesis ESS) là hướng nghiên cứu cho phép tái tạo lại giọng nói của con người theo biểu cảm cảm xúc nhất định. Hướng nghiên cứu mở ra những ứng dụng có yêu cầu cao như thuyết minh/lồng tiếng phím, trợ lý ảo, kể chuyện. Các đội thi chinh phục 4 sắc thái cảm xúc phổ biến bao gồm trung lập (neutral), buồn (sad), vui (happy) và cáu giận (angry). Các nhóm nghiên cứu và phát triển hệ thống tổng hợp tiếng nói với các nhãn cảm xúc đầu vào, để đưa ra giọng nói đầu ra tương ứng với nhãn cảm xúc đó.

Bạn đang đọc: Nhiều công nghệ ứng dụng xử lý ngôn ngữ tiếng nói Việt

Nguyễn Văn Thịnh cùng các thành viên dự án Speech World nhận giải Nhất cuộc thi Tổng hợp tiếng nói có cảm xúc. Ảnh: Hoài Hương
Tác giả Nguyễn Văn Thịnh ( thứ hai, trái sang ) cùng những thành viên dự án Bất Động Sản Speech World nhận giải Nhất cuộc thi Tổng hợp lời nói có cảm hứng. Ảnh : Hoài Hương
Nguyễn Văn Thịnh, VinBig Data, đội trưởng Speech World cho hay nhóm điều tra và nghiên cứu đưa ra quy mô sử dụng AI quy đổi văn bản thành lời nói có cảm hứng, ứng dụng trong tăng trưởng trợ lý ảo, giúp đọc truyện, thuyết minh phim. Bắt đầu tăng trưởng từ 2021, nhóm nâng cấp cải tiến và tăng trưởng quy mô riêng tương thích với giọng nói và ngôn từ của tiếng Việt. ” Hiện công nghệ tiên tiến đã được triển khai xong và mở màn chuyển giao đưa vào mẫu sản phẩm phẩm ứng dụng thực tiễn “, Thịnh nói. Dự kiến tháng tới sẽ ra đời người mua, đối tác chiến lược trong việc kiến thiết xây dựng tăng trưởng trợ lý ảo, tổng đài vấn đáp tự động hóa có xúc cảm hơn .

Ở cuộc thi Xác minh người nói trong môi trường đa ngôn ngữ (Multi-lingual Speaker Verification – AMSV), giải pháp Voice Biometrics (giải pháp sinh trắc giọng nói) giành giải Nhất. Anh Vũ Gia Luyện, CEO công nghệ trẻ của Inter ITS, cho biết nhóm phát triển công nghệ dựa trên nhận dạng mẫu giọng nói để xác minh danh tính các cá nhân. Giọng nói có thể xác minh danh tính mỗi người vì đường âm (chất giọng) mỗi người là duy nhất. Dựa theo các đặc điểm vật lý, cả ngữ âm và hình thái giúp có thể chống được gian lận. Do đó công nghệ nhận dạng giọng nói cho phép mức độ bảo mật cao hơn hệ thống nhận dạng khác.

Hệ thống sinh trắc học giọng nói hoạt động giải trí bằng cách tạo ra bản in giọng nói hoặc mẫu lời nói của một người. Mẫu ĐK hoàn toàn có thể thu âm trực tiếp hoặc từ file ghi âm sẵn, sau đó mạng lưới hệ thống trích những đặc trưng giọng nói của người dùng và lưu mạng lưới hệ thống. Khi cần xác định người dùng sẽ nói một câu và mạng lưới hệ thống sẽ xác định được với mẫu ĐK trong mạng lưới hệ thống để xác nhận .Nói với VnExpress, anh Luyện cho hay từ năm 2018 những nhóm điều tra và nghiên cứu công nghệ tiên tiến của họ đã tăng trưởng một hệ sinh thái sử dụng voice AI, trong đó ứng dụng trí tuệ tự tạo trong những mẫu sản phẩm như Voice Biometrics, speech to text, text to speech ( dùng trong báo nói, bóc băng hội thảo chiến lược cuộc họp ) hay ứng dụng call bot ( tổng đài tư vấn viên ảo ), giao dịch thanh toán bằng giọng nói … Các giải pháp tương quan giải quyết và xử lý lời nói hoàn toàn có thể ứng dụng trong nhiều ngành nghề như ngân hàng nhà nước, hành chính công, kinh tế tài chính thương mại điện tử .
Anh Vũ Gia Luyện, công ty Inter ITS, cùng thành viên nhóm nhận giải Nhất. Ảnh: Hoài Hương

Anh Vũ Gia Luyện, công ty Inter ITS, cùng thành viên nhóm nhận giải Nhất. Ảnh: Hoài Hương

Nhiều giải pháp, công nghệ tiên tiến cũng được san sẻ trong cuộc thi về giải quyết và xử lý văn bản như nghiên cứu và phân tích cú pháp thành phần, tóm tắt đa văn bản, dịch máy Trung – Việt. Đặc biệt hỏi đáp đa ngôn ngữ về nội dung ảnh ( Multilingual Visual Question Answering ) là bài toán nghiên cứu và điều tra đa nghành : Xử lý ngôn từ tự nhiên và giải quyết và xử lý ảnh lần tiên phong được ra mắt tại VLSP 2022 .Tại sự kiện những nhà nghiên cứu và chuyên viên trong nghành điều tra và nghiên cứu về giải quyết và xử lý lời nói và ngôn từ tiếng Việt cũng san sẻ và bàn luận những hiệu quả nghiên cứu và điều tra mới cũng như những giải pháp công nghệ tiên tiến ứng dụng trong nghành nghề dịch vụ. Sự kiện do Viện Nghiên cứu Cao cấp về Toán phối hợp cùng Trường Đại học Khoa học Tự nhiên và Trường Đại học Công nghệ – ĐHQG TP. Hà Nội cùng 1 số ít đơn vị chức năng tổ chức triển khai .

Như Quỳnh

Source: https://vvc.vn
Category : Giải trí

BẠN CÓ THỂ QUAN TÂM

Alternate Text Gọi ngay