Voicemod, một hãng trí tuệ nhân tạo có trụ sở tại Valencia, Tây Ban Nha, vừa giới thiệu một công nghệ đột phá cho phép người dùng thay đổi giọng nói của mình theo thời gian thực khi chơi game.

Theo báo cáo của CNBC, công ty gần đây đã ra mắt bộ sưu tập “AI của con người”, bao gồm 20 nhân vật giống con người với nhiều giọng nói khác nhau, từ một phụ nữ trẻ đến một ông già.

Những giọng nói này đã được đào tạo trên các bản ghi âm từ các diễn viên lồng tiếng chuyên nghiệp, đảm bảo trải nghiệm chân thực và sống động.

Thay đổi giọng nói trong trò chơi

Công nghệ do Voicemod phát triển cho phép người chơi tải xuống ứng dụng trên Apple Mac hoặc PC Windows của họ và sử dụng ứng dụng đó làm “micrô ảo” trong trò chơi điện tử.

Bằng cách kết hợp công nghệ Voicemod, người dùng có thể chuyển đổi liền mạch giữa các nhân vật khác nhau, nói bằng các giọng nói thay thế trong khi giao tiếp với những người chơi khác trên các nền tảng như Discord.

Với cơ sở người dùng hơn 40 triệu người, công nghệ Voicemod đã trở nên phổ biến đáng kể trong giới game thủ và những người đam mê ứng dụng xã hội.

Ứng dụng cung cấp một lối thoát sáng tạo để người dùng vui chơi, tận hưởng và cảm thấy thân thuộc.

Đọc thêm: Cisco giới thiệu chip kết nối mạng siêu máy tính AI thay đổi cuộc chơi, được thử nghiệm bởi các nhà cung cấp đám mây hàng đầu

Tận dụng AI cho công nghệ điều chỉnh giọng nói theo thời gian thực

Mặc dù nhiều thuật toán AI có thể tạo phản hồi dựa trên văn bản, nhưng việc đảm bảo chuyển đổi giọng nói theo thời gian thực đòi hỏi năng lực tính toán và chuyên môn đáng kể.

Nhóm Voicemod, bao gồm các tài năng từ các trường đại học kỹ thuật hàng đầu ở Valencia và Barcelona, ​​​​đã được dành riêng để nâng cao tính năng tổng hợp giọng nói và âm thanh tương tác kể từ năm 2014.

Voicemod đã nhận được 23 triệu đô la tài trợ từ các nhà đầu tư mạo hiểm hàng đầu, bao gồm cả Leadwind và Bitkraft Ventures, để hỗ trợ dự án đầy tham vọng của họ.

Hỗ trợ tài chính này đã cho phép công ty đầu tư vào cơ sở hạ tầng điện toán tiên tiến và phát triển các mô hình thuật toán độc quyền.

Đối phó với sự lo lắng

Công ty không nhận thức được những rủi ro liên quan đến công nghệ thay đổi giọng nói. Việc sử dụng sai công nghệ như vậy, chẳng hạn như mạo danh các nhân vật chính trị và lừa đảo hoặc lừa dối mọi người, là một vấn đề đáng lo ngại.

Nhận thấy nhu cầu sử dụng có trách nhiệm và tuân theo quy định, Voicemod đang tích cực nghiên cứu các giải pháp để giải quyết những rủi ro này.

Họ sắp hoàn thiện hệ thống “watermarking” để xác định giọng nói được tạo bằng hệ thống sửa đổi.

Ngoài ra, công ty còn tham gia thảo luận với các công ty khác để thiết lập các tiêu chuẩn cho công nghệ thay đổi giọng nói và đảm bảo việc sử dụng an toàn và có đạo đức.

Phát biểu với CNBC, Giám đốc điều hành Voicemod Jaime Bosch nhấn mạnh tầm quan trọng của đổi mới có trách nhiệm và mong rằng luật sẽ được thực thi để kiểm soát việc sử dụng công nghệ này.

Ông thừa nhận rằng các công ty thường tiến hành nhanh hơn các quy định và đặt mục tiêu dẫn đầu bằng cách thúc đẩy các hoạt động có trách nhiệm trong công ty của mình.

Nhu cầu về công nghệ tạo giọng nói AI

Voicemod chủ yếu tập trung vào ngành công nghiệp giải trí, phục vụ cho các game thủ, người phát trực tiếp, người tạo nội dung và người dùng YouTube ảo.

Tuy nhiên, công ty khởi nghiệp có kế hoạch mở rộng phạm vi hoạt động sang các lĩnh vực khác, củng cố quan hệ đối tác với các công ty trò chơi và nền tảng tai nghe VR, thậm chí tung ra phiên bản di động của phần mềm.

Phần mềm Voicemod được cung cấp miễn phí, cho phép người dùng truy cập nhiều tùy chọn giọng nói. Công ty cũng cung cấp phiên bản PRO trả phí để mở khóa các tính năng và nội dung bổ sung, mang đến cho người dùng nhiều khả năng tùy chỉnh hơn.

Vẫn được đăng ở đây tại Tech Times.

Những bài viết liên quan: AI Powered Opera One chính thức ra mắt cho người dùng Windows, macOS, Linux